一种用于垃圾邮件和HAM消息分类的二重码方法

bigram-spam-classifier的Python项目详细描述


bigram垃圾邮件分类器
一种用于对垃圾邮件和ham邮件进行分类的bigram方法

使用pip安装
pip安装bigram垃圾邮件分类器

导入到python文件中
从bigram_spam_分类器导入spamClassifier

创建分类器的对象,并将消息作为参数传递
classifier=spamClassifier.classifier(“客户服务公告。你有一个新年礼物等着你。请立即致电07046744435安排发货“

对邮件进行分类

cls=classifier.classify()
打印(CLS)

如果返回1则为垃圾邮件,如果返回0则为ham

在消息中查找unigrams和bigrams
unigrams=classifier.inputunigrams
打印(Unigrams)
bigrams=classifier.inputbigrams
打印(大图)

查找垃圾邮件和ham的bigram概率
垃圾邮件概率=分类器.bigrampspam
打印(垃圾邮件概率)
ham_probability=classifier.bigrampham
打印(ham_probability)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用split函数分割字符串,但没有得到期望的结果   未找到包含derby数据库嵌入架构的sql Java桌面应用程序错误   java elasticsearch vs solr用于定制全文搜索系统   java Android:创建没有startOffset的动画延迟?   java如何查看其他应用程序接收的数据?   java如何在Linux中使用D和classpath选项运行jar文件   java和域设计最佳实践   具有相同内存位置的java数组,将显示为输出   连接到java中的elasticsearch?   Java Playframework重定向到带有Json负载的外部url   java无法在Android平台上使用InputStream为蓝牙socket创建ObjectInputStream   使用POI将Excel日期转换为Java日期,年份未正确显示   oracle从数据库层还是Java层调用webservice?