基于SVM的机器学习垃圾邮件过滤模块。

spamp的Python项目详细描述


基于支持向量机的垃圾邮件过滤模块。spampy是使用^{tt1}的分类器$ 它试图对给定的原始电子邮件进行分类,如果它们是垃圾邮件或不是垃圾邮件。在

支持向量机(SVM)是一种有监督的学习模型,它具有分析所用数据的相关学习算法 用于分类和回归分析。给出一组训练例子,每一个都标记为属于某一个或另一个 在两个类别中,支持向量机训练算法会建立一个模型,为一个类别或另一个类别指派新的范例,使 它是一个非概率二元线性分类器。在

如今,许多电子邮件服务都提供了垃圾邮件过滤器,能够高准确率地将电子邮件分为垃圾邮件和非垃圾邮件。 spampy是一个学习项目,您可以使用它来过滤垃圾邮件。在

spampy使用两个不同的数据集进行分类。其中一个数据集已导入项目中spampy/datasets/文件夹下。 第二个数据集是enron-spam数据集,在spampy文件夹中,我创建了一个shell脚本 下载并为您提取。在

项目树

  • 电子邮件处理器Helper to collect features and labels from datasets.
  • 垃圾邮件分类器Classifies given raw emails.
  • 数据集下载器Enron dataset downloader which uses dataset_downloader.sh

依赖关系列表

  • scikit\u学习
  • 神经质的
  • numpy公司
  • nltk公司
  • 单击(对于CLI)

spam_classifier的两个主要功能对给定的原始电子邮件进行分类。在

  • classify_email
  • classify_email_with_enron

命令行接口

对于可用命令python -m spampy -h

Spam filtering module with Machine Learning using SVM.
Usage
  $ python spampy [<options>]
Options
  --help, -h              Display help message
  --download, -d          Download enron dataset
  --eclassify, -ec        Classify given raw email with enron dataset, prompts for raw email
  --classify, -c          Classify given raw email, prompts for raw email
  --version, -v           Display installed version
Examples
  $ python spampy --help
  $ python spampy --download
  $ python spampy --eclassify
  $ python spampy --classify

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
字符串Java字母替换无效   java Spring Roo JPA MS SQL Server无法打开JPA EntityManager组织。冬眠例外GenericJDBCException:无法打开连接   在scala中使用JavaWS对大型数据文件进行java流式处理   Java编译器是否将字节和短字符识别为文本?   java无法查找符号错误,空指针   mongodb在Java中重用数据库连接   java将多个StringArray从字符串文件获取到活动中   java是一个变量,它只保存最后一次鼠标单击的坐标   c#尺寸有限;添加、删除和洗牌   java如何在Android中显示来自资产文件夹的文本文件中的文本   Android应用程序中的java Tensorflow Lite自定义对象检测模型错误   java如何在foreachloop中使用scanner将来自命令行的输入存储到数组中   java如何定义一个好的存储库接口   Android中的java解析动态json对象