基于SVM的机器学习垃圾邮件过滤模块。
spamp的Python项目详细描述
基于支持向量机的垃圾邮件过滤模块。spampy是使用^{tt1}的分类器$ 它试图对给定的原始电子邮件进行分类,如果它们是垃圾邮件或不是垃圾邮件。在
支持向量机(SVM)是一种有监督的学习模型,它具有分析所用数据的相关学习算法 用于分类和回归分析。给出一组训练例子,每一个都标记为属于某一个或另一个 在两个类别中,支持向量机训练算法会建立一个模型,为一个类别或另一个类别指派新的范例,使 它是一个非概率二元线性分类器。在
如今,许多电子邮件服务都提供了垃圾邮件过滤器,能够高准确率地将电子邮件分为垃圾邮件和非垃圾邮件。 spampy是一个学习项目,您可以使用它来过滤垃圾邮件。在
spampy使用两个不同的数据集进行分类。其中一个数据集已导入项目中spampy/datasets/文件夹下。 第二个数据集是enron-spam数据集,在spampy文件夹中,我创建了一个shell脚本 下载并为您提取。在
项目树
- 电子邮件处理器Helper to collect features and labels from datasets.
- 垃圾邮件分类器Classifies given raw emails.
- 数据集下载器Enron dataset downloader which uses dataset_downloader.sh
依赖关系列表
- scikit\u学习
- 神经质的
- numpy公司
- nltk公司
- 单击(对于CLI)
spam_classifier的两个主要功能对给定的原始电子邮件进行分类。在
- classify_email
- classify_email_with_enron
命令行接口
对于可用命令python -m spampy -h
Spam filtering module with Machine Learning using SVM. Usage $ python spampy [<options>] Options --help, -h Display help message --download, -d Download enron dataset --eclassify, -ec Classify given raw email with enron dataset, prompts for raw email --classify, -c Classify given raw email, prompts for raw email --version, -v Display installed version Examples $ python spampy --help $ python spampy --download $ python spampy --eclassify $ python spampy --classify
- 项目
标签: