在不同的应用程序中使用垃圾邮件分类?

2024-05-14 22:41:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我想使用垃圾邮件分类的概念,并将其应用到一个业务问题中,在这个问题中,我们可以确定一个公司的愿景声明是好是坏。这是我为这个项目想出的一个粗略的轮廓。这看起来可行吗

  • 通过收集顶尖公司(即《财富》5000强)的愿景陈述来准备数据集。

  • Let功能=最常用的单词(不包括非字母数字、to、the等)

  • 创建上面列出的所有单词的特征向量(字典)x
  • 使用监督学习算法(logistic回归)对数据进行训练和测试
  • y=good vision语句并返回值1y=0,如果不好

Tags: 数据项目声明概念分类垃圾邮件公司业务
1条回答
网友
1楼 · 发布于 2024-05-14 22:41:15

我对此表示怀疑。简单贝叶斯过滤对垃圾邮件有效的原因是垃圾邮件通常使用与合法邮件完全不同的词汇表

有趣的是,销售药品的人在合法的商业信函中使用的词语和短语与某些类型的垃圾邮件中使用的词语和短语相同;因此,他们对医药垃圾邮件的过滤结果很差,而垃圾邮件过滤器很快就学会正确地丢弃约会、尼日利亚欺诈、股票欺诈等(不过,医药垃圾邮件可能仍然包含各种夸张的短语等,这使它们与非垃圾邮件营销邮件区分开来)

无论基本计划是否合理,商业上的废话总是一样的。你也许能够过滤掉最糟糕的胡言乱语,但是单词标记级别的分析并不能很好地指示出实际的声音思维是否将这些单词组合成特定的排列

相关问题 更多 >

    热门问题