2024-05-14 22:41:15 发布
网友
我想使用垃圾邮件分类的概念,并将其应用到一个业务问题中,在这个问题中,我们可以确定一个公司的愿景声明是好是坏。这是我为这个项目想出的一个粗略的轮廓。这看起来可行吗
通过收集顶尖公司(即《财富》5000强)的愿景陈述来准备数据集。
Let功能=最常用的单词(不包括非字母数字、to、the等)
我对此表示怀疑。简单贝叶斯过滤对垃圾邮件有效的原因是垃圾邮件通常使用与合法邮件完全不同的词汇表
有趣的是,销售药品的人在合法的商业信函中使用的词语和短语与某些类型的垃圾邮件中使用的词语和短语相同;因此,他们对医药垃圾邮件的过滤结果很差,而垃圾邮件过滤器很快就学会正确地丢弃约会、尼日利亚欺诈、股票欺诈等(不过,医药垃圾邮件可能仍然包含各种夸张的短语等,这使它们与非垃圾邮件营销邮件区分开来)
无论基本计划是否合理,商业上的废话总是一样的。你也许能够过滤掉最糟糕的胡言乱语,但是单词标记级别的分析并不能很好地指示出实际的声音思维是否将这些单词组合成特定的排列
我对此表示怀疑。简单贝叶斯过滤对垃圾邮件有效的原因是垃圾邮件通常使用与合法邮件完全不同的词汇表
有趣的是,销售药品的人在合法的商业信函中使用的词语和短语与某些类型的垃圾邮件中使用的词语和短语相同;因此,他们对医药垃圾邮件的过滤结果很差,而垃圾邮件过滤器很快就学会正确地丢弃约会、尼日利亚欺诈、股票欺诈等(不过,医药垃圾邮件可能仍然包含各种夸张的短语等,这使它们与非垃圾邮件营销邮件区分开来)
无论基本计划是否合理,商业上的废话总是一样的。你也许能够过滤掉最糟糕的胡言乱语,但是单词标记级别的分析并不能很好地指示出实际的声音思维是否将这些单词组合成特定的排列
相关问题 更多 >
编程相关推荐