Python的Bayesian垃圾邮件过滤库

2024-05-13 01:07:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找一个Python库,它可以过滤Bayesian垃圾邮件。我看了看SpamBayes和OpenBayes,但它们似乎都没有被维护(我可能错了)。

有谁能推荐一个好的实现贝叶斯垃圾邮件过滤的Python(或Clojure、Common Lisp,甚至Ruby)库吗?

提前谢谢。

澄清:我实际上在寻找一个贝叶斯垃圾邮件分类器而不一定是垃圾邮件过滤器。我只想用一些数据来训练它,然后告诉我一些给定的数据是否是垃圾邮件。很抱歉有任何困惑。


Tags: 数据过滤器分类器垃圾邮件bayesiancommonrubyclojure
3条回答

试试Reverend。这是一个垃圾邮件过滤模块。

我觉得RedisBayes很不错:

http://pypi.python.org/pypi/redisbayes/0.1.3

以我的经验来看,Redis是对您的堆栈的一个极好的补充,它可以帮助您以惊人的速度处理数据,与MySQL、PostgreSQL或任何其他RDBMS相比。

import redis, redisbayes
rb = redisbayes.RedisBayes(redis=redis.Redis())

rb.train('good', 'sunshine drugs love sex lobster sloth')
rb.train('bad', 'fear death horror government zombie god')

assert rb.classify('sloths are so cute i love them') == 'good'
assert rb.classify('i fear god and love the government') == 'bad'

print rb.score('i fear god and love the government')

rb.untrain('good', 'sunshine drugs love sex lobster sloth')
rb.untrain('bad', 'fear death horror government zombie god')

希望能有帮助。

你想要垃圾邮件过滤还是贝叶斯分类?

对于贝叶斯分类,有许多Python模块。我最近在复习Orange,看起来非常令人印象深刻。R有许多贝叶斯模块。您可以使用Rpy钩住R

相关问题 更多 >