import redis, redisbayes
rb = redisbayes.RedisBayes(redis=redis.Redis())
rb.train('good', 'sunshine drugs love sex lobster sloth')
rb.train('bad', 'fear death horror government zombie god')
assert rb.classify('sloths are so cute i love them') == 'good'
assert rb.classify('i fear god and love the government') == 'bad'
print rb.score('i fear god and love the government')
rb.untrain('good', 'sunshine drugs love sex lobster sloth')
rb.untrain('bad', 'fear death horror government zombie god')
试试Reverend。这是一个垃圾邮件过滤模块。
我觉得RedisBayes很不错:
http://pypi.python.org/pypi/redisbayes/0.1.3
以我的经验来看,Redis是对您的堆栈的一个极好的补充,它可以帮助您以惊人的速度处理数据,与MySQL、PostgreSQL或任何其他RDBMS相比。
希望能有帮助。
你想要垃圾邮件过滤还是贝叶斯分类?
对于贝叶斯分类,有许多Python模块。我最近在复习Orange,看起来非常令人印象深刻。R有许多贝叶斯模块。您可以使用Rpy钩住R
相关问题 更多 >
编程相关推荐