NLTK 置信度测量?
在NLTK中,如果我写了一个朴素贝叶斯分类器来分析电影评论(判断评论是积极的还是消极的),我该如何确定分类器在对某个特定评论进行分类时的“确定性”?也就是说,我知道如何在给定的测试集上进行“准确性”测试,以查看分类器的整体准确性。但是有没有办法让NLTK输出它的确定性呢?(也许可以基于最有信息量的特征来判断……)
谢谢
2 个回答
1
nltk.classify.util.log_likelihood
。对于这个问题,你还可以尝试通过精确度、召回率和F-score来衡量结果,这些都是在单个词语层面上进行的评分,也就是分别针对正面和负面的结果进行评分。
1
我不太确定NLTK中朴素贝叶斯的实现情况,但朴素贝叶斯算法会输出每个类别的概率。不过,这些概率的准确性很差。
如果你想要更准确的确定性测量,建议使用其他分类算法。逻辑回归在提供准确的估计方面表现得不错。