我正在研究ML算法,并查看了:Scikit-Learn Working with Text Tutorial
现在我尝试使用我自己的训练数据集,1个feature=message,5个类别的评分从-2(负面)到2(积极)。在
然后我做同样的说明,在教程中,但它总是返回最多4个target_类别,而不是5个!在
target_categories = ['-2', '-1', '0', '1','2']
print(metrics.classification_report(train_data.Category, predicted,target_names=target_categories))
我只得到-2,-1,0,1的predicted_proba
。例如:[0.2 0.2 0.4 0.4]
为什么Scikit只给我一个4x1向量而不是5x1向量?为什么我的target_categories
中的最后一个值被省略了?在
如果我只使用3,我会得到一个错误:
^{pr2}$非常感谢你的帮助!在
是的,它不起作用的原因是,因为我将训练数据分成50%,而{}并没有全部包含在训练数据中。下一次我将重新整理数据。在
相关问题 更多 >
编程相关推荐