scikitlearn“使用文本数据教程”忽略了我的目标类别

2024-04-26 14:56:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究ML算法,并查看了:Scikit-Learn Working with Text Tutorial

现在我尝试使用我自己的训练数据集,1个feature=message,5个类别的评分从-2(负面)到2(积极)。在

然后我做同样的说明,在教程中,但它总是返回最多4个target_类别,而不是5个!在

target_categories = ['-2', '-1', '0', '1','2']

print(metrics.classification_report(train_data.Category, predicted,target_names=target_categories))

我只得到-2,-1,0,1的predicted_proba。例如:[0.2 0.2 0.4 0.4]

为什么Scikit只给我一个4x1向量而不是5x1向量?为什么我的target_categories中的最后一个值被省略了?在

如果我只使用3,我会得到一个错误:

^{pr2}$

非常感谢你的帮助!在


Tags: 数据text算法targetwithscikit类别向量
1条回答
网友
1楼 · 发布于 2024-04-26 14:56:34

是的,它不起作用的原因是,因为我将训练数据分成50%,而{}并没有全部包含在训练数据中。下一次我将重新整理数据。在

相关问题 更多 >