scikitlearn“使用文本数据教程”忽略了我的目标类别

2024-04-26 14:56:34 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在研究ML算法，并查看了：Scikit-Learn Working with Text Tutorial

现在我尝试使用我自己的训练数据集，1个feature=message，5个类别的评分从-2（负面）到2（积极）。在

然后我做同样的说明，在教程中，但它总是返回最多4个target_类别，而不是5个！在

target_categories = ['-2', '-1', '0', '1','2']

print(metrics.classification_report(train_data.Category, predicted,target_names=target_categories))

我只得到-2，-1,0,1的predicted_proba。例如：[0.2 0.2 0.4 0.4]

为什么Scikit只给我一个4x1向量而不是5x1向量？为什么我的target_categories中的最后一个值被省略了？在

如果我只使用3，我会得到一个错误：

^{pr2}$

非常感谢你的帮助！在

Tags：数据 text 算法 target with scikit 类别向量

1条回答

网友

1楼 · 发布于 2024-04-26 14:56:34

是的，它不起作用的原因是，因为我将训练数据分成50%，而{}并没有全部包含在训练数据中。下一次我将重新整理数据。在