机器学习:当在另一个数据上预测时,分类器的精度不好

2024-05-12 19:37:24 发布

您现在位置:Python中文网/ 问答频道 /正文

same question在这里,但使用不同的上下文,这就是为什么无法实现,因为他已经有两个相同的形状大小的数据集。但在我的例子中,我正在塑造训练特征的大小,使其与测试特征的大小相等。所有代码都运行良好,但线性支持向量机、核支持向量机、多项式朴素贝叶斯的相同问题性能低于“60%”。例如,多项式nb情况下的分类报告是

  • f1成绩(准确度)=0.58
  • f1成绩(宏观平均值)=0.49
  • f1得分(加权平均值)=0.61

我认为我的新稀疏矩阵在经过处理的\u TRAIN \u特征整形后不太好。。。这是真的还是假的?在下面的代码中,我将列从9434增强为10782

processed_TRAIN_features = csr_matrix((processed_TRAIN_features),shape=(98962,10782))

这是真是假?如果有什么问题,请告诉我。代码的其余部分是here

提前谢谢


Tags: 数据代码train线性特征向量例子f1