从测试数据中获得最佳精度

2024-04-30 05:08:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用随机森林分类器将数据分类为4个标签。模型总共有20个特征正在接受训练。当使用测试数据集时,我观察到的准确率约为45-47%。虽然在预测训练数据集时,我得到了100%的准确率。此外,我还使用了使用网格搜索方法提取的最佳参数。有人能解释为什么训练和测试预测之间存在这种偏差吗。如何增强场景

附言:我是机器学习新手


Tags: 数据方法模型网格参数分类器森林场景
1条回答
网友
1楼 · 发布于 2024-04-30 05:08:13

可能有很多原因 1) 一个可能是,模型太过合适了。您可以尝试进行超参数优化,以找到模型性能更好的最佳值。 2) 由于使用精度作为性能参数,所以可以检查数据集是否平衡。如果您使用的是不平衡数据集,则可以使用ROC、AUC特征

相关问题 更多 >