如何在分类机器学习模型中增加真阳性？

网友

1楼 · 编辑于 2024-05-13 19:30:11

我假设您的目的是在某个测试集中获得一个具有良好分类精度的模型，而不管该模型的形式如何。在这种情况下，如果您可以访问计算资源，请尝试梯度增强树。这是一个集成分类器，在数据子集上使用多个决策树，然后使用投票集成进行预测。据我所知，它可以在类数不平衡的情况下得到很好的结果。在

SciKitLearn具有sklearn.ensemble.GradientBoostingClassifier函数。我没有使用过这个特定的版本，但是我经常使用回归版本，它看起来很好。我很确定MATLAB也有这个包，如果你有权限的话。在

2k特性对于SKL算法来说可能很困难-我不知道我从未尝试过。在

网友

2楼 · 编辑于 2024-05-13 19:30:11

有几种方法可以做到这一点：

我相信还有很多窍门可以用，这里是我最喜欢的短名单。在

网友

3楼 · 编辑于 2024-05-13 19:30:11

你的数据集有多大？我们在这里谈几排？在

你的数据集是不平衡的，因此对于一个简单的分类算法来说，大多数时候预测“多数类”是很正常的，并且给你90%的准确率。你能收集到更多的数据，其中会有更多的正面例子吗。在

或者，尝试过采样/欠采样。看看有没有帮助。在

当预测到错误的类时，也可以使用该算法的惩罚版本来施加惩罚。这可能会有帮助。在