你能在scikit learn中修复分类器中的假阴性率吗

网友

1楼 · 编辑于 2024-06-16 16:49:45

我相信sklearn中的类不平衡问题可以通过使用class_weight参数部分解决。在

这个参数要么是一个字典，每个类都被分配了一个统一的权重，要么是一个字符串，告诉sklearn如何构建这个字典。例如，将此参数设置为“auto”，将按每个类的频率的倒数来加权。在

通过用更高的量来加权较少出现的类，你可以得到“更好”的结果。在

像SVM或logistic回归等分类器也提供了这个class_weight参数。在

This堆栈溢出的答案给出了一些关于如何处理类不平衡的其他想法，例如欠采样和过采样。在

网友
2楼 · 编辑于 2024-06-16 16:49:45

随机森林已经是一个袋装分类器，因此应该已经给出一些好的结果。在
获得期望的假阳性或假阴性精度的一种典型方法是使用ROC曲线进行分析 http://scikit-learn.org/stable/auto_examples/plot_roc.html 例如，修改某些参数以达到期望的FP率。在
不确定是否可以使用参数调整随机林分类器的FP率。您可以根据应用程序查看其他分类器。在

网友
3楼 · 编辑于 2024-06-16 16:49:45

我发现了这篇关于班级不平衡问题的文章。在

http://www.chioka.in/class-imbalance-problem/

主要讨论了以下几种可能的解决方案：

基于成本函数的方法
基于抽样的方法
SMOTE（合成少数过采样技术）
最近的方法：RUSBoost、SMOTEBagging和Underbagging

希望能有所帮助。在

相关问题更多 >

编程相关推荐

热门问题

热门文章