LightGBM“class_weight”参数:是否与二进制分类一起使用?

2024-04-29 04:23:58 发布

您现在位置:Python中文网/ 问答频道 /正文

在处理班级不平衡问题时,惩罚大多数班级是我在构建机器学习模型时遇到的一种常见做法。因此,我经常在重新采样后使用类权重。LightGBM是一种有效的基于决策树的框架,被认为可以很好地处理类不平衡问题。所以我使用LightGBM模型来解决我的二进制分类问题。数据集具有高级别不平衡,比例为34:1

我最初使用带有“类权重”参数的LightGBM分类器。然而,LightGBM分类器的文档中提到仅将此参数用于多类问题。对于二元分类,建议使用“is_不平衡”或“scale_pos_weight”参数。但是,通过使用类权重,我看到了更好的结果,与使用其他两个参数相比,调整权重和跟踪模型性能也更容易

但是,既然文档建议不要将其用于二进制分类,那么使用该参数会有任何影响吗?我在测试数据和验证数据上使用它得到了很好的结果,但我想知道它在其他实时数据上是否会表现出其他的行为


Tags: 数据文档模型机器框架决策树参数分类器