在Python中使用scikit.learn计算信息增益

0 投票

1 回答

2499 浏览

提问于 2025-04-18 14:24

我在用Python的scikit-learn库做决策树时遇到了一个问题。我想在我选择的决策树深度下，得到更好的叶子节点。

clf = tree.DecisionTreeClassifier(criterion="entropy", max_depth=4, min_samples_leaf=50000)

这是我的决策树函数，我想做的是选择合适的信息增益阈值，以获得更好的结果。默认的信息增益阈值是零，所以信息增益大于零的特征会被选中。

我想把信息增益阈值设置为一个特定的数字以上。我该怎么做呢？

机器学习决策树 scikit-learn 超参数调优特征选择信息增益

1 个回答

根据我对你问题的理解，目前这个功能是不支持的。你不能在寻找分割时设置一个最低的杂质减少值。无论改善的效果有多小，系统总是会选择那个能最大化减少杂质的分割。

回答于 2025-04-18 由 Python大师

分享举报