在Python中使用scikit.learn计算信息增益

0 投票
1 回答
2499 浏览
提问于 2025-04-18 14:24

我在用Python的scikit-learn库做决策树时遇到了一个问题。我想在我选择的决策树深度下,得到更好的叶子节点。

clf = tree.DecisionTreeClassifier(criterion="entropy", max_depth=4, min_samples_leaf=50000)

这是我的决策树函数,我想做的是选择合适的信息增益阈值,以获得更好的结果。默认的信息增益阈值是零,所以信息增益大于零的特征会被选中。

我想把信息增益阈值设置为一个特定的数字以上。我该怎么做呢?

1 个回答

0

根据我对你问题的理解,目前这个功能是不支持的。你不能在寻找分割时设置一个最低的杂质减少值。无论改善的效果有多小,系统总是会选择那个能最大化减少杂质的分割。

撰写回答