在Python中使用scikit.learn计算信息增益
我在用Python的scikit-learn库做决策树时遇到了一个问题。我想在我选择的决策树深度下,得到更好的叶子节点。
clf = tree.DecisionTreeClassifier(criterion="entropy", max_depth=4, min_samples_leaf=50000)
这是我的决策树函数,我想做的是选择合适的信息增益阈值,以获得更好的结果。默认的信息增益阈值是零,所以信息增益大于零的特征会被选中。
我想把信息增益阈值设置为一个特定的数字以上。我该怎么做呢?
1 个回答
0
根据我对你问题的理解,目前这个功能是不支持的。你不能在寻找分割时设置一个最低的杂质减少值。无论改善的效果有多小,系统总是会选择那个能最大化减少杂质的分割。