树木林立的特色重要性

2024-04-27 10:58:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道我的作品的重要性吗? 据我所知,它使决策树和条形图显示了特征解释了多少方差,进而显示了特征的重要性。 我还想弄清楚图尾的线条是什么意思?在

链接到方法: http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html#sphx-glr-auto-examples-ensemble-plot-forest-importances-py

这是正确的理解吗?在

Bar graph showing feature importance

谢谢


Tags: 方法决策树autoplot链接特征examples作品
1条回答
网友
1楼 · 发布于 2024-04-27 10:58:37

随机森林由许多决策树组成。在同一个条件下,每个属性都被设计成一个属性集,在同一个条件下,每个属性都被划分成两个相似的值集。选择(局部)最优条件的依据称为杂质。对于分类,它通常是基尼杂质或信息增益/熵,而对于回归树,它是方差。因此,当训练一棵树时,可以计算出每个特征减少树中加权杂质的程度。对于一个森林,每个特征的杂质减少量可以取平均值,并根据该度量对特征进行排序。在

然而,需要注意的是,随机森林中的特征重要性并不一定能预测每个特征的正确等级。两个高度相关的特征可能位于秩表的对侧。如果您放弃错误排列的功能,这不会影响模型的性能不过,不过知道每个特征的重要性并不是一个可靠的方法。为了克服这个限制,我使用了顺序向后选择。在

相关问题 更多 >