如何通过Python解释随机森林中的树形图

2024-04-28 10:57:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我在想办法从我随机的森林里解释我的树。我的数据包含大约29000个观测值和35个特征。我粘贴了前22个观察结果,前11个特征以及我试图预测的特征(高流动性)。在

birthcohort countyfipscode  county_name cty_pop2000 statename   state_id    stateabbrv  perm_res_p25_kr24   perm_res_p75_kr24   perm_res_p25_c1823  perm_res_p75_c1823  HighLowMobility
1980    1001    Autauga 43671   Alabama 1   AL  45.2994 60.7061         Low
1981    1001    Autauga 43671   Alabama 1   AL  42.6184 63.2107 29.7232 75.266  Low
1982    1001    Autauga 43671   Alabama 1   AL  48.2699 62.3438 38.0642 72.2544 Low
1983    1001    Autauga 43671   Alabama 1   AL  42.6337 56.4204 38.2588 80.4664 Low
1984    1001    Autauga 43671   Alabama 1   AL  44.0163 62.2799 38.1238 73.747  Low
1985    1001    Autauga 43671   Alabama 1   AL  45.7178 61.3187 40.9339 83.0661 Low
1986    1001    Autauga 43671   Alabama 1   AL  47.9204 59.6553 47.4841 72.491  Low
1987    1001    Autauga 43671   Alabama 1   AL  48.3108 54.042  53.199  84.5379 Low
1988    1001    Autauga 43671   Alabama 1   AL  47.9855 59.42   52.8927 85.2844 Low
1980    1003    Baldwin 140415  Alabama 1   AL  42.4611 51.4142         Low
1981    1003    Baldwin 140415  Alabama 1   AL  43.0029 55.1014 35.5923 76.9857 Low
1982    1003    Baldwin 140415  Alabama 1   AL  46.2496 56.0045 38.679  77.038  Low
1983    1003    Baldwin 140415  Alabama 1   AL  44.3001 54.5173 38.7106 81.0388 Low
1984    1003    Baldwin 140415  Alabama 1   AL  46.4349 55.5245 42.4422 80.3047 Low
1985    1003    Baldwin 140415  Alabama 1   AL  47.1544 52.8189 42.7994 79.0835 Low
1986    1003    Baldwin 140415  Alabama 1   AL  47.553  54.934  42.0653 78.4398 Low
1987    1003    Baldwin 140415  Alabama 1   AL  48.9752 54.3541 39.96   79.4915 Low
1988    1003    Baldwin 140415  Alabama 1   AL  48.6887 55.3087 43.8557 79.387  Low
1980    1005    Barbour 29038   Alabama 1   AL                  Low
1981    1005    Barbour 29038   Alabama 1   AL  37.5338 54.3618 34.8771 75.1904 Low
1982    1005    Barbour 29038   Alabama 1   AL  37.028  57.2471 36.5392 90.3262 Low
1983    1005    Barbour 29038   Alabama 1   AL                  Low

这是我的随机森林:

^{2}$

我该如何解释我的树?例如,perm_res_p25_c1823是一个特征,说明出生在25%的儿童在18-23岁的大学入学率,perm_res_p75_c1823代表第75个百分位,而高-低流动性特征说明其是否存在高收入或低收入流动。那么如何显示以下内容: “如果这个人来自第25百分位,住在阿拉巴马州的奥托加,那么他们的向上流动性可能会更低”?在


Tags: 森林res特征lowalperm流动性kr24
1条回答
网友
1楼 · 发布于 2024-04-28 10:57:55

你不能用这样的术语来解释RF,因为random forest不是这样工作的。它创建了高度随机的树集合,这些树可以有不同的决策规则。一旦从完全可解释的决策树转到RF,就失去了分类器的这一方面。RFs是黑盒子。你可以做很多不同的评估和估计,但它们会有效地忽略/替代你的射频。在

相关问题 更多 >