我在想办法从我随机的森林里解释我的树。我的数据包含大约29000个观测值和35个特征。我粘贴了前22个观察结果,前11个特征以及我试图预测的特征(高流动性)。在
birthcohort countyfipscode county_name cty_pop2000 statename state_id stateabbrv perm_res_p25_kr24 perm_res_p75_kr24 perm_res_p25_c1823 perm_res_p75_c1823 HighLowMobility
1980 1001 Autauga 43671 Alabama 1 AL 45.2994 60.7061 Low
1981 1001 Autauga 43671 Alabama 1 AL 42.6184 63.2107 29.7232 75.266 Low
1982 1001 Autauga 43671 Alabama 1 AL 48.2699 62.3438 38.0642 72.2544 Low
1983 1001 Autauga 43671 Alabama 1 AL 42.6337 56.4204 38.2588 80.4664 Low
1984 1001 Autauga 43671 Alabama 1 AL 44.0163 62.2799 38.1238 73.747 Low
1985 1001 Autauga 43671 Alabama 1 AL 45.7178 61.3187 40.9339 83.0661 Low
1986 1001 Autauga 43671 Alabama 1 AL 47.9204 59.6553 47.4841 72.491 Low
1987 1001 Autauga 43671 Alabama 1 AL 48.3108 54.042 53.199 84.5379 Low
1988 1001 Autauga 43671 Alabama 1 AL 47.9855 59.42 52.8927 85.2844 Low
1980 1003 Baldwin 140415 Alabama 1 AL 42.4611 51.4142 Low
1981 1003 Baldwin 140415 Alabama 1 AL 43.0029 55.1014 35.5923 76.9857 Low
1982 1003 Baldwin 140415 Alabama 1 AL 46.2496 56.0045 38.679 77.038 Low
1983 1003 Baldwin 140415 Alabama 1 AL 44.3001 54.5173 38.7106 81.0388 Low
1984 1003 Baldwin 140415 Alabama 1 AL 46.4349 55.5245 42.4422 80.3047 Low
1985 1003 Baldwin 140415 Alabama 1 AL 47.1544 52.8189 42.7994 79.0835 Low
1986 1003 Baldwin 140415 Alabama 1 AL 47.553 54.934 42.0653 78.4398 Low
1987 1003 Baldwin 140415 Alabama 1 AL 48.9752 54.3541 39.96 79.4915 Low
1988 1003 Baldwin 140415 Alabama 1 AL 48.6887 55.3087 43.8557 79.387 Low
1980 1005 Barbour 29038 Alabama 1 AL Low
1981 1005 Barbour 29038 Alabama 1 AL 37.5338 54.3618 34.8771 75.1904 Low
1982 1005 Barbour 29038 Alabama 1 AL 37.028 57.2471 36.5392 90.3262 Low
1983 1005 Barbour 29038 Alabama 1 AL Low
这是我的随机森林:
^{2}$我该如何解释我的树?例如,perm_res_p25_c1823是一个特征,说明出生在25%的儿童在18-23岁的大学入学率,perm_res_p75_c1823代表第75个百分位,而高-低流动性特征说明其是否存在高收入或低收入流动。那么如何显示以下内容: “如果这个人来自第25百分位,住在阿拉巴马州的奥托加,那么他们的向上流动性可能会更低”?在
你不能用这样的术语来解释RF,因为random forest不是这样工作的。它创建了高度随机的树集合,这些树可以有不同的决策规则。一旦从完全可解释的决策树转到RF,就失去了分类器的这一方面。RFs是黑盒子。你可以做很多不同的评估和估计,但它们会有效地忽略/替代你的射频。在
相关问题 更多 >
编程相关推荐