随机树细节

2024-05-29 03:45:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找python或R中的一个随机森林包,它可以让我获得关于最终构建的林的一些细粒度细节。我特别想:

  1. 获取创建的树的一些表示
  2. 对于森林中的每一棵树,得到它与数据拟合程度的整体度量(如熵)
  3. 对于训练集中的每一个记录和森林中的每棵树,记录它最终在哪片末梢叶子;以及
  4. 对于一个新的记录,对于森林中的每一棵树,都有一个它最终在哪片末梢叶子的记录。在

我知道(4)的解决方案也可以作为(3)的解决方案,但我猜(3)应该相对容易些,因为随着森林的生长,跟踪结果。在

我仔细研究了R和python中的可用选项,但是我找不到一个现成的例程来满足这四个需求。(很难找到一个满足条件(1)的人,即让你直接看到森林。)

如果有人知道我错过了什么,或者自己构建了这样一个程序,我非常希望有一个链接/参考。在


Tags: 数据程序度量链接选项记录森林解决方案
2条回答

试试这个:

Package for interpreting scikit-learn's decision tree and random forest predictions. Allows decomposing each prediction into bias and feature contribution components as described in http://blog.datadive.net/interpreting-random-forests/. For a dataset with n features, each prediction on the dataset is decomposed as prediction = bias + feature_1_contribution + ... + feature_n_contribution.

pip install treeinterpreter

http://blog.datadive.net/random-forest-interpretation-with-scikit-learn/

另一个解决方案是lime,它将解释预测特征的权重,并使用matplotlib对预测进行可视化解释,该库可以轻松地与jupyter(ipython)笔记本电脑集成。在

相关问题 更多 >

    热门问题