Python随机林分类器(如何测试)

2024-04-19 00:48:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经能够在数据集上创建一个RandomForestClassifier。你知道吗

clf = RandomForestClassifier(n_estimators=100, random_state = 101)   

然后我就可以在测试数据上使用它,比如:

prediction = pd.DataFrame(clf.predict(x)) # x = Matrix of predictor values 

所以我的问题是,我该怎么测试clf.预测在Python之外,如何查看正在使用的值以及如何“手动”测试它(例如,如果在回归中获得beta,那么可以在Excel中使用这些值并复制模型)。如何在Python中使用randomfires实现这一点?你知道吗

还有没有一个与Rsquared相似的度量来测试模型的解释能力?你知道吗

谢谢!你知道吗


Tags: of数据模型dataframerandompredictmatrixpd
1条回答
网友
1楼 · 发布于 2024-04-19 00:48:10

RandomForestClassifier是树的集合,这意味着它是由多棵树组成的。你知道吗

为了能够测试我建议用Python本身测试的树,您可以访问分类器的estimators_属性中的所有树,然后将它们从sklearn.tree模块导出为带有export_graphviz的图。你知道吗

如果坚持导出树,则需要导出每个树所包含的所有规则。为此,您可以遵循sklearn文档中的this说明。你知道吗

关于度量,对于分类问题,可以使用来自sklearn.metrics模块的accuracy_score。你知道吗

相关问题 更多 >