我已经能够在数据集上创建一个RandomForestClassifier。你知道吗
clf = RandomForestClassifier(n_estimators=100, random_state = 101)
然后我就可以在测试数据上使用它,比如:
prediction = pd.DataFrame(clf.predict(x)) # x = Matrix of predictor values
所以我的问题是,我该怎么测试clf.预测在Python之外,如何查看正在使用的值以及如何“手动”测试它(例如,如果在回归中获得beta,那么可以在Excel中使用这些值并复制模型)。如何在Python中使用randomfires实现这一点?你知道吗
还有没有一个与Rsquared相似的度量来测试模型的解释能力?你知道吗
谢谢!你知道吗
RandomForestClassifier
是树的集合,这意味着它是由多棵树组成的。你知道吗为了能够测试我建议用Python本身测试的树,您可以访问分类器的
estimators_
属性中的所有树,然后将它们从sklearn.tree
模块导出为带有export_graphviz
的图。你知道吗如果坚持导出树,则需要导出每个树所包含的所有规则。为此,您可以遵循sklearn文档中的this说明。你知道吗
关于度量,对于分类问题,可以使用来自
sklearn.metrics
模块的accuracy_score
。你知道吗相关问题 更多 >
编程相关推荐