如何从Python输出随机森林分类器?
我用Python的Sckit Learn模块训练了一个随机森林分类器,数据集非常大。我的问题是,我该如何保存这个模型,让其他人也能在他们的电脑上使用它呢?谢谢!
2 个回答
5
你有没有试过用Pickle模块把RandomForestClassifier
这个模型进行“打包”,然后把它保存到电脑上呢?
这里有个例子,参考了pickle的文档:
import pickle
classifier = RandomForestClassifier(etc)
output = open('classifier.pkl', 'wb')
pickle.dump(classifier, output)
output.close()
其他人可以这样重新加载这个“打包”的对象:
import pickle
f = open('classifier.pkl', 'rb')
classifier = pickle.load(f)
f.close()
28
推荐的方法是使用 joblib
,这样生成的文件会比用 pickle 更小:
from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl')
#then your colleagues can load it
clf = joblib.load('filename.pkl')
可以查看 在线文档