如何从Python输出随机森林分类器?

13 投票
2 回答
12792 浏览
提问于 2025-04-18 02:17

我用Python的Sckit Learn模块训练了一个随机森林分类器,数据集非常大。我的问题是,我该如何保存这个模型,让其他人也能在他们的电脑上使用它呢?谢谢!

2 个回答

5

你有没有试过用Pickle模块把RandomForestClassifier这个模型进行“打包”,然后把它保存到电脑上呢?

这里有个例子,参考了pickle的文档:

import pickle

classifier = RandomForestClassifier(etc)
output = open('classifier.pkl', 'wb')
pickle.dump(classifier, output)
output.close()

其他人可以这样重新加载这个“打包”的对象:

import pickle

f = open('classifier.pkl', 'rb')
classifier = pickle.load(f)
f.close()
28

推荐的方法是使用 joblib,这样生成的文件会比用 pickle 更小:

from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl') 

#then your colleagues can load it

clf = joblib.load('filename.pkl')

可以查看 在线文档

撰写回答