使程序仅在上学习数据集

2024-04-24 22:37:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个基于机器学习的项目,它使用参数列表作为输入。大约有3000个这样的投入。每次我执行代码时,算法都学习数据集。你知道吗

有没有办法,让我只运行一次学习数据集的程序,每次代码再次运行时使用它的参数?你知道吗


Tags: 数据项目代码程序算法机器列表参数
2条回答

我认为你要找的是酸洗,你可以通过这样做来实现

将分类器保存到磁盘(训练后)

from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl') 

加载分类器

clf = joblib.load('filename.pkl')

您可以运行一次程序,保存pickle,然后从那里继续。或者每次程序运行时检查pickle文件是否存在,如果不存在则训练模型。你知道吗

from pathlib import Path

my_file = Path("/path/to/file")
if my_file.is_file():

参考文献:

http://scikit-learn.org/stable/modules/model_persistence.html

How do I check whether a file exists using Python?

这在很大程度上取决于您的框架,但我所知道的所有框架都保存了这些经过训练的权重,供您用作经过训练的模型。您需要在文档中查找您正在使用的框架。使用模型预测新数据的术语是预测推断评分。你知道吗

例如,在Caffe中,使用经过训练的模型如下:

./build/tools/caffe test -model models/alexnet/train_val.prototxt 
    -weights alex_trained_iter_500000.caffemodel -iterations 1000

这里的关键部分是用于权重的caffemodel文件。你知道吗

有帮助吗?你知道吗

相关问题 更多 >