我想用Sklearn在线培训Logistic回归分类器。我知道“SAG”或“SAGA”,但我不知道如何实现这一点。你知道吗
具体来说,我的目标是让算法在时间t的最后t-x个月(例如x=3)进行训练,其中t是一年中的一个月。我想对下个月(时间t+1)的一组示例进行预测。你知道吗
这是我的数据框:
X.head()
year month age job marital
0 2008 5 56 3 1
1 2008 5 57 7 1
2 2008 5 37 7 1
3 2008 5 40 0 1
4 2008 5 56 7 1
y.head()
0 0
1 1
2 0
3 0
4 0
Name: y, dtype: int8
假设我的clf如下面的代码所示(在本例中,我对整个数据集进行了批量训练):
clf = LogisticRegression(C=1, max_iter=100, class_weight = 'balanced')
y_pred = clf.predict(X)
cmx = pd.DataFrame(confusion_matrix(y, y_pred),
index = ['No', 'Yes'],
columns = ['No', 'Yes'])
请注意,我不仅希望在数据集中为每个月创建一个模型,而且希望在整个数据集中以在线(从技术上讲是minibatch)的方式训练模型本身
目前没有回答
相关问题 更多 >
编程相关推荐