基于Sklearn的月度在线Logistic回归分析

2024-05-12 13:34:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用Sklearn在线培训Logistic回归分类器。我知道“SAG”或“SAGA”,但我不知道如何实现这一点。你知道吗

具体来说,我的目标是让算法在时间t的最后t-x个月(例如x=3)进行训练,其中t是一年中的一个月。我想对下个月(时间t+1)的一组示例进行预测。你知道吗

这是我的数据框:

X.head()

year    month   age job marital
0   2008    5   56  3   1
1   2008    5   57  7   1
2   2008    5   37  7   1
3   2008    5   40  0   1
4   2008    5   56  7   1

y.head()

0    0
1    1
2    0
3    0
4    0
Name: y, dtype: int8

假设我的clf如下面的代码所示(在本例中,我对整个数据集进行了批量训练):

clf = LogisticRegression(C=1, max_iter=100, class_weight = 'balanced')

y_pred = clf.predict(X)

cmx = pd.DataFrame(confusion_matrix(y, y_pred), 
                   index = ['No', 'Yes'],
                   columns = ['No', 'Yes'])

请注意,我不仅希望在数据集中为每个月创建一个模型,而且希望在整个数据集中以在线(从技术上讲是minibatch)的方式训练模型本身


Tags: 数据no模型算法目标分类器时间sklearn