用交叉验证和AUCROC建立sklearn中的logistic回归模型

from sklearn.linear_model import LogisticRegression from sklearn.cross_validation import cross_val_score features = ['a', 'b', 'c'] outcome = ['d'] X = df[features] y = df[outcome] crossval_scores = cross_val_score(LogisticRegression(), X, y, scoring='roc_auc', cv=10)

2条回答

网友

1楼 · 编辑于 2024-05-13 02:45:41

cross_val_score用真值训练输入的模型，执行预测，然后将这些预测与评分步骤的真值进行比较。这就是为什么要传入y：这是true值，即“基本真相”。

通过指定scoring='roc_auc'调用的^{}函数依赖于y_true和y_pred：模型的基本事实和基于X的预测值。

网友

2楼 · 编辑于 2024-05-13 02:45:41

所有有监督的学习方法（包括logistic回归）都需要真实的y值来拟合模型。

拟合模型后，我们通常希望：

做出预测，然后
为这些预测打分（通常是在“坚持”的数据上，比如通过交叉验证）

cross_val_score为您提供模型预测的交叉验证分数。但要对预测进行评分，首先需要进行预测，然后进行预测，首先需要符合模型，这需要X和（true）y。

cross_val_score正如您所注意到的，接受不同的评分标准。因此，如果选择f1-score，那么在cross-val-score期间生成的模型预测将是类预测（来自模型的predict()方法）。如果选择roc_auc作为度量标准，则用于对模型进行评分的模型预测将是概率预测（来自模型的predict_proba()方法）。

相关问题更多 >

编程相关推荐

热门问题

热门文章