关于学习曲线的具体形状

train_sizes , train_accuracy , cv_accuracy = lc(linear_model.LogisticRegression(solver='lbfgs',penalty='l2',multi_class='ovr'),trainData,multiclass_response_train,train_sizes=np.array([0.1,0.33,0.5,0.66,1.0]),cv=5)

3条回答

网友

1楼 · 编辑于 2024-04-25 23:00:32

根据Alex的答案，模型的默认正则化参数似乎有点不符合数据，因为当您放松正则化时，您会看到“更合适”的学习曲线。不管你给一个不合身的模型投多少个例子。在

至于你对为什么培训分数在第一种情况下增加而不是减少的担忧，这可能是你使用的多类数据的结果。使用较少的训练示例，每个类的图像数量就更少（因为lc试图在cv的每个折叠中保持相同的类分布），因此使用正则化（如果您调用C=1正则化，也就是说），您的模型可能更难准确地猜测某些类。在

网友

2楼 · 编辑于 2024-04-25 23:00:32

看看scipy的相关网页： http://scikit-learn.org/stable/modules/learning_curve.html 分数通常是一些需要最大化的指标（ROCAUC，准确度，…）。直观地说，你可以期望你看到的训练例子越多，你的模型就越好，因此得分就越高。不过，你应该记住一些关于过度和不合身的微妙之处。在

网友

3楼 · 编辑于 2024-04-25 23:00:32

你需要对你的指标更加精确。这里使用什么指标？在

损失一般指：越低越好，得分通常意味着：越高越好。在

这也意味着，在培训和交叉验证期间，图的解释取决于使用的指标。在

相关问题更多 >

编程相关推荐

热门问题

热门文章