Kfold CV变量,其中大小(测试集)>N/K

2024-02-26 11:23:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个二进制分类问题,它在标签0和1(少数)中有一个巨大的不平衡。因为测试集标签为1的行太少,我让train测试至少70-30或60-40,所以仍然有显著的观察结果。由于我不是在衡量准确度(由于阶级不平衡),而是在更准确的回忆,这是特别重要的,因为一些真正的积极的差异是显著的

Python/sklearn中是否有KFold(或交叉验证方法)的变体,我选择K=5,并将分割设置为60-40?如下图所示:

enter image description here


Tags: 方法二进制分类train标签差异变体sklearn