2024-05-15 00:14:16 发布
网友
我有一个二进制分类问题,它在标签0和1(少数)中有一个巨大的不平衡。因为测试集标签为1的行太少,我让train测试至少70-30或60-40,所以仍然有显著的观察结果。由于我不是在衡量准确度(由于阶级不平衡),而是在更准确的回忆,这是特别重要的,因为一些真正的积极的差异是显著的
Python/sklearn中是否有KFold(或交叉验证方法)的变体,我选择K=5,并将分割设置为60-40?如下图所示:
你需要分层抽样来处理这种不平衡。 以下是sklearn为您提供的URL:组合Kfold和分层抽样/分割
http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.StratifiedKFold.html
你需要分层抽样来处理这种不平衡。 以下是sklearn为您提供的URL:组合Kfold和分层抽样/分割
http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.StratifiedKFold.html
相关问题 更多 >
编程相关推荐