使用目标变量的预定义混合进行训练/验证分割

2024-05-16 08:11:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我希望能够使用用户定义的混合目标变量进行训练/验证分割。^sklearn的{}和StratifiedShuffleSplit保留原始样品的混合物。但在kaggle或现实生活中,我们通常有一个单独的测试样本,有时可能有一个非常不同的目标混合物。你知道吗

假设我们手头有一个二元分类问题,但是标记的序列样本有50/50的0/1目标值的混合,而测试没有标签,但是从一个或另一个来源我们知道比例相当于90/10。所以问题是,sklearn中是否有一种方法,用90/10的混合物来分割原始样本,其中90/10是一个输入参数。你知道吗

它不一定是一个完整的kfold CV分割,但至少是一个交叉验证索引生成器ala StratifiedShuffleSplit


Tags: 用户标记目标定义样品分类序列sklearn