如何使用Python中的“IMBRearn”库对两个以上类的数据集进行欠采样/过采样?

2024-04-19 23:49:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用“IMBRearn”库进行欠采样。我的数据集中有四个类,每个类有20、30、40和50个数据(因为它是一个不平衡的类)

但是当我尝试使用“fit_resample(X,y)”对数据集进行欠采样时,它只对第一个和最后一个类进行欠采样

有没有什么方法可以让我用“IMBREAND”对所有四门课的样本不足

必要代码:

undersample = RandomUnderSampler(sampling_strategy='majority')
X_over, y_over = undersample.fit_resample(X, y)

Tags: 数据方法代码fitoverresample样本sampling