X和y的值是多少imblearn.over_采样导入ADASYN

2024-05-16 00:42:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究UCI储存库中的肝炎数据集。 它的阶级不平衡。 班级分布: 模具:32 直播:123 我尝试使用ADASYN过采样方法来平衡类。在

在示例中,他们生成了一个数据集并将其传递给ADASYN。 有人能用这种格式解释一下x和y的值应该基于数据集吗?在

我指的是下面链接的例子。在

https://561-36019880-gh.circle-artifacts.com/0/home/ubuntu/imbalanced-learn/doc/_build/html/generated/imblearn.over_sampling.ADASYN.html#imblearn.over_sampling.ADASYN

请帮助我根据需要将数据集拆分为X和Y值以传递给ADASYN


Tags: 数据方法示例链接html格式over班级
1条回答
网友
1楼 · 发布于 2024-05-16 00:42:47

你的问题不清楚。但这可能会有所帮助:

X-2D矩阵,其中行是示例,列是您的特征 Y-是您的响应,例如,True(对于类LIVE)和{}(对于类DIE)是1D向量。在

from imblearn.over_sampling import ADASYN
# Apply the random over-sampling
ada = ADASYN()
X_resampled, y_resampled = ada.fit_sample(X, y)

X_resampled和{}现在包括原始数据和重新采样的数据。看看y_resampled你应该看到每个类的标签数量相等。在

供您参考:

https://github.com/scikit-learn-contrib/imbalanced-learn/blob/master/examples/over-sampling/plot_adasyn.py

相关问题 更多 >