我正在研究UCI储存库中的肝炎数据集。
它的阶级不平衡。
班级分布:
模具:32
直播:123
我尝试使用ADASYN过采样方法来平衡类。在
在示例中,他们生成了一个数据集并将其传递给ADASYN。
有人能用这种格式解释一下x和y的值应该基于数据集吗?在
我指的是下面链接的例子。在
https://561-36019880-gh.circle-artifacts.com/0/home/ubuntu/imbalanced-learn/doc/_build/html/generated/imblearn.over_sampling.ADASYN.html#imblearn.over_sampling.ADASYN
请帮助我根据需要将数据集拆分为X和Y值以传递给ADASYN
Tags:
你的问题不清楚。但这可能会有所帮助:
X-2D矩阵,其中行是示例,列是您的特征 Y-是您的响应,例如,}(对于类DIE)是1D向量。在
True
(对于类LIVE)和{X_resampled
和{y_resampled
你应该看到每个类的标签数量相等。在供您参考:
https://github.com/scikit-learn-contrib/imbalanced-learn/blob/master/examples/over-sampling/plot_adasyn.py
相关问题 更多 >
编程相关推荐