测试先前工作中的数据集平衡技术。
miur-daad-balancing的Python项目详细描述
测试先前工作中的数据集平衡技术。
如何安装此软件包?
像往常一样,只需使用pip:
pip install miur_daad_balancing
用法
MIUR-DAAD项目有三种平衡方法:
不平衡
此方法只是保持数据原样,并更多地用作回调usefull以统一管道:
frommiur_daad_balancingimportumbalancedtraining,testing=generate_my_data(...)balanced_training,balanced_testing=umbalanced(training,testing)
平衡
在默认包设置(3000)中指定训练集中的每个类的最大阈值:
frommiur_daad_balancingimportbalancedtraining,testing=generate_my_data(...)balanced_training,balanced_testing=balanced(training,testing)
完全平衡
对训练集中的每个类应用最大阈值,并与测试集的默认比例平衡:
frommiur_daad_balancingimportfull_balancedtraining,testing=generate_my_data(...)balanced_training,balanced_testing=full_balanced(training,testing)