欠采样袋式分级机
usbclassifier的Python项目详细描述
#美国袋式分级机 #概述 带欠采样的袋装分级机。 这种方法对不平衡数据的分类是很好的。 您可以同时使用二进制或多类分类。 方法可以使用类似sci-kit-learn的api。 仅在Python3.x中使用 #用法 ##参数 *基估计器:对象 分类器看起来像sklearn.xxClassifier。 分类器必须有方法[拟合(x,y),预测(x)]. 它不是一种预测概率的方法,但是如果它有这种方法, 您可以选择“软投票”选项并获得预测概率。 *n_估计量:int(默认值=10) 基估计数。 *投票:str{'hard','soft'}(默认为'hard') 困难:使用多数票规则投票 soft:预测概率和的argmax *n_作业:int(默认值为1) 要为配合而并行运行的作业数。 如果-1,等于磁芯数。 ##方法 *适合(X,Y) X:pandas.dataframe Y:熊猫系列 返回:无 *预测(X) X:pandas.dataframe 返回:预测的y:numpy.array *预测概率(X) X:pandas.dataframe 收益:预测概率(所有袋装模型的平均值)
#许可证 此软件在麻省理工学院许可下发布,请参见[许可](/license)