这个包为机器学习任务提供帮助工具。一个主要的用途是计算证据的重量
mlh的Python项目详细描述
机器学习助手
这个包使用多个算法和参数来适应不同的用例集,以帮助创建多个机器学习算法。
1.0悲哀(证据的重要性):
该功能有助于计算证据权重和信息值,显示图表并进行粗分类。
1.1参数:
- max_bin:整数 数值变量的最大容器数。默认值为10
- iv_阈值:浮点 信息值的阈值。转换将考虑高于阈值的变量
- 忽略阈值:布尔值 此参数控制是否应考虑或忽略定义的阈值。默认值为“true”
1.2返回:
数据帧,具有每个列的证据权重以及目标变量
1.3方法:
制造不幸的实例 我的悲哀=悲哀()
通过传递dataframe和目标变量名对定义的对象调用fit方法 我的不幸适合(df,target)
调用转换方法 transformed_df=my_woe.transform()
示例
创建示例数据帧
frommlhimportwoeimportpandasaspdimportnumpyasnpimportrandomseed=1456np.random.seed(seed)random.seed(seed)
rows=1000
y=random.choices([0,1],k=rows,weights=[.7,.3])
x1=random.choices(np.arange(20,40),k=rows)x2=np.random.randint(1000,2000,size=rows)x3=random.choices(np.arange(1,100),k=rows)x4=random.choices(['m','f','u'],k=rows)x5=random.choices(['a','b','c','d','e','f','g','h'],k=rows)
df=pd.DataFrame({'y':y,'x1':x1,'x2':x2,'x3':x3,'x4':x4,'x5':x5})
df.head()
拟合与预测
创建证据包权重实例
my_woe=woe()
将数据与创建的实例匹配
my_woe.fit(df,'y')
显示相关图表
my_woe.getWoeCharts()
使用第一次迭代的证据权重图表合并x3变量在1和2个索引处的值
my_woe.reset_woe(2,(1,2),1)
获取最新迭代信息值
my_woe.get_IV()
用证据权重替换数据帧中的原始值
transformed_df=my_woe.transform()