这个包为机器学习任务提供帮助工具。一个主要的用途是计算证据的重量

mlh的Python项目详细描述


机器学习助手

这个包使用多个算法和参数来适应不同的用例集,以帮助创建多个机器学习算法。

1.0悲哀(证据的重要性):

该功能有助于计算证据权重和信息值,显示图表并进行粗分类。

1.1参数:


  • max_bin:整数 数值变量的最大容器数。默认值为10
  • iv_阈值:浮点 信息值的阈值。转换将考虑高于阈值的变量
  • 忽略阈值:布尔值 此参数控制是否应考虑或忽略定义的阈值。默认值为“true”

1.2返回:

数据帧,具有每个列的证据权重以及目标变量


1.3方法:

  1. 制造不幸的实例 我的悲哀=悲哀()

  2. 通过传递dataframe和目标变量名对定义的对象调用fit方法 我的不幸适合(df,target)

  3. 调用转换方法 transformed_df=my_woe.transform()


示例

创建示例数据帧

frommlhimportwoeimportpandasaspdimportnumpyasnpimportrandomseed=1456np.random.seed(seed)random.seed(seed)
rows=1000
y=random.choices([0,1],k=rows,weights=[.7,.3])
x1=random.choices(np.arange(20,40),k=rows)x2=np.random.randint(1000,2000,size=rows)x3=random.choices(np.arange(1,100),k=rows)x4=random.choices(['m','f','u'],k=rows)x5=random.choices(['a','b','c','d','e','f','g','h'],k=rows)
df=pd.DataFrame({'y':y,'x1':x1,'x2':x2,'x3':x3,'x4':x4,'x5':x5})
df.head()

拟合与预测

创建证据包权重实例

my_woe=woe()

将数据与创建的实例匹配

my_woe.fit(df,'y')

显示相关图表

my_woe.getWoeCharts()

使用第一次迭代的证据权重图表合并x3变量在1和2个索引处的值

my_woe.reset_woe(2,(1,2),1)

获取最新迭代信息值

my_woe.get_IV()

用证据权重替换数据帧中的原始值

transformed_df=my_woe.transform()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java将Map<String,String>传递给需要Map<String,Object>   java在循环中使用字符串而不是StringBuilder是否会造成内存损失?   jnlp如何更新java控制台JRE?   java更改、修改和重新打包CXFAPI源文件   JavaFXJava应用程序在Fedora上运行一段时间后关闭   使用来自不同类的方法的java   java如何通过ant脚本在linux中使用subst?   java在使用camunda modeler进行base64编码/解码时出错   获取java。netbeans、weblogic和fastswap设置为true时的lang.NoSuchMethodError   java如何提高FinalizerThread在GC中收集对象的优先级   java检测具有相同根的单词   netbeans crud应用程序中的java错误