这个包为机器学习任务提供帮助工具。一个主要的用途是计算证据的重量

mlh的Python项目详细描述


机器学习助手

这个包使用多个算法和参数来适应不同的用例集,以帮助创建多个机器学习算法。

1.0悲哀(证据的重要性):

该功能有助于计算证据权重和信息值,显示图表并进行粗分类。

1.1参数:


  • max_bin:整数 数值变量的最大容器数。默认值为10
  • iv_阈值:浮点 信息值的阈值。转换将考虑高于阈值的变量
  • 忽略阈值:布尔值 此参数控制是否应考虑或忽略定义的阈值。默认值为“true”

1.2返回:

数据帧,具有每个列的证据权重以及目标变量


1.3方法:

  1. 制造不幸的实例 我的悲哀=悲哀()

  2. 通过传递dataframe和目标变量名对定义的对象调用fit方法 我的不幸适合(df,target)

  3. 调用转换方法 transformed_df=my_woe.transform()


示例

创建示例数据帧

frommlhimportwoeimportpandasaspdimportnumpyasnpimportrandomseed=1456np.random.seed(seed)random.seed(seed)
rows=1000
y=random.choices([0,1],k=rows,weights=[.7,.3])
x1=random.choices(np.arange(20,40),k=rows)x2=np.random.randint(1000,2000,size=rows)x3=random.choices(np.arange(1,100),k=rows)x4=random.choices(['m','f','u'],k=rows)x5=random.choices(['a','b','c','d','e','f','g','h'],k=rows)
df=pd.DataFrame({'y':y,'x1':x1,'x2':x2,'x3':x3,'x4':x4,'x5':x5})
df.head()

拟合与预测

创建证据包权重实例

my_woe=woe()

将数据与创建的实例匹配

my_woe.fit(df,'y')

显示相关图表

my_woe.getWoeCharts()

使用第一次迭代的证据权重图表合并x3变量在1和2个索引处的值

my_woe.reset_woe(2,(1,2),1)

获取最新迭代信息值

my_woe.get_IV()

用证据权重替换数据帧中的原始值

transformed_df=my_woe.transform()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java我是否需要构造一个带有*非final*但不可变字段的不可变类?   java如何使用jaxb读取属性?   java为什么不打印空值以外的任何内容?   java Struts2如何在不使用struts的情况下重定向到操作。xml?   java方法参数未在其实现中使用   在Java中更改终端内部的变量   Spring中的java依赖项注入失败   java如何使用getAttribute Selenium防止获取重复的HREF   优先级队列的java顺序不符合预期   java如何使用Spring TaskExecutor在应用程序的所有请求中使用单个任务池   java Firebase RecyclerView不会从数据库中检索项目并将其显示在屏幕上。屏幕是空的   java将YUV_420_888转换为字节数组   spring停止使用Java缓存文件   java在执行maven clean安装时,我在eclipse智能家居中遇到了这种错误   stream Java=下载缓冲区未满?冲洗/缓冲是如何工作的?   查询SQL server时重置java JDBC连接   java如何避免在两个函数中使用相同的逻辑。   转换java。lang.Boolean到Scala Boolean