MLDATA是用来在机器学习前清理数据的过程!

MLData的Python项目详细描述


#mldata
mldata,是一个为机器学习过程清理和规范化数据的项目。



=处理器(“resource/raw_dataset.csv”,target_column=“approve/not”,exclude_column_list=[“id”],
category_list=[“work class”,“fnlwgt”,“education”,“maried status”,“occupation”,“relationship”,“race”,“gender”,“native country”,“flag”],
无效的值=[“?”,“”,“空”,无],
正片标记=1)
处理器.normalize()
处理器.save_to_file(new_file_path)
`````


api描述
1,初始化函数
````
处理器(csv_file_path,target_column,exclude_column_list=none,category_list=none,正片标记=1,
csv_头=0,无效的_值=无)

```
参数:
csv_文件路径:原始csv文件路径
target_列:目标的列名
exclude_列列表:不需要规范化的列
category_列表:基于类别的列的列名列表
positive_标记:正数标记目标列值,默认值为1
无效的值:CSV中的值无效,例如“?”,“”,“null”,none

2,normal列表
``buildoutcfg
processor.normalize()
````
此函数用于对csv文件执行normal。



3,将结果保存到csv文件。
``buildoutcfg
processor.save_to_file(new_file_name)
````
此函数用于将规范化输出保存到csv文件。
参数:
新文件名:保存规范化数据的新文件名

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何克服带有空值的不可空bean级验证   “此行有多个标记”的authenticateUser上的java MySQLConnection错误   java处理Jackson异常   java Netbeans编辑器如何知道文件在撤消后不会被修改?   目标C相当于Java的ArrayList   java当需要int时,可以将short传递给方法调用吗?   drawString()方法上的java MouseListener   java服务器socket是执行此操作的最佳选项   java需要单个匹配bean,但找到了2:org。springframework。网状物servlet。mvc。方法注释。RequestMappingHandlerMapping   如何在Java中执行Windows命令?   安卓应用程序的java文件主机   java将所有spring引导属性都设置在内。将yml文件转换为系统属性   Java邮件中的html内联链接在邮件客户端中不起作用   Java二进制文件的bazel版本控制   java如何在自定义ListView中使用Intent   java(Spring MVC+Hibernate 4+Test 4)自动连线DAO返回NULL   java一次add()调用可以在Solr服务器中索引多少文档?   java如何获取Avro GenericRecord大小