MLDATA是用来在机器学习前清理数据的过程!

MLData的Python项目详细描述


#mldata
mldata,是一个为机器学习过程清理和规范化数据的项目。



=处理器(“resource/raw_dataset.csv”,target_column=“approve/not”,exclude_column_list=[“id”],
category_list=[“work class”,“fnlwgt”,“education”,“maried status”,“occupation”,“relationship”,“race”,“gender”,“native country”,“flag”],
无效的值=[“?”,“”,“空”,无],
正片标记=1)
处理器.normalize()
处理器.save_to_file(new_file_path)
`````


api描述
1,初始化函数
````
处理器(csv_file_path,target_column,exclude_column_list=none,category_list=none,正片标记=1,
csv_头=0,无效的_值=无)

```
参数:
csv_文件路径:原始csv文件路径
target_列:目标的列名
exclude_列列表:不需要规范化的列
category_列表:基于类别的列的列名列表
positive_标记:正数标记目标列值,默认值为1
无效的值:CSV中的值无效,例如“?”,“”,“null”,none

2,normal列表
``buildoutcfg
processor.normalize()
````
此函数用于对csv文件执行normal。



3,将结果保存到csv文件。
``buildoutcfg
processor.save_to_file(new_file_name)
````
此函数用于将规范化输出保存到csv文件。
参数:
新文件名:保存规范化数据的新文件名

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
编译器构造为什么在Java中允许初始化对Null的引用?   java手动调用javax的actionPerformed。摆动计时器   使用git分支的java Maven版本控制   Java8句子流   java JPA OneToOne和OneToMany实体实例化/创建   java如何将值添加到列表<Map<String,Object>>?   java如何使用ComboBox在一个框架内更改JPanel。getSelectedIndex()   java在比较XML和xmlunit时忽略文本差异   java无法从其他pc连接到本地主机   Java中分配对象id的优雅方式   Java中静态变量的使用   java试图从Neteller获取OAuth访问令牌时产生错误:“服务器返回HTTP响应代码:401表示URL”   Java:基元类型是否会影响性能?   java可以让hasNext()不区分大小写吗?   基于AutoCompleteTextView建议属性或AutoCompleteTextView值的java Android搜索   java流文件到firefox浏览器有时无法打开应用程序对话框   在没有ArrayList的Java中返回数组中的搜索结果   复制java。木卫一。IOException:数据错误(CRC)   java为什么我在尝试删除Facebook测试用户时会出现“方法未实现”错误   java如何使用JNA调用SetProcessReliationPolicy