MLDATA是用来在机器学习前清理数据的过程!
MLData的Python项目详细描述
#mldata
mldata,是一个为机器学习过程清理和规范化数据的项目。
=处理器(“resource/raw_dataset.csv”,target_column=“approve/not”,exclude_column_list=[“id”],
category_list=[“work class”,“fnlwgt”,“education”,“maried status”,“occupation”,“relationship”,“race”,“gender”,“native country”,“flag”],
无效的值=[“?”,“”,“空”,无],
正片标记=1)
处理器.normalize()
处理器.save_to_file(new_file_path)
`````
api描述
1,初始化函数
````
处理器(csv_file_path,target_column,exclude_column_list=none,category_list=none,正片标记=1,
csv_头=0,无效的_值=无)
```
参数:
csv_文件路径:原始csv文件路径
target_列:目标的列名
exclude_列列表:不需要规范化的列
category_列表:基于类别的列的列名列表
positive_标记:正数标记目标列值,默认值为1
无效的值:CSV中的值无效,例如“?”,“”,“null”,none
2,normal列表
``buildoutcfg
processor.normalize()
````
此函数用于对csv文件执行normal。
3,将结果保存到csv文件。
``buildoutcfg
processor.save_to_file(new_file_name)
````
此函数用于将规范化输出保存到csv文件。
参数:
新文件名:保存规范化数据的新文件名
mldata,是一个为机器学习过程清理和规范化数据的项目。
=处理器(“resource/raw_dataset.csv”,target_column=“approve/not”,exclude_column_list=[“id”],
category_list=[“work class”,“fnlwgt”,“education”,“maried status”,“occupation”,“relationship”,“race”,“gender”,“native country”,“flag”],
无效的值=[“?”,“”,“空”,无],
正片标记=1)
处理器.normalize()
处理器.save_to_file(new_file_path)
`````
api描述
1,初始化函数
````
处理器(csv_file_path,target_column,exclude_column_list=none,category_list=none,正片标记=1,
csv_头=0,无效的_值=无)
```
参数:
csv_文件路径:原始csv文件路径
target_列:目标的列名
exclude_列列表:不需要规范化的列
category_列表:基于类别的列的列名列表
positive_标记:正数标记目标列值,默认值为1
无效的值:CSV中的值无效,例如“?”,“”,“null”,none
2,normal列表
``buildoutcfg
processor.normalize()
````
此函数用于对csv文件执行normal。
3,将结果保存到csv文件。
``buildoutcfg
processor.save_to_file(new_file_name)
````
此函数用于将规范化输出保存到csv文件。
参数:
新文件名:保存规范化数据的新文件名