Python MLData包_程序模块 - PyPI

MLDATA是用来在机器学习前清理数据的过程！

MLData的Python项目详细描述

#mldata
mldata，是一个为机器学习过程清理和规范化数据的项目。

=处理器（“resource/raw_dataset.csv”，target_column=“approve/not”，exclude_column_list=[“id”]，
category_list=[“work class”，“fnlwgt”，“education”，“maried status”，“occupation”，“relationship”，“race”，“gender”，“native country”，“flag”]，
无效的值=[“？”，“”，“空”，无]，
正片标记=1）
处理器.normalize（）
处理器.save_to_file（new_file_path）
`````

api描述
1，初始化函数
````
处理器（csv_file_path，target_column，exclude_column_list=none，category_list=none，正片标记=1，
csv_头=0，无效的_值=无）

```
参数：
csv_文件路径：原始csv文件路径
target_列：目标的列名
exclude_列列表：不需要规范化的列
category_列表：基于类别的列的列名列表
positive_标记：正数标记目标列值，默认值为1
无效的值：CSV中的值无效，例如“？”，“”，“null”，none

2，normal列表
``buildoutcfg
processor.normalize（）
````
此函数用于对csv文件执行normal。

3，将结果保存到csv文件。
``buildoutcfg
processor.save_to_file（new_file_name）
````
此函数用于将规范化输出保存到csv文件。
参数：
新文件名：保存规范化数据的新文件名

欢迎加入QQ群-->： 979659372

MLData 2.0.0

MLData的Python项目详细描述

推荐PyPI第三方库

djangocms-pai-custom-elements

utils-mini

jbzd-imgcat

irbench-python

walltask

sampling

hggit3

multilang

runjob

slick-framework

nbsphinx-link

nuaal

FastSync

KPHMMER

preptools

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

MLData 2.0.0

MLData的Python项目详细描述

推荐PyPI第三方库

djangocms-pai-custom-elements

utils-mini

jbzd-imgcat

irbench-python

walltask

sampling

hggit3

multilang

runjob

slick-framework

nbsphinx-link

nuaal

FastSync

KPHMMER

preptools

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签