pandas预处理器:对pandas对象进行机器学习预处理
pdprpr的Python项目详细描述
pdprpr
==
**pandas预处理器**:预处理pandas对象以进行机器学习
代码块:明文
$pip install pdprpr
用法
----
假设您有以下要预处理的“数据帧”:
代码块::python
df=dataframe({
'num':[1,3,float('nan')],数值特性,需要在[0,1]
'cat':['p','q','r',分类特性中进行缩放,需要转换为伪var
'bin':[false,false,true],二进制特性,需要0/1
},columns=['num','cat','bin'])
num cat bin
0 1.0 p false
1 3.0 q false
2 nan r true
定义预处理设置:
。代码块::yaml
代码块::python
代码块::python
选项请参见“tests<;/tests/>;`,直到所有文档可用…
==
**pandas预处理器**:预处理pandas对象以进行机器学习
代码块:明文
$pip install pdprpr
用法
----
假设您有以下要预处理的“数据帧”:
代码块::python
df=dataframe({
'num':[1,3,float('nan')],数值特性,需要在[0,1]
'cat':['p','q','r',分类特性中进行缩放,需要转换为伪var
'bin':[false,false,true],二进制特性,需要0/1
},columns=['num','cat','bin'])
num cat bin
0 1.0 p false
1 3.0 q false
2 nan r true
定义预处理设置:
。代码块::yaml
代码块::python
代码块::python