用scikit-learn输入法预测缺失值

import numpy as np from sklearn.preprocessing import Imputer X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]]) print X imp = Imputer(missing_values='NaN', strategy='mean', axis=0) imp.fit_transform(X) print X

3条回答

网友

1楼 · 编辑于 2024-05-15 04:18:40

由于新数组是从transform函数返回的，因此，我必须将其存储在同一个数组（X）中以更改值

 from sklearn.preprocessing import Imputer
 imputer = Imputer(missing_values='NaN',strategy='mean',axis=0)  
 imputer = imputer.fit(X[:,1:3])
 X[:,1:3]= imputer.transform(X[:,1:3])

网友

2楼 · 编辑于 2024-05-15 04:18:40

每the documentation，sklearn.preprocessing.Imputer.fit_transform返回一个新数组，它不会改变参数数组。因此，最小的解决方案是：

X = imp.fit_transform(X)

网友

3楼 · 编辑于 2024-05-15 04:18:40

scikit learn version 0.20之后使用更改的输入模块。所以我们现在用的是不纯的

from sklearn.impute import SimpleImputer
impute = SimpleImputer(missing_values=np.nan, strategy='mean')
impute.fit(X)
X=impute.transform(X)

注意：

不使用“NaN”，而是使用“np.NaN”

不需要使用轴参数

我们可以使用imp或输入代替我的impute变量

相关问题更多 >

编程相关推荐

热门问题

热门文章