Scikitlearn输入法缩减维度

2024-06-17 14:58:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个332列的数据帧。我想插补值,以便能够使用scikitlearn的决策树分类器。我的问题是,由填充函数得到的数据列只有330。在

from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
cols = data.columns
new = imp.fit_transform(data)

print(data.shape,new.shape)
(34132, 332) (34132, 330)

Tags: 数据函数fromimport决策树newdata分类器
1条回答
网友
1楼 · 发布于 2024-06-17 14:58:24

根据documentation of ^{}

When axis=0, columns which only contained missing values at fit are discarded upon transform.

因此,这将删除所有缺少的值列。在

相关问题 更多 >