Python中的数据预处理

2024-04-19 08:21:49 发布

您现在位置:Python中文网/ 问答频道 /正文

嘿,我是数据科学的新手,在这里我试图在一个列。但是,我遇到一个错误,指出“X未定义”。有人能帮我吗?你知道吗

#missing data
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values='NaN', strategy ='mean', axis =0)
imputer = imputer.fit(X[:, 1:3])
X[:, 1:3] = imputer.transform(X[:, 1:3])

Tags: 数据fromimportdata错误科学sklearnnan
2条回答

要查找单个列的缺失数据,必须使用以下代码。

数据集\名称['列\名称'].isnull().sum()

注意:如果我们需要找到丢失的数据,那么就不用担心X变量。 当您试图用一些平均值/中位数/模式值填充缺少的数据时,需要X和y变量。你知道吗

“X”表示numpy.ndarray公司减去目标变量。你知道吗

X = df.iloc[:, :-1].values

试试这个。应该有用。你知道吗

相关问题 更多 >