做什么插补器配合用nan值做什么?

2024-04-19 05:10:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用scikit学习库学习机器学习,当我看到来自Scikit-learn tutorial的代码时,我感到很困惑

它有以下代码:

import numpy as np
from sklearn.impute import SimpleImputer
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
imp.fit([[1, 2], [np.nan, 3], [7, 6]])       

X = [[np.nan, 2], [6, np.nan], [7, 6]]
print(imp.transform(X)) 

据我所知,插补器是用来填补缺失的值,它使用一些策略,如平均值,中位数或模式。但我不明白这三行代码在做什么

^{pr2}$

为什么它适合一个矩阵np.nan?这些配合如何影响imp.transform(X)?在


Tags: 代码fromimportnumpy机器asnptransform
1条回答
网友
1楼 · 发布于 2024-04-19 05:10:57

当您运行imp.fit时,它将计算每列中要替换的值(在本例中为mean)。在

您可以访问我在每个列中保留的内容:imp.statistics_

当您运行imp.transform时,它用相应的值(在imp.statistics_)完成NaN

相关问题 更多 >