防止输入值丢失

2024-05-16 09:45:30 发布

您现在位置:Python中文网/ 问答频道 /正文

目前我正试图用熊猫来填充因变量。(别问为什么。) 这是数据集

y.head(15)

Out[138]: 
0     13495.0
1     16500.0
2     16500.0
3     13950.0
4     17450.0
5     15250.0
6     17710.0
7     18920.0
8     23875.0
9         NaN
10    16430.0
11    16925.0
12    20970.0
13    21105.0
14    24565.0
Name: price, dtype: float64

如果我试图对这个变量进行插补,会发生一些奇怪的事情:

^{pr2}$

它显然是在做完全相反的事情。我不想删除NaN。我想把它们归责。在

对这种行为有什么解释吗。我做错什么了?在

谢谢你的帮助!在


Tags: 数据namenanout事情priceheaddtype
1条回答
网友
1楼 · 发布于 2024-05-16 09:45:30

应该使用轴=1而不是0。在

from sklearn.preprocessing import Imputer
mean_imputer_y = Imputer(strategy="mean", axis=1,missing_values=np.nan)

mean_imputer_y.fit_transform(df.Val)


array([[13495. , 16500. , 16500. , 13950. , 17450. , 15250. , 17710. ,
        18920. , 23875. , 18117.5, 16430. , 16925. , 20970. , 21105. ,
        24565. ]])

相关问题 更多 >