我需要使用scikit learn中的Imputer()
用该月的平均值填充缺失的温度值。在
首先,我根据月份将数据帧分成组。然后我调用imputer函数来计算该组的平均值并填充缺失的值。在
这是我写的代码,但它不起作用:
def impute_missing (data_1_group):
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit(data_1_group)
data_1_group=imp.transform(data_1_group['datetime'])
return(data_1_group)
for data_1_group in data_1.groupby(pd.TimeGrouper("M")):
impute_missing(data_1_group)
有什么建议吗?在
试试这个零钱
imp=imp.fit(data_1_group['datetime']) data_1_group=imp.transform(data_1_group['datetime'])
虽然我对scikit还不熟悉,但我还是推荐一种对我有用的解决方案。这是因为
1)imp object需要重写以适应,如第一行所示
2)它需要拟合和插补相同的数据集,在本例中,该数据集似乎是数据_1_group['datetime']
我希望这有帮助
相关问题 更多 >
编程相关推荐