我有多个国家和年份的数据集。每个国家年组合都是数据中的一行。在这些列中,有多个变量。其中一些国家过去几年的数据缺失,产生了NaN。你知道吗
对于其中一些列,我想通过使用该列的现有数据来推断这些缺失的值。你知道吗
例如,我已经创建了groupby'country ISO'对象,它对于插值非常有用。你知道吗
这里有一个关于用函数外推缺失值的答案,但我想不出在groupby上下文中使用相同方法的方法。下面是我目前用于插值的groupby的代码。你知道吗
# Importing the libraries
import pandas as pd
# Importing the data
dataset = pd.read_excel(file.xlsx')
byISO = dataset.groupby(['country'])\
#Interpolation
dataset[['col1','col2']] = byISO[[
'col1','col2']]\
.apply(lambda i: i.interpolate(method='linear', limit_area='inside'))
现在,代码没有运行,但是我想做一些类似于我用插值所做的事情——以这样的方式得到一组外推的数字
目前没有回答
相关问题 更多 >
编程相关推荐