外推按数据框分组的缺失数据

2024-04-25 00:02:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我有多个国家和年份的数据集。每个国家年组合都是数据中的一行。在这些列中,有多个变量。其中一些国家过去几年的数据缺失,产生了NaN。你知道吗

对于其中一些列,我想通过使用该列的现有数据来推断这些缺失的值。你知道吗

例如,我已经创建了groupby'country ISO'对象,它对于插值非常有用。你知道吗

这里有一个关于用函数外推缺失值的答案,但我想不出在groupby上下文中使用相同方法的方法。下面是我目前用于插值的groupby的代码。你知道吗

# Importing the libraries
import pandas as pd

# Importing the data
dataset = pd.read_excel(file.xlsx')

byISO = dataset.groupby(['country'])\

#Interpolation
dataset[['col1','col2']] = byISO[[
                'col1','col2']]\
     .apply(lambda i: i.interpolate(method='linear', limit_area='inside'))

现在,代码没有运行,但是我想做一些类似于我用插值所做的事情——以这样的方式得到一组外推的数字


Tags: the数据方法代码国家countrydatasetcol2