PythonPandas:如何在指数增长的值之间进行插值?

2024-04-20 10:21:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫系列,它包含一种产品的价格变化(我的国家通货膨胀率很高),或者说,某个国家的冠状病毒感染者数量。这两个数据集中的值都呈指数增长;这意味着,如果你有[3,NaN,27]这样的东西,你会想要插值,这样在这种情况下,丢失的值会被9填充。我检查了Pandas文档中的插值方法,但是除非我遗漏了什么,否则我没有找到关于这种插值类型的任何信息

我可以手工做,你只需要取几何平均值,或者如果有更多的值,通过做(最终值/初始值)^(1/它们之间的距离)得到平均增长率,然后相应地相乘。但是在我的系列中有很多值需要填写,那么我如何自动完成呢?我想我错过了一些东西,因为这似乎是一些非常基本的东西

多谢各位


Tags: 数据方法文档pandas数量产品情况价格
1条回答
网友
1楼 · 发布于 2024-04-20 10:21:32

你可以取数列的对数,插值线性,然后把它转换回指数尺度

import pandas as pd
import numpy as np

arr = np.exp(np.arange(1,10))
arr = pd.Series(arr)
arr[3] = None
0       2.718282
1       7.389056
2      20.085537
3            NaN
4     148.413159
5     403.428793
6    1096.633158
7    2980.957987
8    8103.083928
dtype: float64
arr = np.log(arr) # Transform according to assumed process.
arr = arr.interpolate('linear') # Interpolate.
np.exp(arr) # Invert previous transformation.
0       2.718282
1       7.389056
2      20.085537
3      54.598150
4     148.413159
5     403.428793
6    1096.633158
7    2980.957987
8    8103.083928
dtype: float64

相关问题 更多 >