大Pandas倒向时间窗均值的计算

df_dict={'startDate': ['2015-01-01','2015-01-05','2015-01-18','2015-01-25', '2015-02-02','2015-02-03','2015-02-04','2015-02-17', '2015-03-03','2015-03-04','2015-03-07','2015-03-11', '2015-04-04','2015-04-05','2015-04-17','2015-04-19'], 'price':[200,250,270,240,100,120,130,140,300,310,330,370,400,410,420,440], '250_index': [1,2,1,2,1,2,1,2,1,2,1,2,1,2,1,2]} df=pd.DataFrame(df_dict)

time_interval index past_30_avg past_60_avg past_90_avg '2015-01-01' 1 0 0 0 2 0 0 0 '2015-01-31' 1 235 0 0 2 245 0 0 '2015-03-02' 1 115 175 0 2 130 187 0 '2015-04-01' 1 315 240 221 2 340 235 238

1条回答

网友

1楼 · 发布于 2024-04-26 18:06:36

考虑^{}表示30天的平均值（每月汇总），然后^{}表示60天和90天^{}：

tdf = df.groupby([pd.Grouper(key='startDate', freq='30D', label='right'), '250_index']).mean()\
              .reset_index().rename(columns={'price': 'past_30_avg'})
print(tdf)

tdf['past_60_avg'] = tdf.groupby('250_index')['past_30_avg'].transform(lambda x: x.rolling(2).mean())
tdf['past_90_avg'] = tdf.groupby('250_index')['past_30_avg'].transform(lambda x: x.rolling(3).mean())

#    startDate  250_index  past_30_avg  past_60_avg  past_90_avg
# 0 2015-01-31          1          235          NaN          NaN
# 1 2015-01-31          2          245          NaN          NaN
# 2 2015-03-02          1          115        175.0          NaN
# 3 2015-03-02          2          130        187.5          NaN
# 4 2015-04-01          1          315        215.0   221.666667
# 5 2015-04-01          2          340        235.0   238.333333
# 6 2015-05-01          1          410        362.5   280.000000
# 7 2015-05-01          2          425        382.5   298.333333

相关问题更多 >

编程相关推荐

热门问题

热门文章