如何按定义的时间间隔对pandas数据帧进行分组?

2024-06-01 01:12:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个这样的数据帧,我想每60分钟分组一次,并在06:30开始分组。

                           data
index
2017-02-14 06:29:57    11198648
2017-02-14 06:30:01    11198650
2017-02-14 06:37:22    11198706
2017-02-14 23:11:13    11207728
2017-02-14 23:21:43    11207774
2017-02-14 23:22:36    11207776

我正在使用:

df.groupby(pd.TimeGrouper(freq='60Min'))

我得到这个分组:

                      data
index       
2017-02-14 06:00:00     x1
2017-02-14 07:00:00     x2
2017-02-14 08:00:00     x3
2017-02-14 09:00:00     x4
2017-02-14 10:00:00     x5

但我在寻找这个结果:

                      data
index       
2017-02-14 06:30:00     x1
2017-02-14 07:30:00     x2
2017-02-14 08:30:00     x3
2017-02-14 09:30:00     x4
2017-02-14 10:30:00     x5

如何告诉函数每隔一小时在6:30开始分组?

如果.groupby(pd.TimeGrouper(freq='60Min')无法完成,那么最好的方法是什么?

敬礼和感谢


Tags: 数据函数dfdataindexpdx1x2
1条回答
网友
1楼 · 发布于 2024-06-01 01:12:57

^{}中的label='right'参数一起使用base=30

指定label='right'使开始分组的时间段从6:30(较高的一侧)开始,而不是从5:30开始。 此外,base被设置为0by default,因此需要将这些值偏移30以考虑日期的正向传播。

假设要聚合每个子组的第一个元素,然后:

df.groupby(pd.Grouper(freq='60Min', base=30, label='right')).first()
# same thing using resample - df.resample('60Min', base=30, label='right').first()

收益率:

                           data
index                          
2017-02-14 06:30:00  11198648.0
2017-02-14 07:30:00  11198650.0
2017-02-14 08:30:00         NaN
2017-02-14 09:30:00         NaN
2017-02-14 10:30:00         NaN
2017-02-14 11:30:00         NaN
2017-02-14 12:30:00         NaN
2017-02-14 13:30:00         NaN
2017-02-14 14:30:00         NaN
2017-02-14 15:30:00         NaN
2017-02-14 16:30:00         NaN
2017-02-14 17:30:00         NaN
2017-02-14 18:30:00         NaN
2017-02-14 19:30:00         NaN
2017-02-14 20:30:00         NaN
2017-02-14 21:30:00         NaN
2017-02-14 22:30:00         NaN
2017-02-14 23:30:00  11207728.0

相关问题 更多 >