我有一个年度体育锦标赛的时间序列数据,以及每一场比赛的日期。我想把比赛按赛季(年份)分组。每个季节从八月开始,到次年七月结束。在
我该如何按赛季对比赛进行分组- 季节(2016-2017)、季节(2017-2018)等。。在
This Answer涉及数据框重采样()可能有关联,但我不确定我该怎么做。在
日期列如下所示:
DATE
26/09/09
04/10/09
17/10/09
25/10/09
31/10/09
...
29/09/18
07/10/18
28/10/18
03/11/18
我想按季节分组,这样我就可以对聚集的数据执行可视化操作。在
更新:目前我的解决方案是将数据帧分成32组,因为我知道每个赛季有32场比赛。这是我使用的代码:
^{pr2}$但我更喜欢更优雅、更包含时间序列数据的数据,这样我就可以继续提问了。在
成功的关键是正确的分组,在您的例子中
pd.Grouper(key='DATA', freq='AS-AUG')
。在注意,
freq='AS-AUG'
声明您的组应该从 每年八月。在看下面的脚本:
如果打印结果:
^{pr2}$您将获得:
正如你所看到的,每个小组从8月1日开始到结束 七月三十一日。在
你可以对你的团队做任何你想做的事。在
Resampling使用
'A-JUL'
作为anchored offset alias应该可以做到:A
表示这是一个年间隔,-JUL
表示它在7月结束。在使用-
输出
^{pr2}$自定义季节分组
输出
相关问题 更多 >
编程相关推荐