将日期列表按月份y分组

2024-04-20 12:11:29 发布

您现在位置:Python中文网/ 问答频道 /正文

raw_data = ["2015-12-31", "2015-12-1" , "2015-1-1",
            "2014-12-31", "2014-12-1" , "2014-1-1",
            "2013-12-31", "2013-12-1" , "2013-1-1",]
expected_grouped_bymonth = [("2015-12", #dates_in_the_list_occured_in_december_2015)
                            , ...
                            ("2013-1",  #january2013dates)]

或者作为口述

^{pr2}$

我有一个表示日期的字符串列表。我想要的是一个元组列表,或者一个字典,它计算每年或每月发生的次数。我试图做的是与groupby相关的事情。我不明白如何根据groupby函数使用TimeGrouper。在

引发的异常是:

TypeError: Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex,
           but got an instance of 'RangeIndex'

from itertools import groupby
for el in data:
    if 'Real rates - Real volatilities' in el['scenario']:
        counter += 1
        real_records_dates.append(pd.to_datetime(el['refDate']))
print("Thera are {} real records.".format(counter))

BY_YEAR = 'Y'
BY_MONTH = 'M'
BY_DAY = 'D'

real_records_df = pd.DataFrame(pd.Series(real_records_dates))

real_records_df.groupby(pd.TimeGrouper(freq=BY_MONTH))

(如果更容易的话,也可以假设从字典og {date1:1, date2:2, ...}开始。我的问题只与groupby有关。)


Tags: in列表databy字典counterrealel
1条回答
网友
1楼 · 发布于 2024-04-20 12:11:29

如果你想知道一个日期每月和每年发生的频率,你可以使用一个defaulftdict

raw_data = ["2015-12-31", "2015-12-1", "2015-1-1",
        "2014-12-31", "2014-12-1", "2014-1-1",
        "2013-12-31", "2013-12-1", "2013-1-1",
        ]

from collections import defaultdict

dates = defaultdict(lambda:defaultdict(int))

for s in raw_data:
    k, v = s.rsplit("-", 1)
    dates[k][v] += 1

print(dates)

或者,如果您只想按月份、年份对日期列表进行分组:

^{pr2}$

相关问题 更多 >