将英文标题翻译成中文，并且不包含任何特殊字符或引号：“按照自定义的分组数据帧”

df = pd.read_csv('2015-09-01.csv', header=None,\ names=['ID','CITY', 'STATE', 'TIMESTAMP','TWEET'], \ low_memory=False, \ parse_dates=['TIMESTAMP'], usecols=['STATE','TIMESTAMP','TWEET'])

STATE,TIMESTAMP,TWEET 0,TX,2015-09-25 00:00:01,Wish I could have gone to the game 1,USA,2015-09-25 00:00:01,PSA: @HaileyCassidyy and I are not related in... 2,USA,2015-09-25 00:00:02,If you gonna fail don't bring some one down wi... 3,NJ,2015-09-25 00:00:02,@_falastinia hol up hol up I can't listen to t... 4,USA,2015-09-25 00:00:02,"Wind 0.0 mph ---. Barometer 30.235 in, Rising ..." 5,NJ,2015-09-25 00:00:03,WHY ISNT GREYS ANATOMY ON?! 6,MI,2015-09-25 00:00:03,@cody_cole06 you bet it is 7,WA,2015-09-25 00:00:04,"Could be worse, I guess, could be in a collisi..." 8,NY,2015-09-25 00:00:04,I'm totally using this graphic some day... tha... 9,USA,2015-09-25 00:00:04,@MKnightOwl @Andromehda LMAO I honestly didn't..

1条回答

网友

1楼 · 发布于 2024-04-25 07:46:46

要按频率对列分组，需要将其名称传递给Grouper的key参数，如下所示：

df.groupby(pd.Grouper(key='TIMESTAMP', freq='30T'))

编辑：

有关更多信息，请参阅^{}文档-但通常，当您groupby([a,b])时，您是按a和b的独特组合进行分组。在

所以在您的示例中，您是按所有唯一的时间戳值（df['TIMESTAMP']）分组的索引的时间分组符（pd.TimeGrouper如果没有指定键，则默认为索引）TypeError是因为索引不是datetimelike的。在

这也是为什么在将索引设置为'TIMESTAMP'后获得大量组的原因。在

相关问题更多 >

编程相关推荐

热门问题

热门文章