如何使用Pandas群比与一个时间段，并找到平均数在同一时间段内多年

utctime sender recipient message 0 2016-11-25 18:00:25.877000+00:00 Person1 Me message1 1 2016-11-25 18:50:58.694000+00:00 Person2 Me message2 2 2016-11-25 18:54:41.871000+00:00 Me Person2 message3 3 2016-11-25 18:54:58.583000+00:00 Person2 Me message4 4 2016-11-25 19:01:19.694000+00:00 Me Person2 message5

def time_of_day(data, tz_info): utctime = data.utctime.dt.tz_convert(tz_info) data['timeofday'] = pd.to_datetime({'year': 2017, 'month': 1, 'day': 1, 'hour': utctime.dt.hour, 'minute': utctime.dt.minute, 'second': utctime.dt.second}) return data

sf = pytz.timezone('US/Pacific') timedelta = '10min' grouper = pd.Grouper(key='timeofday', freq=timedelta) data = time_of_day(data, sf) # data is returned in time of day for tz freq = data.groupby(grouper).count()

1条回答

网友

1楼 · 发布于 2024-04-24 23:14:27

IIUC，您需要从“utctime”中提取小时和分钟，将分钟分类到bins，并对count消息的小时和分钟执行groupby：

df['Hour'] = pd.to_datetime(df['utctime']).dt.hour
df['Minute'] = pd.to_datetime(df['utctime']).dt.minute

df['minute_bins'] = pd.cut(df['Minute'], bins=(-0.01,20,40,60), labels=('0 < 20', '20 < 40', '40 < 60'))

df.groupby(['Hour', 'minute_bins'])['message'].count()

print(df)

Hour  minute_bins
18    0 < 20         1
      40 < 60        3
19    0 < 20         1

相关问题更多 >

编程相关推荐

热门问题

热门文章