在Pandas中如何计算特定时间范围内的出现次数?
我正在查看急诊室的数据,想要建立一个时间序列,记录每小时到达急诊室的病人数量。我的数据集中有一列是病人到达的日期和时间(比如第一行可能是'1/12/13, 19:21:12',但我会把它转换成pandas的日期范围)。
这些数据是存储在一个pandas的DataFrame里。DataFrame中的日期列是以Series的形式存放的。
我该如何汇总和存储每小时的病人到达数量,并把它们绘制成时间序列呢?我希望每个数据点能表示成“1月15日下午1点到2点之间有5位病人到达”。
1 个回答
1
应该就这么简单:
patients.set_index('arrival_time').resample('H', how='count').plot()