我有以下数据帧df
:
id datetime_event cameraid platenumber
11 2017-05-01T00:00:08 AAA 11A
12 2017-05-01T00:00:08 AAA 223
13 2017-05-01T00:00:08 BBB 11A
14 2017-05-01T00:00:09 BBB 33D
15 2017-05-01T00:00:09 DDD 44F
16 2017-05-01T01:01:00 AAA 44F
17 2017-05-01T01:01:01 BBB 44F
18 2017-05-01T01:01:09 AAA 556
19 2017-05-01T01:01:09 AAA 778
20 2017-05-01T01:01:11 EEE 666
对于每天的每一小时,我要选择多达100个条目,它们在(AAA,BBB)中有title
,并且相同的platenumber
依次出现在AAA
和BBB
。你知道吗
例如,对于上面给定的示例数据帧,输出如下:
id datetime_event cameraid platenumber
11 2017-05-01T00:00:08 AAA 11A
13 2017-05-01T00:00:08 BBB 11A
16 2017-05-01T01:01:00 AAA 44F
17 2017-05-01T01:01:01 BBB 44F
每天每小时的前100个条目可以通过以下方式提取:
df = df[df.groupby(pd.to_datetime(df['datetime_event']).dt.floor('H')).cumcount() < 100]
但是,如何按title
过滤和(最重要的是)如何按platenumber
合并,以便相同的platenumber值随后出现,首先在AAA
中,然后在BBB
中?你知道吗
使用filter:
编辑:
旧解决方案:
相关问题 更多 >
编程相关推荐