我想对这个问题采用类似的方法Select DataFrame rows between two dates 但有时间范围。你知道吗
我有一个餐厅订单数据集,包含时间和订单类型。早餐、午餐和晚餐都有时间间隔。你知道吗
时间间隔:
breakfast: (8:00:00 - 12:00:00) lunch: (12:00:01-16:00:00) dinner: (16:00:01-20:00:00)
数据集示例:
order_type time
0 Lunch 13:24:30
1 Dinner 18:28:43
2 Dinner 17:17:44
3 Lunch 15:46:28
4 Lunch 12:33:48
5 Lunch 15:26:11
6 Lunch 13:04:13
7 Lunch 12:13:31
8 Breakfast 08:20:16
9 Breakfast 08:10:08
10 Dinner 18:08:27
11 Breakfast 10:42:15
12 Dinner 19:09:17
13 Dinner 18:28:43
14 Breakfast 09:21:07
我的time
列最初是object
类型,我将其转换为timedelta64[ns]
。你知道吗
我想创建三个时间范围,每个order_type
一个。然后用它们来验证我的数据集的准确性。你知道吗
当我有三个范围时,我可以运行如下for loop
:
for order in dirtyData['order_type']:
for time in dirtyData['time']:
if order=='Breakfast' and time not in BreakfastRange:
*do something*
我提到了documentation和这个post。应用between_time
但我不断出错。你知道吗
您可以使用
pd.cut
:输出:
我们可以使用
pd.cut
,然后只需将输出与原始的order_type
匹配即可相关问题 更多 >
编程相关推荐