Python将根据条件创建正在运行的“id”

current_driver customer_id pu_actual_dt service 0 167 1214 2018-06-28 13:24:00 DED 1 167 1214 2018-06-28 13:25:00 DED 2 167 1214 2018-06-28 14:43:00 DED 3 243 1214 2018-06-28 19:41:00 DED 4 243 1214 2018-06-28 19:41:00 DED 5 250 1214 2018-06-28 17:19:00 DED 6 250 1214 2018-06-28 18:00:00 DED 7 250 1214 2018-06-28 18:18:00 DED 8 259 1214 2018-06-28 19:40:00 DED 9 259 1214 2018-06-28 19:40:00 DED 10 259 1214 2018-06-28 20:14:00 DED 11 260 1214 2018-06-28 17:39:00 DED 12 260 1214 2018-06-28 17:39:00 DED 13 260 1214 2018-06-28 17:39:00 DED 14 260 1214 2018-06-28 17:39:00 DED 15 263 1214 2018-06-28 18:34:00 DED 16 263 1214 2018-06-28 18:43:00 DED 17 263 1214 2018-06-28 18:43:00 DED

df['id'] = np.where((df['current_driver'] == df['current_driver'].shift(1) ) & (df['customer_id'] == df['customer_id'].shift(1)) & (df['pu_actual_dt'] < df['pu_actual_dt'].shift(1) + pd.Timedelta(minutes=30)) & (df['pu_actual_dt'] > df['pu_actual_dt'].shift(1) - pd.Timedelta(minutes=30)) & (df['service'] == 'DED'), df['id'].shift(1), df['id'].shift(1) + 1)

1条回答

网友

1楼 · 发布于 2024-05-13 21:01:13

您的np.where是一个好主意，但有一点不同：如果条件不满足，则分配1；如果条件满足，则分配None，例如：

df['id'] = np.where((df['current_driver'] == df['current_driver'].shift(1) ) 
& (df['customer_id'] == df['customer_id'].shift(1)) 
& (df['pu_actual_dt'] < df['pu_actual_dt'].shift(1) + pd.Timedelta(minutes=30)) 
& (df['pu_actual_dt'] > df['pu_actual_dt'].shift(1) - pd.Timedelta(minutes=30)) 
& (df['service'] == 'DED'), None, 1) # NOTE the None and 1 here are explain above

现在，您有了1每一行，您想增加id中的值，因此可以使用^{}、ffill和astype（使ge integer不是float），例如：

df['id'] = df['id'].cumsum().ffill().astype(int)

举个例子

    current_driver  customer_id        pu_actual_dt service  id
0              167         1214 2018-06-28 13:24:00     DED   1
1              167         1214 2018-06-28 13:25:00     DED   1
2              167         1214 2018-06-28 14:43:00     DED   2
3              243         1214 2018-06-28 19:41:00     DED   3
4              243         1214 2018-06-28 19:41:00     DED   3
5              250         1214 2018-06-28 17:19:00     DED   4
6              250         1214 2018-06-28 18:00:00     DED   5
7              250         1214 2018-06-28 18:18:00     DED   5
8              259         1214 2018-06-28 19:40:00     DED   6
9              259         1214 2018-06-28 19:40:00     DED   6
10             259         1214 2018-06-28 20:14:00     DED   7
11             260         1214 2018-06-28 17:39:00     DED   8
12             260         1214 2018-06-28 17:39:00     DED   8
13             260         1214 2018-06-28 17:39:00     DED   8
14             260         1214 2018-06-28 17:39:00     DED   8
15             263         1214 2018-06-28 18:34:00     DED   9
16             263         1214 2018-06-28 18:43:00     DED   9
17             263         1214 2018-06-28 18:43:00     DED   9

相关问题更多 >

编程相关推荐

热门问题

热门文章