数据帧groupby值列表

driver_id status dttm 9f8f9bf3ee8f4874873288c246bd2d05 free 2018-02-04 00:19 9f8f9bf3ee8f4874873288c246bd2d05 busy 2018-02-04 01:03 8f174ffd446c456eaf3cca0915d0368d free 2018-02-03 15:43 8f174ffd446c456eaf3cca0915d0368d enroute 2018-02-03 17:02

driver_id driver_info 9f8f9bf3ee8f4874873288c246bd2d05 [("free", 2018-02-04 00:19), ("busy", 2018-02-04 01:03)] 8f174ffd446c456eaf3cca0915d0368d [("free", 2018-02-03 15:43), ("enroute", 2018-02-03 17:02) ...]

2条回答

网友

1楼 · 编辑于 2024-05-29 05:22:13

将^{}与list和zip一起用于元组列表：

df1 = (df.groupby('driver_id')
         .apply(lambda x: list(zip(x['status'], x['dttm'])))
         .reset_index(name='driver_info'))
print (df1)
                          driver_id  \
0  8f174ffd446c456eaf3cca0915d0368d   
1  9f8f9bf3ee8f4874873288c246bd2d05   

                                         driver_info  
0  [(free, 2018-02-03 15:43), (enroute, 2018-02-0...  
1  [(free, 2018-02-04 00:19), (busy, 2018-02-04 0...

网友

2楼 · 编辑于 2024-05-29 05:22:13

尝试：使用zip和apply（列表）

df['driver_info'] = list(zip(df['status'], df['dttm']))
df = df.groupby('driver_id')['driver_info'].apply(list)

相关问题更多 >

编程相关推荐

热门问题

热门文章