我有以下数据帧:
driver_id status dttm
9f8f9bf3ee8f4874873288c246bd2d05 free 2018-02-04 00:19
9f8f9bf3ee8f4874873288c246bd2d05 busy 2018-02-04 01:03
8f174ffd446c456eaf3cca0915d0368d free 2018-02-03 15:43
8f174ffd446c456eaf3cca0915d0368d enroute 2018-02-03 17:02
3列:驱动程序id、状态、dttm
我需要做的是按驱动程序id分组,并将所有状态及其各自的dttm值列成名为'driver_info'
的新列:
driver_id driver_info
9f8f9bf3ee8f4874873288c246bd2d05 [("free", 2018-02-04 00:19), ("busy", 2018-02-04 01:03)]
8f174ffd446c456eaf3cca0915d0368d [("free", 2018-02-03 15:43), ("enroute", 2018-02-03 17:02) ...]
在python3中如何做到这一点?你知道吗
我试过了
dfg = df.groupby("driver_id").apply(lambda x: pd.concat((x["status"], x["dttm"])))
但结果与我预期的不同。。。你知道吗
将^{} 与
list
和zip
一起用于元组列表:尝试:使用zip和apply(列表)
相关问题 更多 >
编程相关推荐