我有这样一个数据帧:
id date cc
aa1 01/01/2016 foo
aa1 01/05/2016 foo
aa1 01/09/2016 bar
aa1 01/05/2017 baz
aa2 04/03/2016 foo
aa2 09/04/2017 bar
aa3 02/02/2017 foo
我正在尝试创建如下数据帧:
id date_foo cc_foo date_bar cc_bar date_baz cc_baz
aa1 01/05/2016 foo 01/09/2016 bar 01/05/2017 baz
aa2 04/03/2016 foo 09/04/2017 bar null null
aa3 02/02/2017 foo null null null null
我的问题是:
-对于bb_foo
和cc_foo
,我只需要最新的记录,因为我的数据可以有多行相同的'id'
谢谢你的帮助
这很接近你需要的。您需要对除
date
之外的所有对象调用df.groupby
,然后在dfGroupBy.agg
中获取date
的最新值,然后执行unstack操作。你知道吗您拥有
MultiIndex
中的所有信息,而不是单独的cc_xxx
列。你知道吗相关问题 更多 >
编程相关推荐