我有一个熊猫数据框:
df = DataFrame({'id':['a','b','b','b','c','c'], 'category':['z','z','x','y','y','y'], 'category2':['1','2','2','2','1','2']})
看起来像:
category category2 id
0 z 1 a
1 z 2 b
2 x 2 b
3 y 2 b
4 y 1 c
5 y 2 c
我想做的是groupby i d并返回另外两列作为唯一字符串的连接。
结果如下:
category category2 id
0 z 1 a
1 zxy 2 b
2 y 12 c
使用
groupby/agg
聚合组。对于每个组,应用set
查找唯一字符串,并应用''.join
连接字符串:要将
id
从索引移动到结果数据帧的列,请调用reset_index
:相关问题 更多 >
编程相关推荐