Pandas合并具有相同索引的行的单元格

2024-04-30 00:36:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个df,其中有一些行,如:

1 | FII  4440 | Faria Lima     | 14° | Cascione, Pulino, Boulos
1 | FII  4440 | Faria Lima     | 15° | Warrant
1 | FII  4440 | Faria Lima     | 16° | Warrant
2 | Malls     | São Paulo      | N   |  None
3 | Malls     | Cidade Jardim  | N   |  None

我需要输出如下所示:

1 | FII  4440 | Faria Lima     | 14º, 15º, 16° | Cascione, Pulino, Boulos, Warrant
2 | Malls     | São Paulo      | N             |    None
3 | Malls     | Cidade Jardim  | N             |    None

也就是说,对于同一个索引(第一列),它应该连接字符串,而不重复列。有人能帮我吗


Tags: 字符串nonedflimawarrantcidadepaulofii
2条回答

您可以这样做:

df1 = df.groupby([0, 1, 2])[4].apply(','.join).reset_index()
df2 = df.groupby([0, 1, 2])[3].apply(','.join).reset_index()
df = df1.merge(df2)
print(df)

   0        1             2                                       4            3
0  1  FII4440     FariaLima  Cascione,Pulino,Boulos,Warrant,Warrant  14°,15°,16°
1  2    Malls      SãoPaulo                                    None            N
2  3    Malls  CidadeJardim                                    None            N

我注意到分组条件只能是最左边的列

假设列名是C0C1,…,请尝试:

df.groupby('C0').agg(lambda grp: ', '.join(grp.unique())).reset_index()

相关问题 更多 >