通过从pandas datafram中的所有非nan合并相同的索引行

2024-04-25 19:09:31 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个具有重复索引的稀疏数据帧。如何合并相同的索引行，使冲突行中的所有非NaN数据保持不变？在

我知道，使用内置的drop_duplicates函数可以实现非常接近的目标，但只能使用相同的索引保留第一行行或最后一行：

df.reset_index().drop_duplicates(subset='index', keep='first').set_index('index').sort_index()

我需要的是来自任何冲突行的所有非nan值。在

在此之前：

之后：

Tags：数据函数目标 df index nan sort 内置

1条回答

网友
1楼 · 发布于 2024-04-25 19:09:31

df.reset_index().groupby('index').max()
这将从冲突行中选择非NaN值。或者，如果同一列的多个冲突行中存在值，则为最大值。在