2024-04-25 19:09:31 发布
网友
我有一个具有重复索引的稀疏数据帧。如何合并相同的索引行,使冲突行中的所有非NaN数据保持不变?在
我知道,使用内置的drop_duplicates函数可以实现非常接近的目标,但只能使用相同的索引保留第一行行或最后一行:
drop_duplicates
df.reset_index().drop_duplicates(subset='index', keep='first').set_index('index').sort_index()
我需要的是来自任何冲突行的所有非nan值。在
在此之前:
之后:
df.reset_index().groupby('index').max()
这将从冲突行中选择非NaN值。或者,如果同一列的多个冲突行中存在值,则为最大值。在
这将从冲突行中选择非NaN值。或者,如果同一列的多个冲突行中存在值,则为最大值。在
相关问题 更多 >
编程相关推荐