从索引+行匹配的数据帧中删除重复项

2024-04-27 04:36:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个pandasDataFrame,我想把它们连接在一起,这样我就可以在去掉重复项的情况下得到外部连接。我的问题是.drop_duplicates()在查找重复项时忽略索引。如果索引不同,那么它不应该是重复的。如果行索引和列重复,如何删除重复项?我唯一能想到的就是使用df.to_dict(),然后创建一个新的数据帧(效率非常低)。在

更新:

以下是我的数据示例:

from pandas import *
index1 = ['2012-05-2' + str(i) for i in range(0,6)]
data1 = {'rate': range(0,6)}
a = DataFrame(data1, index1)

index2 = ['2012-05-2' + str(i) for i in range(3,9)]
data2 = {'rate': range(3,9)}
b = DataFrame(data2, index2)

格伦


Tags: 数据indataframeforrate情况rangedrop