使用python删除2个不同文件中的重复行

2条回答

网友

1楼 · 编辑于 2024-05-16 09:17:32

导入df_A和df_B中的A.csv和B.csv
然后，附加df_ab的两个数据帧：
df_ab = df_a.append(df_b)
然后查找重复的行：
df_ab_only_duplicated_values = df_ab[df_ab.duplicated()]
将df_a附加到df_ab_only_duplicated_值，并删除所有重复的行：
df_a = df_a.append(df_ab_only_duplicated_values).drop_duplicates(keep=False)

网友

2楼 · 编辑于 2024-05-16 09:17:32

data_A = {'name': ['Pedro','Mirta','Jose'], 'age': [10,15,5]}
data_B = {'name': ['Pedro','ignacio','fernando', 'federico']}

A = pd.DataFrame(data=data_A)
B = pd.DataFrame(data=data_B)

A

    name    age
0   Pedro   10
1   Mirta   15
2   Jose    5

B

    name
0   Pedro
1   ignacio
2   fernando
3   federico

df = pd.merge(A, B, on='name', how='left', indicator=True)

df
    name    age _merge
0   Pedro   10  both
1   Mirta   15  left_only
2   Jose    5   left_only

df  = df[df['_merge'] != 'both']

df

    name    age _merge
1   Mirta   15  left_only
2   Jose    5   left_only

df.drop(columns='_merge', inplace=True)

df
    name    age
1   Mirta   15
2   Jose    5

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用python删除2个不同文件中的重复行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >