通过为数据帧之间的每个重复行仅删除一行来合并两个数据帧

2条回答

网友

1楼 · 编辑于 2024-05-13 03:11:59

这是一种方式：

import pandas as pd

df1 = pd.DataFrame({'colA': [1, 1, 1],
                    'colB': [2, 1, 5],
                    'colC': [3, 2, 4]})

df2 = pd.DataFrame({'colA': [1, 1, 1],
                    'colB': [2, 2, 1],
                    'colC': [3, 3, 2]})

df1 = df1.groupby(['colA', 'colB', 'colC']).size().reset_index(name='count1')
df2 = df2.groupby(['colA', 'colB', 'colC']).size().reset_index(name='count2')

df_merged = pd.concat((df1, df2)).fillna(0)

df_final = df_merged.groupby(['colA', 'colB', 'colC'])\
    .apply(lambda x: x['count2'].sum() - x['count1'].sum())\
    .loc[lambda p: p != 0]\
    .reset_index()\
    .drop(0, axis=1)

print(df_final)

输出：

   colA  colB  colC
0     1     2     3
1     1     5     4

网友

2楼 · 编辑于 2024-05-13 03:11:59

最后我通过下面的方法得到了答案。大卫的回答也很有魅力

result1 = result.groupby(['colA','colB','colC'], as_index=False).size()
result1 = result1[result1['size'] % 2 != 0]

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过为数据帧之间的每个重复行仅删除一行来合并两个数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >