Pandas与重复键合并删除重复行或阻止其创建

Name,amount_x,id,category,amount_y John,500.25,GH10,Food,500.25 Helen,1250.00,GH11,Travel,1250.00 Helen,1250.00,GH11,Food,432.54 Adam,432.54,GH11,Travel,1250.00 Adam,432.54,GH11,Food,432.54 Sarah,567.12,GH12

2条回答

网友

1楼 · 编辑于 2024-05-16 14:44:03

我建议按^{}为countid值创建新的helper列，然后按以下值合并：

df1['g'] = df1.groupby('id').cumcount()
df2['g'] = df2.groupby('id').cumcount()

merged_table = pd.merge(df1,df2,on=["id", 'g'],how='outer')
print (merged_table)
    Name  amount_x    id  g Category  amount_y
0   John    500.25  GH10  0     Food    500.25
1  Helen   1250.00  GH11  0   Travel   1250.00
2   Adam    432.54  GH11  1     Food    432.54
3  Sarah    567.12  GH12  0      NaN       NaN

最后一次删除id：

^{pr2}$

细节：

print (df1)
    Name   amount    id  g
0   John   500.25  GH10  0
1  Helen  1250.00  GH11  0
2   Adam   432.54  GH11  1
3  Sarah   567.12  GH12  0

print (df2)
  Category   amount    id  g
0     Food   500.25  GH10  0
1   Travel  1250.00  GH11  0
2     Food   432.54  GH11  1

网友

2楼 · 编辑于 2024-05-16 14:44:03

在您的输出上（在merge之后），您可以在下面应用。我们也能做到，但我建议你想想办法。给你暗示。。。在

>>> df.drop_duplicates('Name',keep='first')
    Name  amount_x    id category amount_y
0   John    500.25  GH10     Food   500.25
1  Helen   1250.00  GH11   Travel     1250
3   Adam    432.54  GH11   Travel     1250
5  Sarah    567.12  GH12

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas与重复键合并删除重复行或阻止其创建

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >