有没有办法合并两个数据帧并只保留一定数量的引用？

df1 = pd.DataFrame([[1, 2.1, 5, 0, 'a'], [7, 2.3, 5, 1, 'b'], [0, 2, 0, 1, 'c'], [9, 4, 4, 1, 'd']],columns=list('ABCDE')) df2 = pd.DataFrame([[3, 2, 5, 0, 1, 2], [3, 2.4, 5, 1, 9, 9], [9, 9, 5, 9, 4, 5], [0, 2, 5, 0, 1, 1], [1, 4, 4, 3, 8, 0]],columns=list('xBCyzw'))

x B C y z w A D E 0 3 2.0 5 0 1 2 1 0 a 1 3 2.0 5 0 1 2 7 1 b 0 3 2.0 5 1 9 9 1 0 a 1 3 2.0 5 1 9 9 7 1 b 0 0 2.0 5 0 1 1 1 0 a 1 0 2.0 5 0 1 1 7 1 b 3 1 4.0 4 3 8 0 9 1 d

1条回答

网友

1楼 · 发布于 2024-04-25 16:54:57

首先，循环df1和df2：

i, j = map(np.round, [df1, df2])

接下来，在B和C上合并：

v = pd.merge(i, j, on=['B', 'C'], how='inner', left_index=True)

将虚拟计数列添加到i并合并结果：

v['Count'] = v.groupby(['B', 'C']).cumcount()
i['Count'] = i.groupby(['B', 'C']).cumcount()

对i和新的count列执行第二次合并。你知道吗

v.merge(i[['B','C','Count']], on=['B','C','Count']).drop('Count', 1)

   A    B  C  D  E  x  y  z  w
0  1  2.0  5  0  a  3  0  1  2
1  1  2.0  5  0  a  3  1  9  9
2  9  4.0  4  1  d  1  3  8  0

相关问题更多 >

编程相关推荐

热门问题

热门文章