例如。如果我有两个数据集:
df1 = pd.DataFrame([[1, 2.1, 5, 0, 'a'], [7, 2.3, 5, 1, 'b'], [0, 2, 0, 1, 'c'], [9, 4, 4, 1, 'd']],columns=list('ABCDE'))
df2 = pd.DataFrame([[3, 2, 5, 0, 1, 2], [3, 2.4, 5, 1, 9, 9], [9, 9, 5, 9, 4, 5], [0, 2, 5, 0, 1, 1], [1, 4, 4, 3, 8, 0]],columns=list('xBCyzw'))
我只想基于列“B”和“C”合并它们,但我只希望合并行的实例与df1中的实例一样多。你知道吗
换句话说,我想在df2中根据“B”和“C”查找与df1中的行匹配的行,并将df2中的列追加到df1中。
我现在拥有的是
print(pd.merge(np.round(df2), np.round(df1), on=['B', 'C'], how='inner', left_index = True))
哪些输出
x B C y z w A D E
0 3 2.0 5 0 1 2 1 0 a
1 3 2.0 5 0 1 2 7 1 b
0 3 2.0 5 1 9 9 1 0 a
1 3 2.0 5 1 9 9 7 1 b
0 0 2.0 5 0 1 1 1 0 a
1 0 2.0 5 0 1 1 7 1 b
3 1 4.0 4 3 8 0 9 1 d
但由于在df1中只有两行B=2,C=5,所以我希望合并结果中也只有两行。df2中三个匹配行中的哪一个被合并并不重要。你知道吗
示例:
x B C y z w A D E
0 3 2.0 5 0 1 2 1 0 a
1 3 2.0 5 0 1 2 7 1 b
3 1 4.0 4 3 8 0 9 1 d
或:
x B C y z w A D E
0 3 2.0 5 1 9 9 1 0 a
1 3 2.0 5 1 9 9 7 1 b
3 1 4.0 4 3 8 0 9 1 d
或:
x B C y z w A D E
0 0 2.0 5 0 1 1 1 0 a
1 0 2.0 5 0 1 1 7 1 b
3 1 4.0 4 3 8 0 9 1 d
我想不出比循环更好的方法了。你知道吗
有什么想法吗?你知道吗
首先,循环
df1
和df2
:接下来,在
B
和C
上合并:将虚拟计数列添加到
i
并合并结果:对
i
和新的count列执行第二次合并。你知道吗相关问题 更多 >
编程相关推荐