我目前有多个数据帧,如下所示:
df1
id1 id2 col_sum_1 col_sum_2
0 13 15 3 4
1 15 234 7 6
2 63 627 1 7
df2
id1 id2 col_sum_1 col_sum_2
0 13 15 8 3
1 15 234 2 3
2 63 627 8 1
df3
id1 id2 col_sum_1 col_sum_2
0 13 15 3 5
1 15 234 7 7
2 63 627 4 4
我想从这些数据帧创建一个新的数据帧,当id1和id2匹配时,我将在其中加入。然后将col_sum_1和col_sum_2相加得到以下结果
df
id1 id2 col_sum_1 col_sum_2
0 13 15 14 12
1 15 234 16 16
2 63 627 13 12
是否有方法将id1等于id2等于的3个表连接起来,然后将col_sum_1和col_sum_2的行相加,以创建一个新的数据帧,该数据帧基于表中的连接和总和
首先,可以连接数据帧:
注意:以上内容为问题中的3个“输入”数据帧生成所需的数据帧。如果所有“输入”数据帧只有具有相同的
id1
和id2
值对的行,则不需要执行下一步然后,您可以在“输入”数据帧中找到公共
id1
和id2
对:最后,您可以创建一个
MultiIndex
,并使用它仅保留带有common_pairs
的行:merge()
所有三个数据帧然后sum(axis=1)
(跨行)。最后清理列相关问题 更多 >
编程相关推荐