我必须比较两个大数据帧,如何在python中使用多处理来实现这一点?

2024-06-02 05:43:47 发布

您现在位置:Python中文网/ 问答频道 /正文

一个数据帧中的一行应与其他数据帧中的所有其他行进行比较,并应打印第二个数据帧中每行中相等的列名。 例如:

a=[['apple','cotton','pineapple']]
b=[['apple','lemon','pineapple'],['apple','cotton','mango'],['grapes','cotton','pineapple']]

考虑<强> a <强>是一行有3行的数据文件,<强> b>强>是一个3行和3列的数据帧: 比较a和b的第一行时,我的输出应为:

0 2
0 1
1 2

0是第一列的名称,1是第二列的名称,2是第三列的名称。 实际问题有一百万行。那个么我如何使用多处理来完成它呢


Tags: 数据名称apple数据文件lemoncottonpineapplemango