比较python中两个未排序文件的列….需要特定的输出

2024-06-16 11:27:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个大数据的管道分隔文件…需要比较他们的列..I列是主键。。。。。。在

例如。 一日在

123|NY|AA|500
569|NY|A|450
777|OK|B|250
899|OK|C|100

在二.dat在

^{pr2}$

输出应该是:

NY  column3 1
NY  column4 1
OK  column3 2
OK  column3 2

这意味着对纽约唱片公司来说。。。第三列对匹配的记录有一个差异..对于正常记录…第三列对匹配的记录有两个差异。。。。在

我想连接i列上的两个文件,这是我的主键,然后比较它们的列。在

请帮帮我:)


Tags: 文件数据管道记录公司ok差异dat
1条回答
网友
1楼 · 发布于 2024-06-16 11:27:12

如果对文件进行排序,如您所示的示例所示,您可以使用类似于合并排序的合并阶段的方式进行排序:

  1. 同时从两个文件的开头开始并从每个文件中读取一行。在
  2. 如果它们的主键匹配,则比较它们并输出所需的不同行。在
  3. 如果没有,您可以看到其中哪一个的键较小,然后继续 到该文件的下一行。在
  4. 重复2或3次,直到到达其中一个文件的末尾。在

如果文件没有排序,请先按主键排序。在

相关问题 更多 >