比较两个csv文件中的唯一条目

2024-04-24 18:36:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前在一家报纸发行公司工作,需要将我们系统中的客户数据与报纸发行商提供的客户数据进行比较。两组数据都以CSV格式提供,我需要找到一个CSV中的客户而不是另一个CSV中的客户,一个在我们的CSV中但不在出版商的CSV中的客户意味着我们交付论文而没有获得报酬。这显然是我们想知道的。你知道吗

两个CSV都包含诸如姓氏、名字、地址、每天需要的报纸数量等栏。你知道吗

正如我上面提到的,我只需要运行某种脚本来列出所有只在其中一个CSV中但不在两个CSV中的客户,以及同时在两个CSV中但收到不同数量论文的客户(即,只在我们的数据库中接收周末论文,但在另一个数据库中接收工作日论文)

我一直在用excel来做这件事,把两组数据合并到一个页面上,按姓氏排序,然后手动删除匹配的客户。你知道吗

更复杂的是,1/10 high street和unit 1,10 high st是一样的,但我不知道是否有可能内置这种容错功能,我想忽略街道号,只让脚本查看街道名称、姓氏和收到的送货数量。你知道吗

以下是我们的CSV示例:

                                      sun   mon tue wed thu fri sat
JACKSON JANET     3 LONG COURT          1   1   1   1   1   1   1
JACKSON NICHOLAS  26 HERITAGE Court     1   1   1   1   0   1   1

JACKSON CHRIS     36/8 POTT Circuit     0   0   0   0   1   1   1

以下是发布者的CSV示例:

                                      sun   mon tue wed thu fri sat
JACKSON J         3 LONG CRT            1   1   1   1   1   1   1
JACKSON NICHOLAS  26 HERITAGE Crt       1   1   1   1   1   1   1
JACKSON MICHAEL   44 BRENTWICK DR       1   0   0   0   0   0   0
JACKSON CHRIS     Unit 36,8 POTT Cct    0   0   0   0   1   1   1

我希望剧本可以忽略珍妮特和克里斯,即使数据不完全匹配,突出尼古拉斯(由于丢失周四的报纸)和迈克尔(由于他不在两个CSV)


Tags: csv数据脚本数据库示例数量客户街道