提前比较两个或多个csv文件

1条回答

网友

1楼 · 发布于 2024-05-29 07:55:53

使用标准函数和数据结构就足够了。让我们通过使用列表理解的词典列表来表示您的文件：

header = ('id', 'name', 'phone_number')

records_1 = [{k:v for k, v in zip(header, line.strip().split(' ')} } for line in open('path_to_file1', 'r')]
records_2 = [{k:v for k, v in zip(header, line.strip().split(' ')} } for line in open('path_to_file2', 'r')]

然后，如果要根据用户名检查记录，请使用名称为键、记录为值的字典：

records_1 = {rec['name']: rec for rec in records_1}
records_2 = {rec['name']: rec for rec in records_2}

如果您有重复的ID，请检查每个名称。如果是，则将其保存到输出：

seen = {}
output = []
for records, others in [(records_1, records_2), (records_2, records_1)]:
    for name, rec in records:
        if name in seen:
            continue

        if rec['id'] != others['name']['id']:
            output.append((name, rec, others['name']))

注意：我们可以使用itertools中的置换来推断置换列表： https://docs.python.org/3/library/itertools.html

希望这有帮助！你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

提前比较两个或多个csv文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >