循环查找两个字典中的匹配值

def compare_files(): with open('new.json', 'r') as current_data_file, open('old.json','r') as pre_data_file: for current_data, previous_data in zip(current_data_file, pre_data_file): data_current = json.loads(current_data) data_previous = json.loads(previous_data) for key, value in data_current.items(): if value not in data_previous: print "No Match" else: print "Match"

3条回答

网友

1楼 · 编辑于 2024-05-15 15:02:43

为了避免麻烦，您可以使用pandas（第三方库）直接读取数据，并且可以非常容易地进行分析

import pandas as pd

df=pd.DataFrame('new.json')
df2=pd.DataFrame('old.json')

df.name.isin(df2.name).replace({False:'No Match',True:'Match'}).tolist()

输出

^{pr2}$

网友

2楼 · 编辑于 2024-05-15 15:02:43

对于每个“当前”项目，您必须与所有“先前”项目进行比较，而不仅仅是同一位置的项目（这是“zip”将帮助您实现的目标）

data_current = [{"name": "d.json", "size": 1000},
                {"name": "c.json", "size": 1000},
                {"name": "b.json", "size": 1000}]

data_previous = [{"name": "a.json", "size": 1000},
                 {"name": "b.json", "size": 1000},
                 {"name": "c.json", "size": 1000}]

for current in data_current:
    result = "No Match"
    for previous in data_previous:
        if current["name"] == previous["name"]:
            result = "Match"
    print(result)

编辑：如果你想检查当前项与上一项，也检查前一项与当前项，你可以做以下操作（我在印刷品中添加了一些文本，以澄清发生了什么）

^{pr2}$

网友

3楼 · 编辑于 2024-05-15 15:02:43

你的代码有一些问题。在

当您执行if value not in data_previous:时，您实际上要检查value是否在data_previous的键中，而不是在其值中。
当你做zip(current_data_file, pre_data_file)时，你实际上是在看两个字典的对应的对。这里有3个字典，每个字典中有2个键，这就是为什么有6个输出行而不是3个输出行。换句话说，您是成对查找数据，而不是将数据中的每个字典与其他数据中的所有字典进行比较。

下面是一个示例代码：

def compare_files():
    with open('new.json', 'r') as current_data_file, open('old.json','r') as pre_data_file:
        # load both data 
        data_currents = [json.loads(line) for line in current_data_file]
        data_previous = [json.loads(line) for line in pre_data_file]

        # store the previous names for convenient lookup
        pre_names = set([data["name"] for data in data_previous])

        # loop through all current data for matching names
        for data in data_currents:
            print("Match" if data["name"] in pre_names else "No Match")

相关问题更多 >

编程相关推荐

热门问题

热门文章