如何从键是引用词典子集的嵌套词典创建平面词典?

2024-04-25 14:37:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在创建一个嵌套的引用字典来记录一个数据字典可能具有的所有可能的键以及对应的值,这些值是平面字典中要使用的所有键。你知道吗

数据字典的键将始终是引用字典的键的子集。平面字典的键将始终是参考字典值集的子集。你知道吗

换言之,给定一本参考词典,其赋值如下:

reference['agent']['address'] = 'agentaddress'
reference['agent']['zone']['id'] = 'agentzoneid'
reference['eventid'] = 'eventid'
reference['file']['hash'] = 'filehash'
reference['file']['name'] = 'filename'

数据字典的赋值如下:

nested['agent']['address'] = '172.16.16.16'
nested['eventid'] = '1234566778'
nested['file']['name'] = 'reallybadfile.exe'

代码应该生成一个字典,可以这样分配:

flat['agentaddress'] = '172.16.16.16'
flat['eventid'] = '1234566778'
flat['filename'] = 'reallybadfile.exe'

我永远不知道嵌套字典中的哪些字段将被填充,哪些不被填充,但我可以知道引用字典中的映射。你知道吗

我希望我需要使用递归将字典遍历到子字典中,并可能使用某种间接方法分别从引用字典值和嵌套字典键创建平面字典键和值。你知道吗

然而,我还不能生成任何有意义的代码。你知道吗

也许从一个非常高的层次来看,它可能是这样的:

def this(ref, nest, flat, *args):
    for (k,v) in reference:
        if type(v) is dict:
            this(?, ?, ?, ?)
        elif nested[path][to][k]:      
            flat[reference[path][to][k]] = nested[path][to][k]

其中[path][to][k]表示某种间接寻址的方法,*args是我要传递给递归函数的东西,这样我就有了一种方法,可以通过字典的嵌套性访问上下文,以便引用所需的键和值。你知道吗


Tags: to数据path方法字典address子集平面
2条回答

使用generator,这相当直接:

代码:

def make_flat_tuples(data, ref):
    for k, v in data.items():
        if isinstance(v, dict):
            for x in make_flat_tuples(v, ref[k]):
                yield x
        else:
            yield ref[k], v

flat = dict(make_flat_tuples(nested, reference))

测试代码:

from collections import defaultdict

reference = defaultdict(dict)
reference['agent'] = defaultdict(dict)

reference['agent']['address'] = 'agentaddress'
reference['agent']['zone']['id'] = 'agentzoneid'
reference['eventid'] = 'eventid'
reference['file']['hash'] = 'filehash'
reference['file']['name'] = 'filename'

nested = defaultdict(dict)

nested['agent']['address'] = '172.16.16.16'
nested['eventid'] = '1234566778'
nested['file']['name'] = 'reallybadfile.exe'

print(dict(make_flat_tuples(nested, reference)))

结果:

{
    'agentaddress': '172.16.16.16', 
    'eventid': '1234566778', 
    'filename': 'reallybadfile.exe'
}

@stephernauch答案很好,如果您不想使用生成器,只需重新格式化如下:

# r=reference, n=nested, f=final
def buildDict(r, n, f):
    for key in n.keys():
        if isinstance(n[key], dict):
            buildDict(r.get(key), n[key], f)
        else:
            if r.get(key):
                f[r.get(key)] = n[key]

相关问题 更多 >