Python lxml规范化字典中所有子元素

# Add OVAL ID attrib in normalized Vulnerability dictionary for idx, vuln in enumerate(vuln_list): vuln['oval_id'] = root.xpath("//ns:definition", namespaces=ns)[idx].attrib['id'] criteria = root.xpath("//ns:definition[@id='" + vuln_list[idx]['oval_id'] + "']/ns:criteria/*", namespaces=ns) vuln['criteria'] = [crit.items() for crit in criteria]

{'cisco_adv_id': 'cisco-sa-20131030-asr1000', 'cisco_adv_url': 'http://tools.cisco.com/security/center/content/CiscoSecurityAdvisory/cisco-sa-20131030-asr1000', 'criteria': [[('comment', 'Affected IOSXE configuration'), ('operator', 'AND')], [('comment', 'IOSXE version is affected'), ('test_ref', 'oval:org.cisecurity:tst:6178')]], 'cve_id': 'CVE-2013-5547', 'oval_id': 'oval:org.cisecurity:def:4321', 'title': 'Cisco IOS XE Software Malformed EoGRE Packet Denial of Service ' 'Vulnerability'},

1条回答

网友

1楼 · 发布于 2024-06-16 09:37:13

如果使用递归，则相对容易。你知道吗

对于第一个示例，我尝试保持与您相同的组织：每个条件都是一个包含属性和子级的列表，但都存储为dict而不是tuple

def get_data(el):
    if el.tag =='criteria':
        data = {'criteria': [el.attrib]}
        for desc in el.iterchildren():
            data['criteria'].append(get_data(desc))
        return data
    else:
        return {'criterion': el.attrib}

问题是返回的数据不容易使用：每个条件最多可以包含三个dict（属性、条件或条件），您必须进行一些测试才能知道哪个是哪个。在第二个示例中，您预先知道列表包含什么：如果键是criteria，您就知道您将拥有一个criteria dict列表。你知道吗

def get_data(el):
    if el.tag =='criteria':
        data = {}
        data.update(el.attrib)
        for desc in el.iterchildren():
            key = desc.tag
            if not key in data:
                data[key] = []
            data[key].append(get_data(desc))
        return data
    else:
        return el.attrib

相关问题更多 >

编程相关推荐

热门问题

热门文章