pythonxml解析etree find element X by position

<?xml version="1.0" encoding="UTF-8" standalone="yes"?> <CHECKLIST> <VULN> <STIG_DATA> <VULN_ATTRIBUTE>Vuln_Num</VULN_ATTRIBUTE> <ATTRIBUTE_DATA>V-38438</ATTRIBUTE_DATA> </STIG_DATA> <STIG_DATA> <VULN_ATTRIBUTE>Rule_Title</VULN_ATTRIBUTE> <ATTRIBUTE_DATA>More text.</ATTRIBUTE_DATA> </STIG_DATA> <STIG_DATA> <VULN_ATTRIBUTE>Vuln_Discuss</VULN_ATTRIBUTE> <ATTRIBUTE_DATA>Some text here</ATTRIBUTE_DATA> </STIG_DATA> <STIG_DATA> <VULN_ATTRIBUTE>IA_Controls</VULN_ATTRIBUTE> <ATTRIBUTE_DATA></ATTRIBUTE_DATA> </STIG_DATA> <STIG_DATA> <VULN_ATTRIBUTE>Rule_Ver</VULN_ATTRIBUTE> <ATTRIBUTE_DATA>Gen000000</ATTRIBUTE_DATA> </STIG_DATA> <STATUS>NotAFinding</STATUS> <FINDING_DETAILS></FINDING_DETAILS> <COMMENTS></COMMENTS> <SEVERITY_OVERRIDE></SEVERITY_OVERRIDE> <SEVERITY_JUSTIFICATION></SEVERITY_JUSTIFICATION> </VULN>

1条回答

网友

1楼 · 发布于 2024-06-16 10:46:58

可以通过位置找到元素，但是使用了不正确的XPath语法。以下任一行都应该有效：

DataTag = curTag.find("./STIG_DATA[5]/ATTRIBUTE_DATA")    # Note: 5, not 4
DataTag = curTag.findall("./STIG_DATA/ATTRIBUTE_DATA")[4] # Note: 4, not 5

但是，我强烈建议不要使用它。不能保证STIG_DATA的Rule_Ver实例始终是第五项。在

如果您可以更改为lxml，那么这就可以了：

^{pr2}$

由于不能使用lxml，因此必须手动迭代STIG_DATA元素，如下所示：

def GetData(curTag):
    for stig in curTag.findall('STIG_DATA'):
        if stig.find('VULN_ATTRIBUTE').text == 'Rule_Ver':
            return stig.find('ATTRIBUTE_DATA')

以下是添加了错误检查的完整程序GetData()：

import xml.etree.ElementTree as ET
doc = ET.parse('test.ckl')
root=doc.getroot()

TagList = doc.findall("./VULN")

def GetData(curTag):
    for stig in curTag.findall('STIG_DATA'):
        vuln = stig.find('VULN_ATTRIBUTE')
        if vuln is not None and vuln.text == 'Rule_Ver':
            data = stig.find('ATTRIBUTE_DATA')
            return data

for curTag in TagList:
    StatusTag = curTag.find("STATUS")
    CommentTag = curTag.find("COMMENTS")
    DataTag = GetData(curTag)
    print "GEN:[%s] Status:[%s] Comments: %s" %( DataTag.text, StatusTag.text, CommentTag.text)

参考文献：

相关问题更多 >

编程相关推荐

热门问题

热门文章