从lxml选择属性值
我想用一个xpath表达式来获取一个属性的值。
我原本以为下面的代码可以正常运行:
from lxml import etree
for customer in etree.parse('file.xml').getroot().findall('BOB'):
print customer.find('./@NAME')
但是这却报了错:
Traceback (most recent call last):
File "bob.py", line 22, in <module>
print customer.find('./@ID')
File "lxml.etree.pyx", line 1409, in lxml.etree._Element.find (src/lxml/lxml.etree.c:39972)
File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 272, in find
it = iterfind(elem, path, namespaces)
File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 262, in iterfind
selector = _build_path_iterator(path, namespaces)
File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 246, in _build_path_iterator
selector.append(ops[token[0]](_next, token))
KeyError: '@'
我是不是想错了,觉得这应该能工作?
2 个回答
2
作为一个可能有用的补充,这里介绍如何获取一个元素的属性值,当这个元素有多个属性时,这种方法与另一个元素的唯一区别就是这个属性。
例如,给定以下的文件 file.xml:
<?xml version ="1.0" encoding="UTF-8"?>
<level1>
<level2 first_att='att1' second_att='foo'>8</level2>
<level2 first_att='att2' second_att='bar'>8</level2>
</level1>
你可以通过以下方式访问属性 'bar':
import lxml.etree as etree
tree = etree.parse("test_file.xml")
print tree.xpath("//level1/level2[@first_att='att2']/@second_att")[0]
88
find
和 findall
只实现了 XPath 的一部分功能。它们的存在是为了和其他 ElementTree 的实现(比如 ElementTree
和 cElementTree
)保持兼容。
而 xpath
方法则可以完全使用 XPath 1.0 的所有功能:
print customer.xpath('./@NAME')[0]
不过,你也可以使用 get
方法:
print customer.get('NAME')
或者使用 attrib
方法:
print customer.attrib['NAME']