下面是一个大型xml文件的片段。我想提取特定的名称空间,例如xmlns:dc="http://purl.org/dc/elements/1.1/"
。目前我可以这样做:
tree = etree.parse(file)
for element in tree.getiterator('{http://www.openarchives.org/OAI/2.0/}record'):
for leaf in element.getiterator('{http://purl.org/dc/elements/1.1/}subject'):
print(leaf)
问题是我希望为{http://purl.org/dc/elements/1.1/}命名空间中的多个标记获取数据。我还想简化一些事情,并一直在研究如何使用xpath,但似乎无法解决。我可以使用xpath吗?如果可以的话,如何使用?更重要的是,它对我的目标是否更好?在
以下是xml:
^{pr2}$
不清楚您到底想访问什么,但请尝试以下方法:
在python或lxml文档之外阅读一些关于xpath的文档。 它们告诉您如何在python中使用xpath,但实际上并不是xpath教程。在
注意find()、findall()方法采用ElementPaths,这是一种 类xpath表达式的有限子集。在
相关问题 更多 >
编程相关推荐