擅长:python、mysql、java
<p>我认为您的XML文档无效,因为尚未定义“gco”命名空间。在</p>
<p>我找不到一种方法来将定义作为parse命令的一部分提供给lxml。您可以按照@mjgpy3的建议操作文档来添加定义或删除前缀。在</p>
<p>另一种方法可能是使用HTML解析器,因为这对它将接受的内容没有那么严格。但是Beaware认为这会改变数据的结构来添加HTML头等等。在</p>
<pre><code>from lxml import etree
Parser = etree.HTMLParser()
XMLDoc = etree.parse(open('C:/Temp/Test.xml', 'r'), Parser)
Elements = XMLDoc.xpath('//characterstring')
for Element in Elements:
print Element.text
</code></pre>