在lxml.html中如何获取节点的文本、子节点及其内容?
我正在使用Python的lxml.html库。我有一个XPath表达式可以获取某个节点的文本,但我想要的是包括子标签及其内容的所有文本。我该怎么做呢?
2 个回答
0
我不太清楚你用的是什么标签,所以我随便举个例子。
你可以试试这样的:
result = lxml.html.parse(url).xpath("//tr/td/a/text()")
//tr的意思是从当前节点开始,选择文档中所有符合条件的节点,不管它们在哪里。
你可以用这个('//')表达式来获取子标签的标签。
1
Element
的 text_content 方法会返回这个元素的文本内容,包括它里面孩子元素的文本,但不会包含任何格式标记。