在lxml.html中如何获取节点的文本、子节点及其内容?

1 投票
2 回答
1542 浏览
提问于 2025-04-17 00:25

我正在使用Python的lxml.html库。我有一个XPath表达式可以获取某个节点的文本,但我想要的是包括子标签及其内容的所有文本。我该怎么做呢?

2 个回答

0

我不太清楚你用的是什么标签,所以我随便举个例子。

你可以试试这样的:

result = lxml.html.parse(url).xpath("//tr/td/a/text()")

//tr的意思是从当前节点开始,选择文档中所有符合条件的节点,不管它们在哪里。

你可以用这个('//')表达式来获取子标签的标签。

1

Elementtext_content 方法会返回这个元素的文本内容,包括它里面孩子元素的文本,但不会包含任何格式标记。

撰写回答