难以置信的基本lxml问题：获取lxml.etree.u元素的HTML/string内容？

2024-06-01 01:16:39 发布

男 | 程序猿一只，喜欢编程写python代码。

这是一个很基本的问题，我在文件里找不到

在以下方面：

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

如何获取<img/>标记的HTML？

我试过添加html_content()，但得到AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'。

另外，它是一个标签，里面有一些内容（例如<p>text</p>），我如何获得内容（例如text）？

非常感谢！

Tags：文件 text 标记 id tree 内容 img html

1条回答

网友

1楼 · 发布于 2024-06-01 01:16:39

我想事情会简单到：

from lxml.etree import tostring
inner_html = tostring(img)

至于从<p>内部获取内容，例如，某些选定元素el：

content = el.text_content()