难以置信的基本lxml问题:获取lxml.etree.u元素的HTML/string内容?

2024-06-01 01:16:39 发布

您现在位置:Python中文网/ 问答频道 /正文

这是一个很基本的问题,我在文件里找不到

在以下方面:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

如何获取<img/>标记的HTML?

我试过添加html_content(),但得到AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'

另外,它是一个标签,里面有一些内容(例如<p>text</p>),我如何获得内容(例如text)?

非常感谢!


Tags: 文件text标记idtree内容imghtml
1条回答
网友
1楼 · 发布于 2024-06-01 01:16:39

我想事情会简单到:

from lxml.etree import tostring
inner_html = tostring(img)

至于从<p>内部获取内容,例如,某些选定元素el

content = el.text_content()

相关问题 更多 >