如何从lxml获取原始XML?

8 投票
2 回答
3876 浏览
提问于 2025-04-16 05:59

我正在使用以下代码来找到一个div:

parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)

div = tree.xpath("//div[@class='content']")[0]

我唯一的问题是,在找到这个div之后,我不想依赖lxml来提取这个div的内容:我只想获取这个div里面的原始XML内容。这样做可以吗,还是我必须完全放弃这种方法?

2 个回答

2

你试过用 tostring 吗?

raw_xml = etree.tostring(div)
15

我觉得你在寻找的是:

etree.tostring(div)

撰写回答