如何从lxml获取原始XML?
我正在使用以下代码来找到一个div:
parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)
div = tree.xpath("//div[@class='content']")[0]
我唯一的问题是,在找到这个div之后,我不想依赖lxml来提取这个div的内容:我只想获取这个div里面的原始XML内容。这样做可以吗,还是我必须完全放弃这种方法?
2 个回答
2
你试过用 tostring
吗?
raw_xml = etree.tostring(div)
15
我觉得你在寻找的是:
etree.tostring(div)