获取当前节点所有子节点的值
我想获取一个
里面的所有值。
<div>xyz <span> abc </span> def</div>
这是代码
the_page="<div>xyz <span> abc </span> def</div>"
doc = libxml2dom.parseString(the_page, html=1)
divs=doc.getElementsByTagName("div")
print divs[0].firstChild.nodeValue
这段代码只打印了“xyz”。我试着直接用print divs[0].nodeValue,但那样会出错。 我想要获取所有的文本。我该怎么做呢?
1 个回答
1
对于你的:
divs=doc.getElementsByTagName("div")
使用:
childs = divs[0].childNodes
然后,你就可以抓取它们。每个子节点都包含一个子节点的列表和节点值。
for child in childs :
if child.childNode == []:
print child.nodeValue
else :
## Recurse