获取当前节点所有子节点的值

1 投票
1 回答
3153 浏览
提问于 2025-04-16 02:49

我想获取一个

里面的所有值。

<div>xyz <span> abc </span> def</div>

这是代码

the_page="<div>xyz <span> abc </span> def</div>"
doc = libxml2dom.parseString(the_page, html=1)
divs=doc.getElementsByTagName("div")
print divs[0].firstChild.nodeValue

这段代码只打印了“xyz”。我试着直接用print divs[0].nodeValue,但那样会出错。 我想要获取所有的文本。我该怎么做呢?

1 个回答

1

对于你的:

divs=doc.getElementsByTagName("div")

使用:

childs = divs[0].childNodes

然后,你就可以抓取它们。每个子节点都包含一个子节点的列表和节点值。

for child in childs :
    if child.childNode == []:
        print child.nodeValue
    else :
        ## Recurse

撰写回答