Pythons HTMLParser 能否编辑/更改 HTML 元素的内文本,还是只能读取它?
我正在使用Python的HTMLParser.py模块。
我可以正确解析HTML,但有没有办法更改HTML元素的数据(内部文本)呢?
你知道我怎么用HTMLParser模块做到这一点吗?
1 个回答
0
不,HTMLParser就是用来解析你的HTML的。
你可能需要的是Beautiful Soup。它会创建一个解析树——这是一个用Python表示你文档中HTML元素的对象树。然后,你可以找到你想要的对象(元素),给它赋一个新值,搞定了!
这段内容是从文档中借来的:
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup("<b>Argh!</b>")
soup.find(text="Argh!").replaceWith("Hooray!")
print soup
# <b>Hooray!</b>