如何从Beautiful Soup对象获取HTML

97 投票
1 回答
117195 浏览
提问于 2025-04-20 12:23

我有一个用bs4(Beautiful Soup 4)创建的对象列表:

>>> listing
<div class="listingHeader">
<h2>
....


>>> type(listing)
<class 'bs4.element.Tag'>

我想把这个对象的原始HTML内容提取出来,变成一个字符串。我试过以下方法:

>>> a = listing.contents
>>> type(a)
<type 'list'>

但是这样做不行。我该怎么做呢?

1 个回答

177

只需要获取这个字符串表示

html_content = str(listing)

这是一个没有经过美化的版本。

如果你想要一个美化过的版本,可以使用prettify()方法:

html_content = listing.prettify()

撰写回答