如何从Beautiful Soup对象获取HTML
我有一个用bs4(Beautiful Soup 4)创建的对象列表:
>>> listing
<div class="listingHeader">
<h2>
....
>>> type(listing)
<class 'bs4.element.Tag'>
我想把这个对象的原始HTML内容提取出来,变成一个字符串。我试过以下方法:
>>> a = listing.contents
>>> type(a)
<type 'list'>
但是这样做不行。我该怎么做呢?
1 个回答
177
只需要获取这个字符串表示:
html_content = str(listing)
这是一个没有经过美化的版本。
如果你想要一个美化过的版本,可以使用prettify()
方法:
html_content = listing.prettify()