我从一个没有所有标签的html页面中提取文本(使用Python和BeautifulSoup)。但是,标记不会替换为空白。例如,对于“blah blahDIVTAGblah”,我得到下面的文本“blah blahblah”。我怎样才能在第二个和第三个废话之间插入空白?我正在使用下面的代码。你知道吗
# kill all script and style elements
for script in soup(["script", "style"]):
script.extract()
代码来自BeautifulSoup Grab Visible Webpage Text
Tags:
只需使用^{} 将标记替换为空白:
相关问题 更多 >
编程相关推荐