如何用空白替换文本中提取的HTML标记?

2024-04-26 20:48:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我从一个没有所有标签的html页面中提取文本(使用Python和BeautifulSoup)。但是,标记不会替换为空白。例如,对于“blah blahDIVTAGblah”,我得到下面的文本“blah blahblah”。我怎样才能在第二个和第三个废话之间插入空白?我正在使用下面的代码。你知道吗

# kill all script and style elements
    for script in soup(["script", "style"]):
        script.extract()

代码来自BeautifulSoup Grab Visible Webpage Text


Tags: 代码标记文本stylehtmlscript页面标签