Beautiful Soup将Unicode字符转换为HTML实体
这个错误发生在把文档加载到beautifulsoup之后。
文档里面有一些特殊字符,比如 “
,结果被转换成了 ΓÇ£
。
我想要输出这些特殊字符 “
。
1 个回答
2
使用这个 参考链接
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc)
print(soup.prettify(formatter="html"))