我正在尝试使用BeautifulSoup解析一个网站:
name="Sai"
url="https://www.babynamesdirect.com/baby-names/indian/boy/begins/"+name
babynamespage=urlopen(url)
pagesoup=BeautifulSoup(babynamespage,"html.parser")
print(pagesoup)
当我这样做时,我看到的不是完整的HTML标记,而是:
**Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.**
�]_��6��]wN�F�����챝x�k;q���DB$��h4�;��^�7���
&�{2� ��g#� �?���1&\
这是什么胡言乱语? 如何纠正这一点
所以,试着将请求与漂亮的汤一起使用。请求将获得数据,beautiful soup将处理从数据返回的文本
相关问题 更多 >
编程相关推荐