美苏还胡言乱语

2024-05-13 01:01:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用BeautifulSoup解析一个网站:

name="Sai"
url="https://www.babynamesdirect.com/baby-names/indian/boy/begins/"+name
babynamespage=urlopen(url)
pagesoup=BeautifulSoup(babynamespage,"html.parser")
print(pagesoup)

当我这样做时,我看到的不是完整的HTML标记,而是:

**Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.**
      �]_��6��]wN�F�����챝x�k;q���DB$��h4�;��^�7���
&�{2�   ��g#�   �?���1&\

这是什么胡言乱语? 如何纠正这一点


Tags: namehttpscomurlnames网站wwwbaby
1条回答
网友
1楼 · 发布于 2024-05-13 01:01:43

所以,试着将请求与漂亮的汤一起使用。请求将获得数据,beautiful soup将处理从数据返回的文本

# try this once
import requests
from bs4 import BeautifulSoup
response = requests.get('https://www.babynamesdirect.com/baby- 
names/indian/boy/a')
soup = BeautifulSoup(response.text)
print(soup)

相关问题 更多 >