美苏还胡言乱语

2024-05-13 01:01:43 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试使用BeautifulSoup解析一个网站：

name="Sai"
url="https://www.babynamesdirect.com/baby-names/indian/boy/begins/"+name
babynamespage=urlopen(url)
pagesoup=BeautifulSoup(babynamespage,"html.parser")
print(pagesoup)

当我这样做时，我看到的不是完整的HTML标记，而是：

**Some characters could not be decoded, and were replaced with REPLACEMENT CHARACTER.**
      �]_��6��]wN�F�����챝x�k;q���DB$��h4�;��^�7���
&amp;�{2�   ��g#�   �?���1&\

这是什么胡言乱语？如何纠正这一点

Tags： name https com url names 网站 www baby

1条回答

网友

1楼 · 发布于 2024-05-13 01:01:43

所以，试着将请求与漂亮的汤一起使用。请求将获得数据，beautiful soup将处理从数据返回的文本

# try this once
import requests
from bs4 import BeautifulSoup
response = requests.get('https://www.babynamesdirect.com/baby- 
names/indian/boy/a')
soup = BeautifulSoup(response.text)
print(soup)

美苏还胡言乱语

相关问题更多 >

编程相关推荐

热门问题

热门文章

美苏还胡言乱语

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >