请求时返回相同的html页

2024-04-29 13:26:44 发布

您现在位置:Python中文网/ 问答频道 /正文

当我尝试在同一个网页中使用不同的URL时,会得到相同的html页面 我试了很多次,但都没有达到预期的效果

import requests
req=requests.get('https://cricbuzz.com')
reqq=requests.get('https://www.cricbuzz.com/cricket-match-highlights/22487/kxip-vs-kkr-52nd-match-indian-premier-league-2019')
print(req.text)
print(reqq.text)

两个print语句返回相同的html页,但实际上这不是预期的结果


Tags: texthttpscomurl网页gethtmlmatch
1条回答
网友
1楼 · 发布于 2024-04-29 13:26:44

你得到的不是同一页(或者至少我没有看到你的例子)

import requests
from bs4 import BeautifulSoup as bs

soup1 = bs(requests.get('https://cricbuzz.com').content, 'lxml')
soup2 = bs(requests.get('https://www.cricbuzz.com/cricket-match-highlights/22487/kxip-vs-kkr-52nd-match-indian-premier-league-2019').content, 'lxml')

print(soup1.select_one('[rel=canonical]')['href'])
print(soup2.select_one('[rel=canonical]')['href'])

enter image description here

你也可以这么做

print(req.text == reqq.text)

相关问题 更多 >