如何使用requests获取网站的HTML代码?

-2 投票
1 回答
34 浏览
提问于 2025-04-12 23:41

我按照教程里的步骤全部做了一遍,但就是没有得到代码。虽然几天前一切都正常。

我写了一个简单的代码:

import requests
url = 'https://i-teka.kz/almaty/spisokaptek'
page = requests.get(url)
print(page.text)

然后运行后我得到了:

<html>
<head><title>403 Forbidden</title></head>
<body bgcolor="white">
<center><h1>403 Forbidden</h1></center>
<hr><center>nginx</center>
</body>
</html>

但应该得到完整的HTML代码。我不明白问题出在哪里。

1 个回答

0

可能是在检查各种头部信息。你可以尝试不同的头部信息,找到需要的那个。

或者

有一个叫做requestez的库,它可以简化这些操作,并自动完成。

你可以这样做:

pip install requestez

然后

import requestez
url = 'https://i-teka.kz/almaty/spisokaptek'
page = requestez.Session().get(url)
print(page)

输出的图片

页面的一部分html

撰写回答