此cod为真,但在本网站('hepsiburada.com')中返回403。我如何解决此问题?

2024-06-11 04:36:37 发布

您现在位置:Python中文网/ 问答频道 /正文

import aiohttp
import asyncio
async def main():
    async with aiohttp.ClientSession() as session:
        async with session.get('https://www.hepsiburada.com/') as response:
            print("Status:", response.status)
loop = asyncio.get_event_loop()
loop.run_until_complete(main())

此cod为真,但在本网站('hepsiburada.com')中返回403。我如何解决此问题


Tags: importcomloopasynciogetasyncaiohttpmain
1条回答
网友
1楼 · 发布于 2024-06-11 04:36:37

默认情况下,服务器试图通过在头中没有用户代理的情况下拒绝请求来防止web抓取。它不会返回成功状态代码206,而是返回禁止状态代码403

以下是我通常用于模拟浏览器的请求的标题:

WEB_HDRS = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
    'Accept': 'text/html,text/plain,application/xhtml+xml,application/xml,application/_json;q=0.9,image/webp,image/apng,*/*;q=0.8',
    'Accept-Charset': 'Windows-1252,utf-8;q=0.7,*;q=0.3',
    'Accept-Encoding': 'gzip, deflate, br',
    'Accept-Language': 'en-US,en;q=0.8;q=0.5',
    'Connection': 'keep-alive'
}

然后将headers关键字参数作为stated by the docs添加到aiohttp.ClientSession调用中:

aiohttp.ClientSession('https://www.hepsiburada.com/', headers=WEB_HDRS)

其他人如何创建会话,请参见this related question

相关问题 更多 >