用Scraproxy和Python#NinjaNeeded刮

2024-06-01 00:01:28 发布

您现在位置:Python中文网/ 问答频道 /正文

这里有能帮我的Python忍者吗?我已经学无止境了

我想使用python“requests”库,但我试图在不使用CONNECT的情况下使用HTTP隧道。这有可能吗

更准确地说,我想连接到一个没有https的代理,这样代理服务器仍然可以修改请求

我知道使用nodejs请求(禁用隧道)是可能的,但我不知道如何使用python实现它

https://github.com/request/request#proxies

我试图用Scraproxy(https://scrapoxy.io/)解决什么任务:

有时,我们想要Scrape的网站上的代理被阻止,我们必须告诉Scraproxy,他们应该重新启动特定的服务器。但目前还无法确定是哪台服务器发出了请求

对发出HTTPS请求的HTTP代理有一个特殊的HTTP请求。它被称为连接(与GET请求相反) 通过CONNECT请求,我们的Python客户端已经对HTTP包进行了加密,并将其转发给代理。 因为请求和响应都是加密的,所以Scraproxy无法添加额外的X-cache-proxyname头。这意味着我们无法关闭正确的代理

有人有主意吗(:(


Tags: httpsgithub服务器comhttp代理requestconnect