使用Scrapy和C抓取HTTPS页面

2024-05-16 23:01:46 发布

男 | 程序猿一只，喜欢编程写python代码。

我想如果有可能使用scrapy+crawlera抓取https页面。到目前为止，我使用的Python请求具有以下设置：

proxy_host = 'proxy.crawlera.com'
proxy_port = '8010'
proxy_auth = 'MY_KEY'
proxies    = {
    "https": "https://{}@{}:{}/".format(proxy_auth, proxy_host, 
proxy_port),
    "http": "http://{}@{}:{}/".format(proxy_auth, proxy_host, proxy_port)
}
ca_cert    = 'crawlera-ca.crt'

res = requests.get(url='https://www.google.com/',
    proxies=proxies,
    verify=ca_cert
)

我想通过Scrapy进入异步执行。我知道有scrapy-crawlera插件，但我不知道当我有证书时如何配置它。还有一件事困扰着我。Crawlera有不同的定价计划。最基本的是C10，它允许10个并发请求。这是什么意思？我需要在中设置CONCURRENT_REQUESTS=10设置.py？在

Tags： https com auth format http host cert port

1条回答

网友

1楼 · 发布于 2024-05-16 23:01:46

在scrapy-crawlera documentation中有一个Configuration部分，可以解决您的大部分疑问。在

使用Scrapy和C抓取HTTPS页面

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Scrapy和C抓取HTTPS页面

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >