将不同IP地址绑定到Scrapy爬虫

1 投票
1 回答
996 浏览
提问于 2025-04-17 05:52

我该怎么把不同的公网IP地址绑定到scrapy爬虫上呢?而且,是否可以为每个源IP设置请求速率限制(比如说,CONCURRENT_REQUESTS_PER_SOURCE_IP)?

根据scrapy的文档,CONCURRENT_REQUESTS_PER_DOMAIN和CONCURRENT_REQUESTS_PER_IP似乎都是针对目标域名和目标IP的。

1 个回答

0

这是可能的,但你需要稍微修改一下Scrapy的核心部分。之前有人提出过一个修改建议,但看起来这个建议并没有被采纳。

根据这个修改建议中的信息,你应该能在几分钟内自己动手修补一下。

虽然这个修改建议已经有超过1年半的时间了,但目前相关文件的源代码还是和当初差不多。

撰写回答