极慢的:可能是瓶装的

2024-04-26 03:29:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要帮助找到我的基于scrapy/python的scraper的瓶颈。你知道吗

我们正在从亚马逊(意大利目前)刮产品,但我们正在努力与整体要求吞吐量。 我们正在使用反向连接旋转代理:StormProxies(50个线程计划)+Proxyrotator(100个线程)+TOR,但即使是250多个可用线程,我们每秒只能刮取1/2个URL。。。 我们在OVH专用服务器、8核x16gbram、redis芹菜和docker上运行它作为附加工具

我是一名IT技术人员,软件是由我的印度开发人员开发的,如果你需要更多的信息或代码,请尽管问!你知道吗

提前谢谢


Tags: url代理产品scraper线程吞吐量计划tor