未通过midd代理请求

import scrapy from scrapy.crawler import CrawlerProcess class ProxySpider(scrapy.Spider): name = "proxiedscript" start_urls = ["https://httpbin.org/ip"] def parse(self,response): print(response.meta) print(response.text) if __name__ == "__main__": c = CrawlerProcess({'USER_AGENT':'Mozilla/5.0'}) c.crawl(ProxySpider) c.start()

2条回答

网友

1楼 · 编辑于 2024-04-20 07:10:09

您需要检查以下行的日志输出：[scrapy.middleware] INFO: Enabled downloader middlewares:以查看活动下载程序中间件的列表。如果中间件处于活动状态，那么它应该在列表中。你知道吗

据我所知，scrapy.contrib模块的用法现在已被弃用。 Scrapy: No module named 'scrapy.contrib'

带有定制中间件的代码几乎可以使用scrapy命令行工具
scrapy crawl proxiedscript。你知道吗

Hovewer如果需要以脚本形式启动scrapy应用程序，则爬虫程序进程需要首先^{}。
或将DOWNLOADER_MIDDLEWARES设置定义为CrawlerProcess的参数：

c = CrawlerProcess({
    'USER_AGENT':'Mozilla/5.0',
    'DOWNLOADER_MIDDLEWARES':{
        #'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware': 110,#deprecated in scrapy 1.6
        'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware':110, #enabled by default
        'proxyspider.middleware.ProxiesMiddleware': 100, 
                              },
    })

网友

2楼 · 编辑于 2024-04-20 07:10:09

可能返回None而不是Request？返回Request将阻止任何其他下载程序中间件运行。你知道吗

https://docs.scrapy.org/en/latest/topics/downloader-middleware.html#scrapy.downloadermiddlewares.DownloaderMiddleware.process_request

相关问题更多 >

编程相关推荐

热门问题

热门文章