Scrapy响应代码为200,但响应体为空/nu

2024-05-12 13:18:57 发布

您现在位置:Python中文网/ 问答频道 /正文

在蜘蛛能够正常工作的前提下,parse函数是正常的,但是我发现当响应状态代码为200时,有一小堆响应体随机为null,比如10个响应体中有2个是null。同时我用Chrome来检查这个请求的url,它保证打开的页面是好的。另外,我很确定我的ip没有被禁止,一切看起来都很正常。在

设置如下:

BOT_NAME = 'CategorySpider'
SPIDER_MODULES = ['CategorySpider.spiders']
NEWSPIDER_MODULE = 'CategorySpider.spiders'
ROBOTSTXT_OBEY = False
SPIDER_MIDDLEWARES = {
    'CategorySpider.middlewares.NodeMiddlewares': 100,
    'CategorySpider.middlewares.CategoryspiderSpiderMiddleware': 543,

}

'DEFAULT_REQUEST_HEADERS': {
            "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
            "accept-encoding": "gzip, deflate, sdch, br",
            "accept-language": "zh-CN,zh;q=0.8",
            "upgrade-insecure-requests": 1,

        },

AUTOTHROTTLE_ENABLED = True
AUTOTHROTTLE_MAX_DELAY = 60

有人帮我吗?非常感谢


Tags: 函数applicationparse状态xmlnullspider蜘蛛