我不知道它是否相关,但我使用内联请求库。在
如果我向一个站点的API发出请求,它返回bad request(400),爬虫程序就会停止。我怎样才能让它继续?在
在下面的例子中,我检查了一本书的售价,这本书的ISBN是'0046594062994',因为他们没有这本书,所以返回一个错误的请求(您可以尝试输入下面的URL)。这对他们的书很管用。在
~~~~~~~~
@EDIT:我发现这是内联请求的已知问题。在
或不能忽略其回调响应继续执行。这可以通过使用标志句柄\u httpstatus \u all来克服。请参阅httperror中间件文档。“
我试着照医生说的做,但没成功。 我做错什么了?检查添加到示例代码的行。在
示例代码:
response2 = yield scrapy.Request("https://api.bookscouter.com/v3/prices/sell/0046594062994.json")
response2.meta['handle_httpstatus_all'] = True
jsonresponse = loads(response2.body)
您需要使用下面的命令将meta传递给请求本身
现在您正在设置
handle_httpstatus_all
每一个类似301
,302
重定向也将交给您。在所以你应该检查一下
^{pr2}$相关问题 更多 >
编程相关推荐