计算粗糙网络的覆盖率

1条回答

网友

1楼 · 发布于 2024-04-26 13:32:04

常见的方法是，使用^{}记录错误并通过不返回任何内容退出回调。你知道吗

示例（需要产品价格）：

loader = ProductLoader(ProductItem(), response=response)
loader.add_xpath('price', '//span[@class="price"]/text()')
if not loader.get_output_value('price'):
    log.msg("Error fetching product price", level=log.ERROR)
    return

您还可以使用signals捕获并记录爬网时发生的所有类型的异常，请参阅：

how to process all kinds of exception in a scrapy project, in errback and callback?

这基本上遵循了Easier to ask for forgiveness than permission原则，当您让spider失败并在一个特定的地方（信号处理程序）捕获和处理错误时。你知道吗

其他想法：

您甚至可以将响应URL和错误回溯放置到数据库中，以便进行后续检查—这仍然是“日志记录”，但以一种结构化的方式进行，这样以后可以更方便地进行检查
一个好主意可能是创建自定义异常来表示不同的爬网错误，例如：MissingRequiredFieldError，InvalidFieldFormatError，您可以在爬网字段未通过验证的情况下引发这些异常。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

计算粗糙网络的覆盖率

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >