在scraperwiki运行scrapy的助手集合

scrapyrwiki的Python项目详细描述


运行由 ScrapyScraperWiki

在不使用scrapy cli的情况下启动scraper

示例:

fromscrapy.confimportsettingsfromscrapyrwikiimportrun_spiderdefmain():run_spider(MySpider(),settings)if__name__=='__main__':main()

将生成的数据保存到scraperwiki

只需将“scrapyrwiki.pipelines.scraperwikipipeline”添加到项目管道

示例:

fromscrapy.confimportsettingsfromscrapyrwikiimportrun_spiderdefscraperwiki():options={'SW_SAVE_BUFFER':5,'SW_UNIQUE_KEYS':{"MyItem":['url']},'ITEM_PIPELINES':['scrapyrwiki.pipelines.ScraperWikiPipeline'],}settings.overrides.update(options)run_spider(MySpider(),settings)if__name__=='scraper':scraperwiki()

检查ci中的spider合同

只需使用run_测试启动spider即可

示例:

fromscrapyrwikiimportrun_testsfromscrapy.confimportsettingsrun_tests(MySpider(),"output.xml",settings)

注意:用于测试http缓存。在脚本所在的目录中 启动时必须有scrapy.cfg(scrapy需要它来识别这是一个scraper 目录)和带有http缓存数据库的.scrapy目录。

输出是xunit格式,在Jenkins

记录哨兵的刮刀错误

安装scrapy-sentry并设置 环境变量sentry_dsn,带有sentry键。scrapyrwiki将处理 一切为了你。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java对多个for循环使用一个整数有什么好处?   要求的Java枚举错误返回类型   使用AOP的Java Spring MVC CSRF令牌   PHP ZF2中的java 安卓登录按钮和远程web登录   java将双精度转换为整数转换为字符串,并在TxtField CodeNameOne中输出   java代码不断向后向数组中输入值   如何使用Java获取git信息?   当使用DateUtils类的parseDateStructive()方法时,java异常无法解析日期   java执行示例Flink kafka consummer   java触发REST调用时无法解释某些汉字   java错误:不兼容的类型:<null>如果使用安卓 room(!\u cursor.isNull(null))则无法转换为int   java Spring引导构建正常,但Heroku部署失败   我无法使用ORMLite库在java(安卓)中执行“WITH RECURSIVE”子句   java JavaFX图像加载错误