Frontera的ScrapyCLOUD Hubstorage Frontier后端

hcf-backend的Python项目详细描述


Frontera的HCF(Hubstorage Crawl Frontier)后端

与scrapy一起使用时,请与由scrapy-frontera提供的scrapy调度程序一起使用。提供垃圾调度程序 不支持byFronterascrapy frontera是一个允许使用frontera后端的scrapy调度程序, 就像现在的那个,有一些零碎的项目。

请参阅位于backend.py的模块和类docstrings中的特定用法说明。 在scrapy-frontera README中可以看到一些用法示例。

有关在scrapyCLOUD工作流中使用hcf-backend的完整教程,请访问 shub-workflow Tutorialshub-workflow是定义蜘蛛工作流的框架 以及运行在scrapycloud上的脚本。这是一个强烈推荐的讲座,因为它记录了不同工具的集成,这些工具一起提供 最好的好处。

包还提供了一个方便的命令行工具,用于hubstorage前沿处理和操作: hcfpal.py。它支持转储、计数、删除、移动、列出等。 有关用法,请参见命令行帮助。

提供的另一个工具是crawlmanager.py。它有助于 消费者蜘蛛作业。前面提到的shub-workflow教程中也提供了使用示例。

安装

pip install hcf-backend

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java Date作为MyBatis中Oracle SELECT查询的参数[not get Response]   来自两个独立线程的并行java访问队列   如果数据已经存在,java Android Studio SQLite不会将数据插入数据库   mysql java spring项目仅在第一次运行时显示错误,再次运行后运行正常。为什么呢?   java SQL错误:1364,SQLState:HY000字段“rating_id”没有默认值/保存具有onetoone关系的子实体时   Tomcat中无cookie的java支持会话#重复   JAVAlang.RuntimeException:Android Studio   java CheckboxMultipleChice存储在SQL中   Kafka Java SimpleConsumer奇怪的编码   使用Hibernate保存servlet中处理的数据时遇到java错误   JavaSpring在运行时添加数据源   java使用一个类中另一个类的方法   java空值随Spring Rest资源更新   java Spring引导:为什么要使用OncePerRequestFilter?   java Android异步任务重用   java JTextField未按预期填充列?