一个调度蜘蛛的守护进程

scrapy-do的Python项目详细描述


https://api.travis-ci.org/ljanyst/scrapy-do.svg?branch=masterhttps://coveralls.io/repos/github/ljanyst/scrapy-do/badge.svg?branch=masterPyPI Version

scrapy do是一个守护进程,它提供了一种运行Scrapyspider的方便方法。它既可以立即做一次;也可以 可以按指定的时间间隔定期运行它们。它的灵感来自 scrapyd但是从头开始写的。它 带有rest api、命令行客户机和交互式web界面。

快速启动

  • 使用pip

    安装scrapy-do
    $ pip install scrapy-do
    
  • 在前台启动守护程序:

    $ scrapy-do -n scrapy-do
    
  • 打开另一个终端窗口,下载Scrapy'sQuotesBot示例,然后 将代码推送到服务器:

    $ git clone https://github.com/scrapy/quotesbot.git
    $cd quotesbot
    $ scrapy-do-cl push-project
    +----------------+
    | quotesbot      |
    |----------------|
    | toscrape-css   |
    | toscrape-xpath |
    +----------------+
  • 安排一些工作:

    $ scrapy-do-cl schedule-job --project quotesbot \
        --spider toscrape-css --when 'every 5 to 15 minutes'+--------------------------------------+
    | identifier                           |
    |--------------------------------------|
    | 0a3db618-d8e1-48dc-a557-4e8d705d599c |
    +--------------------------------------+
    
    $ scrapy-do-cl schedule-job --project quotesbot --spider toscrape-css
    +--------------------------------------+
    | identifier                           |
    |--------------------------------------|
    | b3a61347-92ef-4095-bb68-0702270a52b8 |
    +--------------------------------------+
  • 看看发生了什么:

    Active Jobs

    默认情况下,web界面位于http://localhost:7654处。

从源构建

以下两个步骤都要求安装nodejs。

  • 检查工作是否正常:

    $ pip install -rrequirements-dev.txt
    $ tox
    
  • 制造轮子:

    $ python setup.py bdist_wheel
    

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
rest如何在java中访问摘要身份验证   Java如何获取类和jar文件的Java代码   java查找给定数字中的十进制数   类Lcom/google/firebase/FirebaseApp中没有虚拟方法zzbzo()Z;或者它的超类   javahibernate二级缓存&JUnit   java如何自动添加XMLAnnotations   使用java在google drive中获取上传的文件名?   Java使用GLFW复制可转移图像   java Android Intent不会发送值   使用Objectify在Google CloudDatastore中使用java findRecord   照片编辑器中的java pointerIndex超出范围异常   java使用Spring Boot/JPA生成唯一字段的正确方法是什么?   安卓无法在firebase上上载图像,因为拒绝了之前失败的java类上的reinit。类错误   java如何在thymeleaf中构建绝对URL?   从Linux到2012r2 Active Directory的LDAPS Java查询的最低要求是什么   泛型Java接口反射   带地址字段的java Google地图标记   关于即将推出的forkjoin框架的java资源   jsp中的BEAN法则