基于芹菜的网络爬虫管理平台,用于管理分布式网络蜘蛛,而不考虑语言和框架。

crawlab-server的Python项目详细描述


#基于芹菜的网络爬虫管理平台,管理分布式网络蜘蛛,不分语言和框架,不分语言和框架,不分语言和框架,不分语言和框架,不分语言和框架,不分语言和框架,不分语言和框架的分布式网络蜘蛛的管理平台,基于芹菜的网络爬虫管理平台,基于芹菜的网络爬虫管理平台,不分语言和框架,不分语言和框架的分布式网络蜘蛛的管理平台。文件` py `配置api和数据库连接。


前端节点实际上是工作节点用芹菜定义。节点正在运行并连接到任务队列(例如redis)以接收和运行任务。由于蜘蛛需要部署到节点,用户应在部署前指定其IP地址和端口。


web应用程序将自动发现蜘蛛项目。


只需单击spider detail页面上的“deploy”按钮,然后为部署选择正确的节点。

它将为爬网触发一个任务,您可以在“任务”页中详细查看该任务。

用户可以在任务详细信息页中查看任务状态信息并登录。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
junit cucumber为什么会找到“runTest.java”来运行测试?   在Eclipse中找不到java KeyPairGenerator   java NotSerializableException即使在实现Serializable之后   noclassdeffounderror(java字符串连接)为什么会出现这种异常?   java Guice:将接口绑定到由动态代理创建的实例   使用Spring数据neo4j创建空间索引时发生java错误   java对于需要在50多个excel文件上运行并且每个文件平均包含25k行的项目,最佳的方法是什么   javaNIO中的java缓冲区写入/发送消息问题   如何在Java/eclipse中添加不调用super()的警告   JavaSpring:mvcUrl映射错误的id   java应该在getInstance或构造函数中使用Init方法吗?   安卓中的java空指针异常错误   java Jsoup不能完全获取原始html代码