基于asyncio的异步python 3.6+web抓取微框架。

ruia的Python项目详细描述


traviscodecovPyPI - Python VersionPyPIDownloadsgitter

概述

ruia是一个异步web抓取微框架,用asyncioaiohttp编写, 目的是使抓取网址尽可能方便。

写更少,运行更快

功能

  • easy:声明式编程
  • fast:由异步供电
  • 可扩展:中间件和插件
  • 强大的:javascript支持

安装

# For Linux & Mac
pip install -U ruia[uvloop]# For Windows
pip install -U ruia

# New features
pip install git+https://github.com/howie6879/ruia

教程

  1. Overview
  2. Installation
  3. Define Data Items
  4. Spider Control
  5. Request & Response
  6. Customize Middleware
  7. Write a Plugins

待办事项

  • 用于调试的缓存,以减少请求限制
  • 分布式爬网/抓取

贡献

ruia仍在开发中,请随时提出问题和请求:

  • 报告或修复错误
  • 需要或发布插件
  • 编写或修复文档
  • 添加测试用例

啊!!!注意:我们使用black来格式化代码

谢谢

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java IntelliJ找不到依赖项选项卡   java向字符串数组string[]添加元素并在Junit中测试结果   如何在eclipse中获取活动java项目的名称   如何使用java在mysql中插入时间   java ArrayList更新了插入一行,但Jtable仍然没有刷新   如何在JavaSwing中命名坐标(点)   java Matcher/模式不打印   java错误地设置了arraylist   使用UsernamePasswordCredential提供程序的java列表Azure AD   java在HTTP请求中设置UTC时间   未加载事件:jquery完整日历Java集成   java Maven插件依赖项无法从内部repo解析依赖项   Maven更新重置Java版本   java如何向中添加图片。带有Apache POI XWPF的docx,但不指定其大小   Java最大函数递归