基于asyncio的异步python 3.6+web抓取微框架。
ruia的Python项目详细描述
概述
ruia是一个异步web抓取微框架,用asyncio
和aiohttp
编写,
目的是使抓取网址尽可能方便。
写更少,运行更快:
功能
- easy:声明式编程
- fast:由异步供电
- 可扩展:中间件和插件
- 强大的:javascript支持
安装
# For Linux & Mac pip install -U ruia[uvloop]# For Windows pip install -U ruia # New features pip install git+https://github.com/howie6879/ruia
教程
- Overview
- Installation
- Define Data Items
- Spider Control
- Request & Response
- Customize Middleware
- Write a Plugins
待办事项
- 用于调试的缓存,以减少请求限制
- 分布式爬网/抓取
贡献
ruia仍在开发中,请随时提出问题和请求:
- 报告或修复错误
- 需要或发布插件
- 编写或修复文档
- 添加测试用例
啊!!!注意:我们使用black来格式化代码