一个简单的web爬行和web抓取框架

Crw的Python项目详细描述


Crwy

PyPI VersionDownload StatusBuild StatusLicense Status

简介

Crwy是一个轻量级的爬虫抓取框架,参考Scrapy框架结构开发而来。该框架提供了实用的爬虫模板,旨在帮助大家快速实现爬虫任务,高效开发。并为scrapy使用者提供通用轮子.。新增了gevent,使爬虫异步执行,速度更快。

运行环境

  • Python2 & Python3
  • Works on Linux, Mac OSX

依赖包

  • beautifulsoup4>=4.5.1
  • requests>=2.20.0
  • configparser>=3.5.0
  • SQLAlchemy>=1.0.14
  • pyssdb>=0.1.2
  • redis>=2.10.5,<3.0.0
  • gevent>=1.2.1
  • retrying>=1.3.3
  • imapclient>=2.0.0

安装

快速安装

pip install crwy

or 前往下载: https://pypi.python.org/pypi/Crwy/

更新日志

http://wuyue92tree.antio.top/opensource/crwy.html#更新日志

TODO

  • 完善scrapy_plugs
  • 完善selenium_api
  • 兼容python3

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在Eclipse中使用多个调用在一行上打印java   javajackson序列化问题。只有同一实体的第一个对象可以很好地序列化   Java中Deflate函数的等价充气   使用customlitview的java Android actionbar搜索   java“<T>T get()”是什么意思?(它有用吗?)   目标c使用CommonCrypto使用AES256加密,使用OpenSSL或Java解密   java在运行时更新资源文件   fileinputstream在java中访问并将数据写入现有文件   带集群的java Android Mapbox我希望每个功能都有不同的标记图像   java JDK8>JDK10:PKIX路径生成失败:SunCertPathBuilderException:找不到请求目标的有效证书路径   java使用Hk2生成具有指定构造函数参数的实例   为什么这个系统。出来Java中的println()打印到控制台?   java目录和文件名连接不起作用   使用mockito和通配符绘图的java