用于web抓取的scratinghub页面对象模式

web-poet的Python项目详细描述


PyPI VersionSupported Python VersionsBuild StatusCoverage reportDocumentation Status

web-poet实现网页抓取的页面对象模式。 它定义了一个编写web数据提取代码的标准,它允许 代码是可移植的和可重用的。在

许可证是BSD 3条款。在

安装

pip install web-poet

它需要python3.6+。在

概述

网络诗人是一个图书馆,它定义了如何写作和组织的标准 web数据提取代码。在

如果web抓取代码是作为web诗人页面对象编写的,那么它可以被重用 在不同的情况下。例如,可以在 IPython notebook,然后隔离测试,然后插入 或者用作某些基于aiohttp的自定义的一部分 网页抓取框架。在

目前,可以使用以下集成:

更多信息请参见Documentation。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java需要设置框架。可设置大小(false)以重新绘制()   java我对PDF文件感到困惑   为什么是太阳。jvm。热点。调试器。DebuggerException:无法打开二进制文件`?   设置结果为textview时出现java空指针异常   我应该使用什么同步原语在Java中实现事件驱动程序框架?   java为什么WindowClosing处理程序在退出程序之前不执行后台任务?   如何将“20170712T18:43:04.000Z”转换为安卓或java中的相对时间?   Java,获取按键的时间长度,currentTimeMillies()始终为24   maven构建的java可执行Jar找不到logback。xml   java在其外部的函数中使用for循环中的值   java如何以表格格式将不同长度的数据对齐   java Play 2.5 WebSocket连接构建   maven而非eclipse的java强制转换问题   java如何在JFreeChart中使X轴上的值水平?   构建Java Windows应用程序以访问在线MySQL数据库需要什么   java添加构造函数会出错吗?这没有道理,请帮忙,编程问题   java在一个jframe中的两个JPanel中使用两个绘制方法   java数学或逻辑问题   java如何复制Androids库存摄像头方向更改