带模板的html scraper

weakscraper的Python项目详细描述


#懦夫 带有模板的HTML scraper

##说明

大多数html页面都是使用模板生成的。为什么不使用模板也刮html页面?至于模板语言,让我们使用html加上一些关键字。这样,weakscraper的工作流程如下: *获取要废弃的HTML页面的源代码。 *使用几个关键字,编辑html以选择感兴趣的信息和要丢弃的部分。 *如果需要复杂的处理,则编写其他回调。 *在模板和html上运行weakscraper。

##专业人士 *遵守[最小功率规则](https://en.wikipedia.org/wiki/Rule_of_least_power)。声明性语言有助于关注what要保留的内容。how信息如何被废弃是库的工作。

##缺点

##示例

##它是怎么工作的?

##许可证

麻省理工学院(http://www.opensource.org/licenses/mit-license.php

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何为纯Java应用程序启用ProGuard缩小?   java决定在GitHub上上载哪些文件   java如何编写SQL查询以从两个表中获取数据   java无法初始化类org。springframework。aop。框架DefaultAOpproxy工厂   如何在安卓中将kotlin集转换为java   更改程序中的java字符串、子字符串和ifelse语句   java Spring自动添加“XTotalCount”头   在Java中获取日期范围内的所有星期五   javafx滚动窗格不允许请求聚焦于某个字段   java如何在并行flux内的同一线程中运行mono   线程“main”java中的安装启动4j异常。lang.NoClassDefFoundError:javax/mail/MessaginException   java从GWT CellTable获取所有对象   java按钮视图即使在将其可见性设置为true后也不可见   java Spring 3.0处理文件上载问题   java Chromedriver元素在点(xxx,yyy)处不可单击。其他元素将收到单击:   java系统。加载抛出NoSuchMethodError   在Java中打开文件时出错   java子类何时以及为什么要声明父类的静态实例成员?