快速HTML5CSS选择器。

selectolax的Python项目详细描述


https://img.shields.io/pypi/v/selectolax.svghttps://img.shields.io/travis/rushter/selectolax.svg

使用Modest engine的快速html5解析器和css选择器。

安装

来自使用pip的pypi:

pip install selectolax

github的开发版本:

git clone --recursive  https://github.com/rushter/selectolax
cd selectolax
pip -r requirements_dev.txt
python setup.py install

示例

fromselectolax.parserimportHTMLParserhtml="<div><p id=p1><p id=p2><p id=p3><a>link</a><p id=p4><p id=p5>text<p id=p6></div>"selector="div > :nth-child(2n+1):not(:has(a))"fornodeinHTMLParser(html).css(selector):print(node.attributes,node.text(),node.tag)print(node.parent.tag)print(node.html)

简单基准

  • 平均10次从800个google serp页面解析和检索url的实验。
PackageTimeMemory (peak)
selectolax2.38 sec.768.11 MB
lxml18.67 sec.769.21 MB

许可证

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在构造函数外部添加鼠标侦听器   java如何使用比较器对列表进行排序以正确排序空值?   javajavax。由于javax,邮件“535.7.3身份验证失败”。邮件升级(v1.3.1至v1.5.2)   java将arraylist流到固定的二维数组中并打印?   RecyclerView适配器上的java上下文   java如何为此Twitter API为KafkaProducer建立连接   java Spring安全性重写WebSecurity配置适配器的配置(AuthenticationManagerBuilder)是否会影响全局应用程序?   线程“awteventque0”NullPointerException中的java异常   if条件中的null值和null指针异常java   java树集<Object>允许相同类型的多个对象   java定义类;我认不出   字符串java replaceAll()   JAVAutil。scanner(Java)读取文件时如何跳过空格?   java在swing中关闭flash屏幕   java在Wildfly 16中的应用程序中加载pk12文件   有没有工具可以自动生成屏幕抓取的Java代码   创建意图时,java方法getParcelableExtra()返回null   将数据从java传递到jsp   java Android Studio |永久保存布局