Python中文
首页
教程
问答
标签
搜索
登录
注册
如果我必须为python只选择一个html抓取库,我应该选择哪个
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我需要做大量的html解析/屏蔽/搜索引擎/爬行。在</p> <p>目前有很多库像scrpy,beautifulsoup,lxml,lxml2请求,pyquery。在</p> <p>现在我不想尝试每一个然后再决定。基本上我想继续学习一个,然后详细研究,然后经常使用。在</p> <p>那么,我应该去哪个库才能执行上面提到的所有功能呢。即使对于不同的问题可能有不同的解决方案。但我想要一个库,可以做所有的事情,即使它需要时间编码,但应该是可能的</p> <p>有可能在lxml中建立索引吗?PyQuery与lxml相同还是不同?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>由于许多HTML文档格式不好,而是一堆标记(有时甚至没有正确嵌套),您可能希望使用beauthulsoup而不是基于xml的解析器。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
从Django temp访问容器的方法
9 回答
从Django temp请求ModelForm实例
2 回答
从Django temp返回JSON
3 回答
从Django timesince模板等效项中删除尾部数据
3 回答
从Django timesin删除尾随数据
7 回答
从Django UpdateView模板下载文件
3 回答
从Django url传递“start”会出现错误“start()只接受2个参数(给定1个)”
3 回答
从Django url运行的websockets错误:RuntimeError:线程“Dummy1”中没有当前事件循环
1 回答
从Django user mod获取用户全名
1 回答
从Django UserCreateForm中删除帮助文本
4 回答
从Django values()获取外键值
1 回答
从Django vi中的按钮获取click事件
2 回答
从Django vi从HttpResponse检索JSON
6 回答
从Django vi以json形式返回的数据中检索元素
1 回答
从Django vi取消或取消eventlet中的芹菜任务
5 回答
从Django vi启动多核后台进程
2 回答
从Django vi开始
1 回答
从Django Vi构建HTML
9 回答
从Django vi访问进程数据
1 回答
从Django vi调用pysnmp发送超时
9 回答