有没有简单的类/库可以使用pyQT/webkit抓取支持JavaScript的网站?
我正在考虑使用pyQT来抓取支持JavaScript的网站,之前我尝试过一些静态HTML的替代方案(比如beautifulsoup、mechanize等)。
显然,pyQT是一个更通用的工具,因此并不是特别适合我的需求。
有没有什么类或库可以让我用pyQT来进行相对简单的抓取工作,提供一些简单的功能呢?
我在谷歌上找到了一些类和脚本,但希望能找到更适合我需求的东西!
我需要提交表单、保持会话,并返回HTML以便用lxml进行处理。
谢谢 :)