Python的无头浏览器(需要支持JavaScript!)
我需要一个无头浏览器,这种浏览器使用起来比较简单(我对Python和编程还不太熟悉),它能让我访问一个网页,登录一个需要用到Javascript的表单,然后抓取结果网页上的信息,比如查找符合特定条件的结果,勾选复选框,以及点击下载文件。这一切都需要用到Javascript。
我听说无头浏览器正是我需要的——我的要求是能够从Python运行它,最好生成的脚本可以通过py2exe编译(因为我这个程序是给其他用户用的)。
到目前为止,Windmill看起来可能是我想要的,但我还不太确定。
任何建议都很感谢!
6 个回答
我正在写一个Python驱动程序,用于Zombie.js,这是一种“轻量级框架,用于在模拟环境中测试客户端JavaScript代码”。
目前我在Node.js的一个bug上遇到了瓶颈(在我写更多测试和代码之前),但欢迎大家关注我的项目进展:
我在Python中使用webkit作为无头浏览器,主要通过pyqt或pyside来实现。
你可以在这里下载pyqt: http://www.riverbankcomputing.co.uk/software/pyqt/download
还有pyside的下载链接: http://developer.qt.nokia.com/wiki/Category:LanguageBindings::PySide::Downloads
我特别喜欢webkit,因为它的设置非常简单。在Ubuntu系统上,你只需要运行这个命令: sudo apt-get install python-qt4
这里有一个示例脚本:
你可以查看这个链接了解更多: http://webscraping.com/blog/Scraping-JavaScript-webpages-with-webkit/
这个问题的答案是 Spynner