使用PyQt输出和响应Javascript
我正在尝试使用PyQt来加载一个网页的HTML,这样我就可以对其进行操作,然后再把修改后的内容反馈到网页上,以便进行网络爬虫。简单来说,我想登录一个有JavaScript的页面,搜索可以下载的文档(通过勾选正确文档旁边的复选框),然后点击一个下载按钮,这个按钮会弹出另一个页面。
有没有人知道我该用哪些函数?有没有办法在不涉及类的情况下讨论这个问题?(我对类的理解还不够好,我正在努力学习,仍然算是个初学者)。
如果我没有解释清楚,抱歉。我正在尝试使用PyQt或PySide来实现这个功能。
2 个回答
0
我觉得你可能对事情发生的地方有些混淆,所以我不太明白你想要做什么,但我来猜一下。
我想你是想自动化使用一个网站的过程,比如你需要打开一个选择页面,勾选一个框,点击一个按钮,然后处理下载的文件。
如果你只是想测试这个网站,做几次操作的话,可以看看watir和Selenium这两个工具。
如果你真的想用Python来编写代码,那你需要好好理解带有复选框的页面,这样你才能找到并提取出表单,然后从表单中的字段创建一个POST请求,并发送这个请求来获取下载的文件。如果页面里有JavaScript,这可能会影响你创建有效的POST请求。
接下来,你还需要捕获并保存下载的文件。
而且每次网站的HTML页面发生变化时,你的代码都可能需要大改动。
我一点都不羡慕你要做的这个工作。
2
我使用pyqt/pyside来加载一个网页,等JavaScript执行完毕后,再解析生成的HTML,提取我感兴趣的内容。
下面是一个示例脚本:
http://webscraping.com/blog/Scraping-JavaScript-webpages-with-webkit/