如何脚本化Firefox或任何基于Mozilla的浏览器
我想要自动化一些操作,具体步骤如下:
- 打开一个网址
- 等到页面完全加载
- 保存整个页面为...(我可以提供一个名字)。
我看过这个链接,但是找不到一个选项可以执行“保存页面为...(完整网页模式)”的命令。这样我才能获取到显示页面所需的所有css、js、xml和相关文件。
我会一些Python,如果能找到和Firefox“对话”的方法,我可以用它。可是webbrowser模块在这方面帮不上忙,因为它不支持保存页面:http://docs.python.org/library/webbrowser.html
我对任何解决方案都持开放态度。
平台是Linux,但如果没有其他办法,我也可以使用其他平台。
重要:我不能仅仅获取服务器返回的HTML,因为我需要所有的css、js、图片和文件,这些都是浏览器渲染页面时用到的。例如,有些图片可能在HTML中没有链接,但可能通过一个js被引用,而这个js是在页面渲染时执行的。我认为获取这些图片的唯一方法是像浏览器一样执行页面,然后从结果页面中获取所有文件(而不是原始页面)。
1 个回答
4
也许你可以试试来自Selenium工具集的某些东西。
Selenium IDE是一个用于Selenium脚本的集成开发环境。它是一个Firefox浏览器的扩展,可以让你录制、编辑和调试测试。Selenium IDE包含了完整的Selenium核心,这样你就可以轻松快速地在实际运行环境中录制和回放测试。