onload JavaScript 后 HTML 的状态
很多网页使用 onload 的 JavaScript 来操作它们的 DOM(文档对象模型)。有没有办法让我自动获取这些 JavaScript 操作后 HTML 的状态呢?
像 wget 这样的工具在这里没什么用,因为它只是下载原始的源代码。
有没有可能使用一个网页浏览器的渲染引擎呢?
理想情况下,我希望能找到一个可以用 Python 来操作的解决方案。
谢谢!
2 个回答
1
请查看StackOverflow上的相关信息:
2
我知道的唯一好方法就是自动化浏览器,比如用Selenium RC。如果你不知道怎么判断页面的相关JavaScript代码是否已经运行完,那就只能像真实用户一样访问这个页面。你需要等一会儿,拍一张快照,再等一会儿,再拍一张,然后对比这两张快照,看看有没有变化,以此来确认页面确实已经加载完成。