使用Python的urllib从通过__doPostBack()完成的页面中检索信息?
我正在尝试解析一个页面,这个页面有不同的部分是通过一个叫做 __doPostBack() 的 Javascript 函数加载的。
一个链接的例子是:javascript:__doPostBack('ctl00$cphMain$ucOemSchPicker$dlSch$ctl03$btnSch','')
当点击这个链接时,浏览器并不会获取一个新的网址,而是更新网页的某个部分,以显示新的信息。
我应该在 urllib 函数中传入什么来完成这个操作呢?
1 个回答
1
javascript:__doPostBack('...
(唉,这种方法真让人失望和不爽。)
想要找到那些逻辑藏在JavaScript里的网址,其实有个简单的方法。你可以正常打开网页,同时开启一个网络调试工具(比如Firebug的“网络”标签,或者Fiddler)。当你点击某个链接时,监控一下发出的请求,就能看到具体的网址和要发送的POST请求的内容。
你需要使用urlopen
中的data
参数来发送POST请求的内容。