我使用Selenium
和Python
来获得网页所请求的所有资源的urls
(包括广告的img
网址,这些网址通常位于嵌套的iframe中)。但是,这对于iframes
内的资源和ajax
请求可能不起作用。阅读关于this的文档并查看otherStackOverflow
的答案,似乎可以使用ExpectedCondition
等待元素出现。但是在我的例子中,我需要加载几个网站(几千个Top Alexa
个站点),可能没有任何公共元素可以等待。我一直在使用driver.set_page_load_timeout(60)
,因为60
秒对于所有嵌套的iframe最终都会出现似乎是足够长的时间。我想知道是否有人能证实这是不是正确的方法,以及是否有比这更好的方法。谢谢。在
编辑:我知道这个问题以前已经有人回答过了,但为了澄清我的问题,我相信所有这些答案都提供了一个解决方案,即检测页面上存在的元素,而在我的例子中,我没有任何此类知识。在
我每天都在使用selenium,据我所知,无法确认iframes或ajax是否完全加载,到目前为止(据我所知)唯一的事情就是设置页面加载超时或时间。睡觉在你认为它适合的情况下,你找不到一个公共元素作为指标,以检查页面是否完全加载。 关于这一点的许多问题已经得到了回答 Selenium Python: how to wait until the page is loaded?
相关问题 更多 >
编程相关推荐