使用Python等待所有资源加载到Selenium中

2024-05-16 01:14:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用SeleniumPython来获得网页所请求的所有资源的urls(包括广告的img网址,这些网址通常位于嵌套的iframe中)。但是,这对于iframes内的资源和ajax请求可能不起作用。阅读关于this的文档并查看otherStackOverflow的答案,似乎可以使用ExpectedCondition等待元素出现。但是在我的例子中,我需要加载几个网站(几千个Top Alexa个站点),可能没有任何公共元素可以等待。我一直在使用driver.set_page_load_timeout(60),因为60秒对于所有嵌套的iframe最终都会出现似乎是足够长的时间。我想知道是否有人能证实这是不是正确的方法,以及是否有比这更好的方法。谢谢。在

编辑:我知道这个问题以前已经有人回答过了,但为了澄清我的问题,我相信所有这些答案都提供了一个解决方案,即检测页面上存在的元素,而在我的例子中,我没有任何此类知识。在


Tags: 方法答案元素网页imgseleniumajax资源
1条回答
网友
1楼 · 发布于 2024-05-16 01:14:06

我每天都在使用selenium,据我所知,无法确认iframes或ajax是否完全加载,到目前为止(据我所知)唯一的事情就是设置页面加载超时或时间。睡觉在你认为它适合的情况下,你找不到一个公共元素作为指标,以检查页面是否完全加载。 关于这一点的许多问题已经得到了回答 Selenium Python: how to wait until the page is loaded?

相关问题 更多 >