我正在努力抓取某个网页(beachvolleyball.nrw)
在过去的两天里,我使用了我能找到的所有库,但始终无法加载脚本标记
当使用开发人员工具选择比赛时,数据正在加载,但我无法将其与selenium和其他工具一起使用
我要刮取的对象:
Dom中的元素:
我已经尝试了很多不同的方法,给你看一个是没有多大意义的。
当打开网页时,当元素还没有加载时,请看一下DOM
帮助我使用Splash 3.5或您喜欢的任何其他解决方案加载数据:)
多谢各位!在此之前,我将继续努力:)
TLDR:我无法从带有splash的here加载脚本,或者在DOM中导航的任何其他解决方案都不是问题
Tags:
由
JavaScripts
呈现的页面,您可以使用selenium并等待先加载表,然后再从表中获取值控制台输出:
您要刮取的表由WebSocket加载。您可以使用开发人员工具中的“网络”选项卡检查这一点。这包括在您的webbrowser中。通常由
F12
或[CTRL] + [SHIFT] + 'C'
打开。然后导航到“网络”选项卡,在这里您可以看到WebSocket和从服务器发送的消息,以及通过浏览器发送到服务器的消息。我认为最简单的方法是通过selenium或使用类似websocket-client的库连接到WebSocket相关问题 更多 >
编程相关推荐