如何从动态加载的页面中获取值？

网友

1楼 · 编辑于 2024-04-19 20:52:40

对于动态加载的数据，您应该在网络中查找xhr请求，如果您可以使该数据对您有效率，那就好！！你知道吗
你可以使用幻影js，它是一个无头浏览器，它捕获了动态加载内容的html页面。你知道吗

网友

2楼 · 编辑于 2024-04-19 20:52:40

如果内容没有出现在页面源代码中，那么它可能是使用javascript生成的。例如，站点可能有一个列出作业的restapi，Javascript代码可以从API请求作业，并使用它在DOM中创建节点并将其附加到可用作业。这只是一种可能性。你知道吗

消除这些信息的一种方法是弄清楚javascript是如何工作的，并让python scraper做同样的事情（例如，如果它使用的是一个简单的restapi，那么您只需要向相同的URL发出请求）。通常这并不是那么容易，所以另一种选择是使用支持javascript的浏览器（如selenium）进行刮取。你知道吗

最后一件事我想提到的是that regular expressions are a fragile way to parse HTML，您通常应该更喜欢使用像BeautifulSoup这样的库。你知道吗

网友

3楼 · 编辑于 2024-04-19 20:52:40

1.一个值可以用ajax动态加载，ajax异步加载这意味着站点的其余部分不会等待ajax被呈现，这就是为什么当您获得DOM时，用ajax加载的元素不会出现在其中。你知道吗

2.对于动态内容，应该使用selenium，here a tutorial

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从动态加载的页面中获取值？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >