如何使用python从web浏览器获取内容？

2条回答

网友

1楼 · 编辑于 2024-04-27 04:15:10

表没有被填充的原因是因为Python没有用urllib2处理它接收到的页面——所以没有DOM，没有运行Javascript，等等。

在阅读完源代码之后，看起来您要查找的信息可以在JSON格式的http://kff.org/datacenter.json?post_id=32781中找到。

网友

2楼 · 编辑于 2024-04-27 04:15:10

要添加到Santiclause answer中，如果您想擦掉java脚本填充的数据，您需要一些东西来执行它。

为此，您可以使用selenium包和webdriver（如Firefox或PhantomJS（无头）连接到页面，执行脚本并获取数据。

您的案例示例：

from selenium import webdriver
driver = webdriver.Firefox() # You can replace this with other web drivers
driver.get("http://kff.org/womens-health-policy/state-indicator/ultrasound-requirements/#")
source = driver.page_source # Here is your populated data.
driver.quit() # don't forget to quit the driver!

当然，如果您可以像前面提到的用户Santiclause那样直接访问json，那么您应该这样做。在检查网站上的元素时，您可以通过查看network选项卡来找到它，这需要一些操作。

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用python从web浏览器获取内容？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >