我对python和web抓取非常陌生。 我正试图从jetbrains网站上获取intellij的版本号。我正在尝试使用xpath获取构建编号。 https://www.jetbrains.com/idea/download/#section=linux xpath/*[@id=“download block”]/section[1]/div/div/div[1]/ul[1]/li[2]/text()[3]
我引用/使用了本文中的代码: get renderd javascript lines from website in python
运行代码后,我返回[] 我用OP代码尝试了一下,返回了相同的结果。 我已经能够使用美丽的汤打印出整个页面,但我只需要构建编号
如果有任何帮助或踢向正确的方向,我们将不胜感激。 谢谢
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://www.jetbrains.com/idea/download/#section=linux')
r.html.render(sleep=0.1)
item = r.html.xpath('//*[@id="download-block"]/section[1]/div/div/div[1]/ul[1]/li[2]/text()[3]')
print(item)
Jetbrains不支持浏览器禁用Javascript,因为数据是从其他服务器获取的。为了解决这个问题,我们可以直接从该站点下载数据
相关问题 更多 >
编程相关推荐