如何废弃受java脚本保护的hackerrath页面?

2024-06-16 12:56:29 发布

您现在位置:Python中文网/ 问答频道 /正文

例如,我想在HackerThresh页面解决问题, https://www.hackerearth.com/@babe

Hackerearth Page

当我检查元件时

Inspect Element

但是在做视图源代码时,我找不到类暗权重700。我认为内容是从java脚本加载的。因此,当我使用python的bs4库时,它返回None元素。在

但是我想在没有任何中断的情况下,我要在windows平台上处理所有的问题。在


Tags: httpscom视图内容源代码www页面java
1条回答
网友
1楼 · 发布于 2024-06-16 12:56:29

幸运的是,数据是通过公共可用的api(/users/pagelets/babe/coding-data/为该用户)加载的,因此您可以使用requestsbs4来获取信息。在

import requests
from bs4 import BeautifulSoup

user = 'babe'
url = 'https://www.hackerearth.com/users/pagelets/{}/coding-data/'.format(user)
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
problems_solved = soup.find(string='Problems Solved').find_next().text

print(problems_solved)

119

相关问题 更多 >