我想在这里提取文本
大量文本我曾经
url = ('https://osu.ppy.sh/users/1521445')
page = requests.get(url, headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
mestuff = soup.find("div", {"class":"bbcode bbcode--profile-page"})
但它总是在终端显示“无”时返回
我该怎么办
链接为“https://osu.ppy.sh/users/1521445”
(这是一个复述,因为旧问题非常旧。我不知道我是否应该提出另一个问题,但aa)
数据是从脚本标记动态加载的,所以,正如在另一个答案中一样,您可以从该标记抓取数据。您可以通过标记的id来定位标记,然后需要提取相关的json,然后从该json中提取html,然后解析将在页面上动态加载的html(此时您可以使用原始的类选择器)
你可以试试这个:
我不知道为什么
div
和class='bbcode bbcode profile-page'
在script
标记和class='json-user'
内string
,这就是为什么你不能通过div
和class='bbcode bbcode profile-page'
得到它的值的原因希望这能有所帮助
相关问题 更多 >
编程相关推荐