我试图看看有多少类在这个页面上,但输出是0。我使用BeautifulSoup已经有一段时间了,但从未见过这样的错误。你知道吗
from bs4 import BeautifulSoup
import requests
result = requests.get("https://www.holonis.com/motivationquotes")
c = result.content
soup = BeautifulSoup(c)
samples = soup.findAll("div", {"class": "ng-scope"})
print(len(samples))
输出
0
我希望正确的输出至少超过25
BeautifulSoup
没有问题,实际上,GET
请求的结果不包含任何ng-scope
文本。你知道吗您可以在这里看到输出:
基本上,
result.content
不包含任何具有ng-scope
类的div。正如其中一条注释所述,由于浏览器上运行的javascript,您试图获取的html被添加到了那里。你知道吗我向您推荐这个由非常流行的requests作者创建的包requests-html。你知道吗
您可以尝试使用下面的代码来构建它。你知道吗
要查看有多少
ng-scope
类,只需执行以下操作:我假设您想从
a
标记中删除所有href
,这些标记是您将image交给的div的子级。您可以通过以下方式获得它们:这是一个基于角度的“动态”页面,需要一个Javascript引擎或浏览器才能完全加载。换言之,在浏览器开发工具中看到的HTML源代码与在
result.content
中看到的不同,后者是不包含所需数据的页面的未呈现初始HTML。你知道吗您可以使用^{} 这样的方法来呈现和加载页面,然后用HTML对其进行解析,但是,为什么不直接向站点API发出请求呢
检索和打印文章描述仅用于示例目的
post
词典包含网页上显示的所有其他相关文章数据。你知道吗相关问题 更多 >
编程相关推荐