我尝试使用BS4导航到一个页面,让我们以/history为例。我想收集当前在/history频道上的所有视频的viewcount。要获得所有视频的列表视图,请转到https://www.youtube.com/history/videos
然后我使用chrome中的inspect元素来查找标签。这给了我一个结论,我应该用^{cl1}来尝试一个“span”$
这不起作用,因为某些原因,我不能为我的生活理解这一点。你知道吗
import re
import requests
import urllib.request
from bs4 import BeautifulSoup
import csv
import time
theurl = "https://www.youtube.com/history/videos"
thepage = urllib.request.urlopen(theurl)
soup = BeautifulSoup(thepage,"html.parser")
Views = soup.findAll('span',attrs={'class':'class="style-scope ytd-grid-video-renderer"'})
print(Views)
我想把下面的输出打印出来
3.5公里 1.2公里 2.2公里 5.5公里
然后我可以自己学习,对于K的每一个例子,我乘以100,等等M和B
然而,要达到打印视图的步骤是我目前的障碍。你知道吗
可能是因为你找到的标签在那里,所以javascript可以输出视频的视图。Urllib不获取javascript输出。尝试使用硒。你知道吗
相关问题 更多 >
编程相关推荐