我试图使用Xpath和lxml获取给定Youtube视频的描述文本,但是它只返回描述的前几句话,然后返回“…”。简而言之,我想知道我的xpath是否有问题,或者它是否总是这样?我还没有看到任何与此相关的线索
from lxml import html
import requests
import urllib3
url = "https://www.youtube.com/watch?v=Baur2Ypgd60"
page=requests.get(url)
tree = html.fromstring(page.text)
s=tree.xpath('//meta[@name="description"]/@content')
print(s)
这只打印:[“2020年最好的”🏆 今年有它的挑战,但你不能阻止这列火车。一个全球性的“家庭以创造力、韧性+团结来应对逆境。你……”
而不是描述的全文:[“2020年最好的”🏆 今年是充满挑战的一年,但你无法阻止这列火车。一个全球性的家庭以创造力、韧性和团结面对逆境。你从未忘记你的激情,即使这意味着在你的起居室里练习。我们感激、鼓舞、对未来充满渴望。“]
这似乎是一个很容易解决的问题,但我对XPath的东西不太熟悉,在任何地方都找不到任何关于它的东西。谢谢
问题是元描述中的标记只包含
The Best of 2020 🏆 This year had its challenges—but you can't stop this train. A global #GoProFamily met adversity with creativity, resilience, + unity. You...
但你想得到的是
div
:这里有一个洞的视频描述
但是获取描述的最聪明的方法是使用Youtube API
相关问题 更多 >
编程相关推荐