XPath获取Python中Youtube视频描述的全文?

2024-05-14 09:53:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图使用Xpath和lxml获取给定Youtube视频的描述文本,但是它只返回描述的前几句话,然后返回“…”。简而言之,我想知道我的xpath是否有问题,或者它是否总是这样?我还没有看到任何与此相关的线索

from lxml import html
import requests
import urllib3

url = "https://www.youtube.com/watch?v=Baur2Ypgd60"

page=requests.get(url)     

tree = html.fromstring(page.text)
s=tree.xpath('//meta[@name="description"]/@content')
print(s)

这只打印:[“2020年最好的”🏆 今年有它的挑战,但你不能阻止这列火车。一个全球性的“家庭以创造力、韧性+团结来应对逆境。你……”

而不是描述的全文:[“2020年最好的”🏆 今年是充满挑战的一年,但你无法阻止这列火车。一个全球性的家庭以创造力、韧性和团结面对逆境。你从未忘记你的激情,即使这意味着在你的起居室里练习。我们感激、鼓舞、对未来充满渴望。“]

这似乎是一个很容易解决的问题,但我对XPath的东西不太熟悉,在任何地方都找不到任何关于它的东西。谢谢


Tags: importtreeurlhtml家庭pagerequestslxml
1条回答
网友
1楼 · 发布于 2024-05-14 09:53:09

问题是元描述中的标记只包含

The Best of 2020 🏆 This year had its challenges—but you can't stop this train. A global #GoProFamily met adversity with creativity, resilience, + unity. You...

但你想得到的是div

<div id="description" slot="content" class="style-scope ytd-video-secondary-info-renderer"></div>

这里有一个洞的视频描述

但是获取描述的最聪明的方法是使用Youtube API

相关问题 更多 >

    热门问题