我目前正在尝试提取嵌入在Twitter视频中的“行动号召”按钮中的url。例如:
使用Chrome Inspect时,我可以相对容易地发现我的目标:
现在我尝试在Python中抓取突出显示的链接。 我找不到任何从Twitter API获取它的方法,因此我切换到BeautifulSoup。但当搜索任何链接时,它都不会显示给我:
In[23]: url = "https://amp.twimg.com/v/a693e53f-a6a3-4ff1-b06e-7c5402db0e06"
In[24]: resp = requests.get(url).content
In[25]: soup = BeautifulSoup(resp, 'lxml')
In[26]: soup.find_all('a')
Out[26]:
[<a href="https://twitter.com/unibet" target="_blank">@unibet</a>,
<a class="download-btn" id="app-download"><img id="whiteLogo"
src="https://amp.twimg.com/amplify-web-player/prod/styles/img/twitter_logo_white.png"/></a>]
你知道我能做些什么来提取那个嵌入的网址吗?非常感谢任何帮助!在
数据是通过ajax请求动态创建的,您可以从原始pagesmeta标记中提取xml的url,然后请求类似xml的数据:
所以我们只需要从中提取网址:
^{pr2}$这就给了我们一个链接:
相关问题 更多 >
编程相关推荐