如何从网页上抓取“正确”的照片?

2024-06-16 11:27:01 发布

您现在位置:Python中文网/ 问答频道 /正文

从网站上抓取正确的照片: 我是一个简单的应用程序。我有文章,但我需要选择正确的照片。在

例如,在:

http://www.politico.com/story/2013/09/government-shutdown-2013-gop-narrative-97521.html

我想为这3个人的照片抓取网址。不过,有几个图片要刮。我怎么知道哪张照片是对的。什么逻辑新闻.谷歌flipboard可以从一篇文章或任何文章中刮出“正确”的照片。在

我注意到大多数时候这些照片都是幻灯片。我怎样才能用漂亮的汤刮出这些幻灯片的照片呢。在


Tags: com应用程序http网站htmlwww文章照片
1条回答
网友
1楼 · 发布于 2024-06-16 11:27:01

该页在open graph protocol下有一个meta标记:

<meta property="og:image" content="http://images.politico.com/global/2013/09/29/mccarthy_blackburn_cruz_ap_ftn_ap_328.jpg"/> 

这给了网站创作者建议用作预览的图像(这确实是这三个人的照片)。在

您可以使用beauthulsoup获取此图像的地址,如下所示:

^{pr2}$

相关问题 更多 >