使用Python抓取网页"预览

5 投票
2 回答
1691 浏览
提问于 2025-04-15 19:48

我正在给一堆链接建立索引,这些链接经常更新,所以我在自动生成网站的缩略图。

对于大多数网站来说,这很简单,因为我只需要抓取页面上最大的图片,希望它能代表内容。

但有时候,页面的主要内容是视频。


有没有人能给我一些处理这类情况的建议?那就太好了!


关于使用Webkit来创建截图,我找到了一些资料

2 个回答

3

有一些服务(有免费的也有付费的)正好能满足你的需求。我使用的是 shrink the web

3

wkhtmltopdf 是一个工具,它使用了一个叫做 WebKit 的渲染引擎(这个引擎在 Safari、Chrome 等浏览器中使用)来把网页保存成 PDF 文件。这个工具可以把网页上的所有图片都保存下来(不过我想 Flash 视频是不能保存的)。这可能是制作更准确的缩略图的一个起点。

撰写回答