5 个回答

2

如果一个网站支持 oEmbed,那么使用这个功能会比直接抓取HTML要简单和可靠得多:

oEmbed是一种格式,它允许在其他网站上嵌入一个网址的内容。这个简单的接口可以让网站在用户分享链接时,自动显示相关的内容(比如照片或视频),而不需要直接去解析这个资源。

像YouTube和Flickr这样的网站都支持oEmbed。

4

可以使用类似于 cURL 的工具来获取网页内容,然后再用像 Simple HTML DOM 这样的工具来解析这些内容,提取你想要的元素。

5

Embed.ly 提供了一个很不错的接口,专门用来做这个事情。这个接口会返回网站的oEmbed数据,如果有的话。如果没有,它会尝试提取页面的摘要,就像Facebook那样。

撰写回答