如何创建类似Facebook分享的URL提取器
我需要从一个网址中提取一些数据,比如标题、描述,还有任何视频和图片,就像Facebook的分享按钮那样。
比如这个链接: http://www.facebook.com/sharer.php?u=http://www.wired.com&t=Test
谢谢!
5 个回答
2
如果一个网站支持 oEmbed,那么使用这个功能会比直接抓取HTML要简单和可靠得多:
oEmbed是一种格式,它允许在其他网站上嵌入一个网址的内容。这个简单的接口可以让网站在用户分享链接时,自动显示相关的内容(比如照片或视频),而不需要直接去解析这个资源。
像YouTube和Flickr这样的网站都支持oEmbed。
4
可以使用类似于 cURL 的工具来获取网页内容,然后再用像 Simple HTML DOM 这样的工具来解析这些内容,提取你想要的元素。
5
Embed.ly 提供了一个很不错的接口,专门用来做这个事情。这个接口会返回网站的oEmbed数据,如果有的话。如果没有,它会尝试提取页面的摘要,就像Facebook那样。