一般新闻的新闻源API
我正在建立一个数据库和工具,用来搜索新闻源中的特定词汇。比如说“坚果引起的食物中毒”。我想在社交媒体、新闻网站、主要的新闻聚合网站等地方寻找这个词。
- 问题 1:现在有哪些新闻聚合的API可以用?
- 问题 2:你会怎么编写代码,只获取API中最新的新闻?
编辑 添加了示意图: alt text http://koopics.com/news_parser.jpg
4 个回答
0
谷歌有一个新闻推送的接口,但我觉得这个接口只适合非商业用途。
1
你试过 通用提要解析器 吗?
4
你知道Yahoo! Pipes吗?它是一个非常灵活的聚合工具,可以把不同来源的信息汇集在一起。而且你可以用YQL来操作它,YQL非常强大,还有一个Python库,叫python-yql :)。YQL还为Twitter和其他服务以及新闻源提供了特定的“表”,所以根据你的需求,有时候你甚至不需要用到Pipes。
在这个链接上有一个关于Pipes和YQL使用的快速示例,但你也可以在YQL控制台上随意尝试。
这就是你的“问题1”。不过,使用YQL后,“问题2”(如果我理解没错的话)就自然而然地解决了,因为你几乎可以像使用普通SQL一样使用它,设置限制、排序等等。