feedparser如何从一个feed URL中仅获取X个条目?
我需要从一个信息源的链接中获取最后3条信息并显示出来。我现在使用的代码是:
import feedparser
feedUrl = ""
feed = feedparser.parse( feedUrl )
length = len(feed['entries'])
stop = (length-4) if length > 3 else -1
for i in range(length-1, stop, -1):
print feed['items'][i]['title'] + " " + feed['items'][i]['link']
有没有办法利用ETags或者Last-Modified这些头信息来实现这个呢?
1 个回答
0
很遗憾,我认为没有任何信息发布者在他们的内容中使用HTTP层的功能(比如Etags或Last-Modified)。理论上这样做是可行的,但由于这并不是一个标准的做法,也不是所有人都会实现,所以你可能还是需要准备一个备用的解决方案。
我能想到的唯一类似的解决办法是使用像Superfeedr这样的服务,它有一个retrieve
功能,可以通过before
和after
这两个查询参数来获取在某个特定条目之前或之后发布的内容。