在Python中如何解析feedparser中的不同日期格式?
我正在尝试通过feedparser从两个不同的RSS源中获取日期。
这是我正在做的事情:
import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date
这是我得到的结果:
2008-10-21T22:23:28.033841+00:00
Wed, 15 Oct 2008 10:06:10 +0000
我想要达到的目标是能够轻松判断哪个日期更新。
我试过使用Python的datetime模块,并查阅了feedparser的文档,但始终无法解决这个问题。任何帮助都会非常感激。
1 个回答
17
处理RSS源中的日期信息常常让人头疼,这时候feedparser
就能派上大用场。
如果你使用*_parsed
属性(比如updated_parsed
),那么feedparser
会帮你完成这项工作,并返回一个包含9个元素的Python日期,时间是以UTC格式表示的。
想了解更多详细信息,可以查看这个链接:http://packages.python.org/feedparser/date-parsing.html。