Python 从 RSS 订阅提取链接
我正在使用一个网址,地址是 http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml,并且用 feedparser-5.1.3 来解析这个网址,命令是:
g = feedparser.parse('http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml')
如果你访问这个网址,你会看到每个链接下都有很多压缩文件(zip文件)。
我的目标是找到并提取所有的压缩文件链接。
在Python的命令行中输入命令 g['feed']
可以获取到这个数据源。
一个关于这个主题的网络研讨会(第8页)提供了一些代码,但我无法使用这些代码。
我在这个帖子中附上了一段摘录:
for item in feed.entries:
print( item[ "summary" ], item[ "title" ], item[ "published" ] )
try:
# Identify ZIP file enclosure, if available
enclosures = [ l for l in item[ "links" ] if l[ "rel" ] == "enclosure" ]
我该怎么做呢?
1 个回答
1
把名字从 g
改成 feed
,这样你就可以使用这段代码了。