Python 从 RSS 订阅提取链接

-1 投票
1 回答
1582 浏览
提问于 2025-04-18 10:36

我正在使用一个网址,地址是 http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml,并且用 feedparser-5.1.3 来解析这个网址,命令是:

g = feedparser.parse('http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml')

如果你访问这个网址,你会看到每个链接下都有很多压缩文件(zip文件)

我的目标是找到并提取所有的压缩文件链接。

在Python的命令行中输入命令 g['feed'] 可以获取到这个数据源。

一个关于这个主题的网络研讨会(第8页)提供了一些代码,但我无法使用这些代码。

我在这个帖子中附上了一段摘录:

for item in feed.entries:
    print( item[ "summary" ], item[ "title" ], item[ "published" ] )
    try:
        # Identify ZIP file enclosure, if available
        enclosures = [ l for l in item[ "links" ] if l[ "rel" ] == "enclosure" ]

我该怎么做呢?

1 个回答

1

把名字从 g 改成 feed,这样你就可以使用这段代码了。

撰写回答