Python 从 RSS 订阅提取链接

-1 投票

1 回答

1582 浏览

数据工程师

提问于 2025-04-18 10:36

我正在使用一个网址，地址是 http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml，并且用 feedparser-5.1.3 来解析这个网址，命令是：

g = feedparser.parse('http://www.sec.gov/Archives/edgar/monthly/xbrlrss-2012-02.xml')

如果你访问这个网址，你会看到每个链接下都有很多压缩文件（zip文件）。

我的目标是找到并提取所有的压缩文件链接。

在Python的命令行中输入命令 g['feed'] 可以获取到这个数据源。

一个关于这个主题的网络研讨会（第8页）提供了一些代码，但我无法使用这些代码。

我在这个帖子中附上了一段摘录：

for item in feed.entries:
    print( item[ "summary" ], item[ "title" ], item[ "published" ] )
    try:
        # Identify ZIP file enclosure, if available
        enclosures = [ l for l in item[ "links" ] if l[ "rel" ] == "enclosure" ]

我该怎么做呢？

1 个回答

把名字从 g 改成 feed，这样你就可以使用这段代码了。

回答于 2025-04-18 由 Python大师

分享举报

Python 从 RSS 订阅提取链接

1 个回答

撰写回答