使用feedparser获取原始XML数据
我正在尝试使用feedparser来获取一些特定的信息,但我也想获取每个条目的原始XML内容(也就是RSS中的
谢谢!
1 个回答
2
我是feedparser的当前开发者。目前,有一种方法可以获取相关信息,就是对feedparser._FeedParserMixin
进行“猴子补丁”(或者编辑本地的feedparser.py文件)。你需要修改的方法有:
feedparser._FeedParserMixin.unknown_starttag
feedparser._FeedParserMixin.unknown_endtag
在每个方法的开头,你可以插入一个回调函数,这样当feedparser遇到元素及其属性时,就能捕捉到这些信息。