关于通用提要解析器的问题
我遇到了一个问题,想从我抓取的几个博客源中获取内容。
我不太确定是什么原因,但在用feedparser解析一两个博客时,出现了这个特定的错误:
results = feedparser.parse(url)
ent = []
for entry in results.entries:
e = {}
e['title'] = entry.title
e['content'] = entry.content[0].value
对象没有'content'这个属性
或者
对象没有'link'这个属性
其他博客没有出现这种情况。是因为内容为空导致的吗?
1 个回答
1
在这个信息源中,XML标签和feedparser中条目的属性之间是有对应关系的。你可以查看一下导致问题的某个信息源的源代码,看看它使用了哪些标签。你可能会发现,它没有为条目提供内容,或者链接是在像uid
这样的字段中,而不是link
。
接下来,你需要编写代码来处理这些小差异,可以使用try
/catch
来捕捉错误,或者用hasattr
来检查特定的属性。
如果你能提供一个有问题的信息源的链接,我或许能给你更多的建议。