关于通用提要解析器的问题

0 投票
1 回答
713 浏览
提问于 2025-04-16 00:17

我遇到了一个问题,想从我抓取的几个博客源中获取内容。

我不太确定是什么原因,但在用feedparser解析一两个博客时,出现了这个特定的错误:

results = feedparser.parse(url)

  ent = []

  for entry in results.entries:
     e = {}
     e['title'] = entry.title
     e['content'] = entry.content[0].value

对象没有'content'这个属性

或者

对象没有'link'这个属性

其他博客没有出现这种情况。是因为内容为空导致的吗?

1 个回答

1

在这个信息源中,XML标签和feedparser中条目的属性之间是有对应关系的。你可以查看一下导致问题的某个信息源的源代码,看看它使用了哪些标签。你可能会发现,它没有为条目提供内容,或者链接是在像uid这样的字段中,而不是link

接下来,你需要编写代码来处理这些小差异,可以使用try/catch来捕捉错误,或者用hasattr来检查特定的属性。

如果你能提供一个有问题的信息源的链接,我或许能给你更多的建议。

撰写回答