关于通用提要解析器的问题

0 投票

1 回答

713 浏览

提问于 2025-04-16 00:17

我遇到了一个问题，想从我抓取的几个博客源中获取内容。

我不太确定是什么原因，但在用feedparser解析一两个博客时，出现了这个特定的错误：

results = feedparser.parse(url)

  ent = []

  for entry in results.entries:
     e = {}
     e['title'] = entry.title
     e['content'] = entry.content[0].value

对象没有'content'这个属性

或者

对象没有'link'这个属性

其他博客没有出现这种情况。是因为内容为空导致的吗？

数据解析 feedparser 属性错误内容抓取通用提要解析器博客源

1 个回答

在这个信息源中，XML标签和feedparser中条目的属性之间是有对应关系的。你可以查看一下导致问题的某个信息源的源代码，看看它使用了哪些标签。你可能会发现，它没有为条目提供内容，或者链接是在像uid这样的字段中，而不是link。

接下来，你需要编写代码来处理这些小差异，可以使用try/catch来捕捉错误，或者用hasattr来检查特定的属性。

如果你能提供一个有问题的信息源的链接，我或许能给你更多的建议。

回答于 2025-04-16 由 Python大师

分享举报

关于通用提要解析器的问题

1 个回答

撰写回答