阅读RSS提要:聚合器做了什么

2024-04-25 14:37:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我把下面的提要放到googlereader中,它会正常更新。在

http://www.indeed.ca/rss?q=&l=Hamilton%2C+ON

然而,当我使用thither和yon在网上建议的许多方法中的任何一种,这些方法只涉及从这个源代码读取和解析XML,我收到的都是相同的20个条目。在

谷歌阅读器是怎么做的,我应该在我的代码,以便我收到新的项目?在

谢谢你的建议。顺便说一下,我用Python编写代码。在


Tags: 方法代码http源代码onwww条目xml
2条回答

1)您是否尝试过使用其他RSS源?在

2)如果是这样,听起来像是某种缓存。。。你在做代理人吗?在

RSS聚合器“poll”源,也就是说,它们定期对每个源重复HTTP查询,并检查结果中是否出现新的内容。这是不幸的,民意调查总是如此,因为它浪费资源,没完没了地说“我们到了吗?”问题(有点像带一个蹒跚学步的孩子在长途汽车上行驶;-)、都意味着延迟(如果你每小时调查一个给定的来源,比如说,你要等上一个小时才能看到一些结果)。在

不幸的是,在RSS体系结构本身中,没有其他选择,无法在出现新内容时请求“回调”或选择更为合理的“发布-订阅体系结构”。在

一个很好的补救措施是pubsubhubbub,但它不可避免地需要来自RSS源和聚合器的合作(超出RSS标准),所以在被称为问题的“解决方案”之前,它需要非常广泛的支持,尽管从技术上讲,它已经是(对于合作站点;-)。在

所以回到你的问题上来,你没有做错什么:你只需要像RSS聚合器那样定期进行投票,以便最终看到新的结果。在

相关问题 更多 >