仅获取web页面的顶部

2024-04-24 20:46:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在设计RSS提要程序,但遇到以下问题: RSS检查器显然需要偶尔查看提要是否已更新。由于feedparser中对.etag和.modified项的支持程度较低,我至少在纸上提出了一个解决方案。 我的理论是,如果你能打开一个网页,从中读到你得到的第一个条目,然后将该条目与当前下载的提要中的第一个条目进行比较,你就可以确定提要是否是最新的。 现在,我的问题来了。我不知道如何只检索网页的一部分。 我尝试过使用urlib2.urlopen,但时间测试似乎建议它在打开页面之前先以某种方式下载页面。这是错的吗?如果是这样,那太好了! 如果不是,那么,悲伤的脸。 我想知道是否有人能为我提供一个答案,告诉我如何打开一个网页,并且只能逐行下载。 我在这里的主要目标是尽可能少地使用用户的互联网数据。 我希望这个问题措辞恰当。 谢谢你的帮助


Tags: 程序网页时间条目页面解决方案理论建议