googleappengine上的Python脚本,只从websi中获取更新

2024-04-27 02:26:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我在googleappengine上托管了一个Python脚本,它使用bs4和mechanize来删除网站的新闻部分,它每2小时运行一次,并向我发送一封电子邮件,告诉我所有的新闻。你知道吗

问题是,我只想把最新的新闻作为邮件发送,从现在起,它每次都会给我发送所有的新闻。你知道吗

我把所有的新闻都存储在一个列表中,有没有办法只发送最新的新闻,而不是每次都发送给我的完整列表?你知道吗


Tags: 脚本列表网站邮件新闻发送给mechanize小时
1条回答
网友
1楼 · 发布于 2024-04-27 02:26:42

这个网站没有RSS或API之类的东西吗?你知道吗

无论如何,您可以在将新闻标题(可能不是唯一的)/IDs/url作为实体id存储在数据存储中,在您将它们发送到电子邮件之后&就在发送电子邮件之前,您首先检查新闻id是否存在于数据存储中,而不包括存在的once。你知道吗

或者取决于文章发表的结构和可用的数据(他们是否有犯罪后身份证?他们有文章发表的日期吗?)你可能只需要记住你以前废品的最高价值,只给你自己发邮件,里面的文章价值比以前保存的要高。你知道吗

相关问题 更多 >