如何每五分钟下载一个网页?

1 投票
2 回答
2810 浏览
提问于 2025-04-15 14:01

我想下载一系列网页。我知道wget这个工具可以做到这一点。不过,每五分钟下载一次所有的链接,并把它们保存到一个文件夹里,似乎超出了wget的能力。有没有人知道用Java、Python或者Perl可以完成这个任务的工具呢?

提前谢谢大家。

2 个回答

7

听起来你想要用 cron 和 wget 来实现这个功能。


不过如果你坚持要用 Python 的话:

import time
import os

wget_command_string = "wget ..."

while true:
    os.system(wget_command_string)
    time.sleep(5*60)
5

写一个bash脚本,使用wget这个工具,并把它放到你的定时任务中,让它每5分钟运行一次。你可以用这个格式来设置定时任务: (*/5 * * * *)

如果你想保存所有这些网页的历史记录,可以在脚本开始的时候设置一个变量,记录当前的时间,然后把这个时间加到输出文件的名字里。

撰写回答