如何用Python编写一个不停歇的爬虫并在服务器上运行?

6 投票
1 回答
1611 浏览
提问于 2025-04-18 17:17

我想用Python写一个爬虫,让它去访问一些网址,抓取数据并保存下来。我知道怎么写一个简单的程序,但我想把它放到我的虚拟服务器上(运行的是Ubuntu系统),让它一直不停地工作。有没有人能告诉我该怎么做呢?

1 个回答

5

你想要做的就是把这个程序变成一个守护进程。这个链接会对你创建守护进程有帮助。

把程序变成守护进程后,它就可以在后台运行。这样,只要服务器在运行(即使没有用户登录),它就会一直运行下去。

下面是一个示例守护进程,它会把时间写入一个文件。

import daemon
import time

def do_something():
    while True:
        with open("/tmp/current_time.txt", "w") as f:
            f.write("The time is now " + time.ctime())
        time.sleep(5)

def run():
    with daemon.DaemonContext():
        do_something()

if __name__ == "__main__":
    run()

撰写回答