检查静态网站本地的死链接（使用wget？）

2条回答

网友

1楼 · 编辑于 2024-05-14 21:34:26

所以我认为你的方向是正确的。我将使用wget和{}，因为它们是许多系统上两个现成的选项。好在它能帮你完成任务。现在您需要的是从该进程的stdout中监听Serving HTTP on 0.0.0.0。在

所以我会用下面的方法开始这个过程

python3 -u -m http.server > ./myserver.log &

注意我在这里使用的-u用于无缓冲输出，这非常重要

现在，next正在等待此文本出现在myserver.log

^{pr2}$

所以10秒是您在这里的最大等待时间。剩下的是不言而喻的。接下来是关于你的kill $pid。我不认为这是一个问题，但如果你想让它更像一个用户的方式，那么我会改变它

kill -s SIGINT $pid

这相当于启动程序后处理CTRL+C。另外，我还可以使用如下方法处理SIGINT我的bash脚本

https://unix.stackexchange.com/questions/313644/execute-command-or-function-when-sigint-or-sigterm-is-send-to-the-parent-script/313648

上面的内容基本上是在bash脚本的顶部添加下面的内容，以处理使用CTRL+C或外部kill信号杀死脚本

#!/bin/bash
exit_script() {
    echo "Printing something special!"
    echo "Maybe executing other commands!"
    trap - SIGINT SIGTERM # clear the trap
    kill   -$$ # Sends SIGTERM to child/sub processes
}

trap exit_script SIGINT SIGTERM

网友

2楼 · 编辑于 2024-05-14 21:34:26

TarunLalwani的答案是正确的，按照给出的建议，可以编写一个简洁的shell脚本（依赖于Python和awk）。另一个解决方案是完全用Python编写脚本，给出一个稍微更详细但可以说更干净的脚本。服务器可以在一个线程中启动，然后执行检查网站的命令，最后关闭服务器。我们不再需要解析文本输出，也不需要向外部进程发送信号。因此，脚本的关键部分是：

def start_server(port,
                 server_class=HTTPServer,
                 handler_class=SimpleHTTPRequestHandler):
    server_address = ('', port)
    httpd = server_class(server_address, handler_class)
    thread = threading.Thread(target=httpd.serve_forever)
    thread.start()
    return httpd

def main(cmd, port):
    httpd = start_server(port)
    status = subprocess.call(cmd)
    httpd.shutdown()
    sys.exit(status)

我编写了一个稍微更高级的脚本（在此基础上进行了一些命令行选项解析），并将其发布为：https://gitlab.com/moy/check-links

相关问题更多 >

编程相关推荐

热门问题

热门文章