从网页递归下载文件

2 投票

4 回答

3104 浏览

提问于 2025-04-16 05:38

我其实想把这些文件都下载到我的电脑上。

你可以看到有很多文件夹，每个文件夹里都有不同类型的文件。

而且你不能直接下载“整个文件夹”...只能下载里面的单个文件。

有没有什么办法可以自动化这个过程呢？

我需要用正则表达式来处理网址，把它们整理成像“文件夹”一样的结构。

我应该用什么呢...像Python这样的脚本语言吗？

正则表达式数据处理自动化脚本网络爬虫文件管理文件夹结构网页下载递归下载

4 个回答

wget 是一个 GNU 的命令行工具，可以帮你完成这个任务。你想要做的事情的相关说明可以在这里找到：http://www.gnu.org/software/wget/manual/html_node/Recursive-Retrieval-Options.html

回答于 2025-04-16 由 Python大师

分享举报

看看这个叫做 wget 的工具吧。它可以完全满足你的需求。

回答于 2025-04-16 由 Python大师

分享举报

一个简单的解决办法是使用FTP：

ftp://examples.oreilly.com/pub/examples/9780735615366/

这是针对你给出的例子的...

回答于 2025-04-16 由 Python大师

分享举报