使用Python进行通配符下载

1 投票
2 回答
1672 浏览
提问于 2025-04-15 13:59

我想知道怎么用Python从一个网站下载文件,文件名是有变化的。我需要定期从这个网站下载文件,但每次文件名都不一样。不过,有一部分文件名是固定的。我该怎么用通配符来指定URL中未知的文件名部分呢?

2 个回答

1

你可以试着用 ftplib 登录到ftp服务器。

from ftplib import FTP
ftp = FTP('ftp.cwi.nl')   # connect to host, default port
ftp.login()               # user anonymous, passwd anonymous@

ftp对象有一个 dir 方法,可以列出一个目录里的所有内容。你可以通过这个列表找到你想要的文件名。

7

如果文件名发生了变化,肯定在某个地方还有一个指向这个文件的链接(否则没人能猜到文件名)。一种常见的方法是先获取包含这个文件链接的网页,然后在网页中查找这个链接的目标,接着再发送第二个请求去获取你真正想要的文件。

一般来说,网络服务器并不会像你描述的那样提供“通配符”功能,所以你需要使用其他的方法。

撰写回答