使用Python进行通配符下载
我想知道怎么用Python从一个网站下载文件,文件名是有变化的。我需要定期从这个网站下载文件,但每次文件名都不一样。不过,有一部分文件名是固定的。我该怎么用通配符来指定URL中未知的文件名部分呢?
2 个回答
1
你可以试着用 ftplib 登录到ftp服务器。
from ftplib import FTP
ftp = FTP('ftp.cwi.nl') # connect to host, default port
ftp.login() # user anonymous, passwd anonymous@
ftp对象有一个 dir
方法,可以列出一个目录里的所有内容。你可以通过这个列表找到你想要的文件名。
7
如果文件名发生了变化,肯定在某个地方还有一个指向这个文件的链接(否则没人能猜到文件名)。一种常见的方法是先获取包含这个文件链接的网页,然后在网页中查找这个链接的目标,接着再发送第二个请求去获取你真正想要的文件。
一般来说,网络服务器并不会像你描述的那样提供“通配符”功能,所以你需要使用其他的方法。