如何解析文件列表以获取Python中的文件名?

2024-04-26 01:34:30 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我使用Python的ftplib从FTP服务器检索日志文件列表。如何解析文件列表以获取列表中的文件名(最后一列)?有关输出示例,请参见上面的链接。


Tags: 文件服务器示例列表链接文件名ftpftplib
3条回答

顺便说一句,如果由于某种原因而无法使用retrline(),一个稍微不太理想的方法是将函数作为第二个参数传递给retrline();它将为列表中的每个项调用。因此,类似这样的操作(假设您有一个名为“FTP”的FTP对象)也可以:

filenames = []
ftp.retrlines('LIST', lambda line: filenames.append(line.split()[-1]))

然后,列表“file names”将是文件名的列表。

这个最好的答案

您可能希望使用ftp.nlst(),而不是ftp.retrlines()。它会给你你想要的。

如果不能,请阅读以下内容:

系统管理进程的生成器

在他现在著名的评论Generator Tricks For Systems Programmers An Introduction中,David M.Beazley给出了许多receipes来解决这种带有wiick和可重用代码的数据问题。

例如:

# empty list that will receive all the log entry
log = [] 
# we pass a callback function bypass the print_line that would be called by retrlines
# we do that only because we cannot use something better than retrlines
ftp.retrlines('LIST', callback=log.append)
# we use rsplit because it more efficient in our case if we have a big file
files = (line.rsplit(None, 1)[1] for line in log)
# get you file list
files_list = list(files)

为什么不立即生成列表?

好吧,这是因为这样做会给你带来很大的灵活性:你可以在把文件转换成files_list之前应用任何中间生成器来过滤文件:它就像管道,添加一行,添加一个进程而不会过热(因为它是生成器)。如果你摆脱了retrlines,它仍然有效,因为它甚至更好,因为你没有存储列表,哪怕一次。

编辑:好吧,我读到了另一个答案的评论,它说如果名字中有空格的话,这就不起作用了。

酷,这将说明为什么这个方法是方便的。如果你想在这个过程中改变什么,你只要改变一条线。交换:

files = (line.rsplit(None, 1)[1] for line in log)

以及

# join split the line, get all the item from the field 8 then join them
files = (' '.join(line.split()[8:]) for line in log)

好吧,这在这里可能不明显,但对于大型批处理脚本来说,这很好:-)

使用retrlines()可能不是最好的方法,因为它只是打印到控制台,所以您必须做一些棘手的事情才能获得输出。一个可能更好的方法是使用nlst()方法,它返回您想要的内容:文件名列表。

相关问题 更多 >