用Python处理大文本文件

网友

1楼 · 编辑于 2024-05-18 23:28:26

只需迭代文件对象：

with open("filename") as f:
    for line in f:
        whatever

这将进行一些内部缓冲以提高性能。{{cd1}不能对cd1}文件进行迭代，因为这样做会更糟

网友

2楼 · 编辑于 2024-05-18 23:28:26

如果您想以每行为单位执行某项操作，只需在file对象上循环：

f = open("w00t.txt")
for line in f:
    # do stuff

然而，以每行为单位执行任务可能会成为性能的实际瓶颈，所以也许您应该使用更好的块大小？例如，您可以做的是，读取4096个字节，找到以\n结尾的最后一行，对该部分进行处理，并将剩下的部分放在下一个块中。在

网友

3楼 · 编辑于 2024-05-18 23:28:26

你总是能把台词拼凑起来吗？我的意思是当你可以打开同一个文件6次并进行迭代时，为什么要打开一个文件并一直迭代呢。 e、 g

a #is the first 1024 bytes
b #is the next 1024
#etcetc
f #is the last 1024 bytes

每个文件句柄运行在一个单独的进程中，我们开始用煤气做饭。只需记住正确处理行尾。在