Python读取大文本文件（几GB）的最快方法

41 投票

1 回答

114010 浏览

提问于 2025-04-17 16:17

我有一个很大的文本文件（大约7GB）。我在寻找最快的方法来读取这个大文件。我了解到可以通过分块读取的方式来加快这个过程。

比如，effbot 提到过

# File: readline-example-3.py

file = open("sample.txt")

while 1:
    lines = file.readlines(100000)
    if not lines:
        break
    for line in lines:
        pass # do something**strong text**

这样可以每秒处理96,900行文本。还有其他作者建议使用islice()。

from itertools import islice

with open(...) as f:
    while True:
        next_n_lines = list(islice(f, n))
        if not next_n_lines:
            break
        # process next_n_lines

list(islice(f, n)) 这个代码可以返回文件f中接下来的n行。把它放在循环里用，就能把文件分成n行一块一块地读取。

性能优化内存管理行读取大文件处理数据流处理文件分块文本读取 islice

1 个回答

with open(<FILE>) as FileObj:
    for lines in FileObj:
        print lines # or do some other thing with the line...

会一次读取一行到内存中，完成后会关闭文件...

回答于 2025-04-17 由 Python大师

分享举报

Python读取大文本文件（几GB）的最快方法

1 个回答

撰写回答