Python：为什么这个列表的理解速度比等效的for循环慢5000倍？

with open("file.csv", 'r', newline = "\n") as f: reader = csv.reader(f, delimiter = ",") data = [] for i, r in enumerate(reader): if i >= 1000: break data.append(r) # Time: 0.005597114562988281 s

2条回答

网友

1楼 · 编辑于 2024-04-19 19:18:15

这是答案

在这部法典中

with open("file.csv", 'r', newline = "\n") as f:
    reader = csv.reader(f, delimiter = ",")
    data = []
    for i, r in enumerate(reader):
        if i >= 1000:
            break
        data.append(r)

在for作用域中，如果i >= 1000

但是在这段代码中，没有break关键字（因为您使用了列表理解）

with open("file.csv", 'r', newline = "\n") as f:
    reader = csv.reader(f, delimiter = ",")
    data = [r for i, r in enumerate(reader) if i < 1000]

为什么这么慢？因为data = [r ...]不会在i < 1000时中断，而是始终读取，直到enumerate(reader)完成。这与前面的代码不同，在前面的代码中，for作用域将在i >= 1000时中断。但不是为了列表理解

例如，您可以使用raise StopIteration或其他方法来使用类似的代码

def LoopEnd():
    raise StopIteration()

with open("file.csv", 'r', newline = "\n") as f:
    reader = csv.reader(f, delimiter = ",")
    data = [r if i < 1000 else LoopEnd() for i, r in enumerate(reader)]

网友

2楼 · 编辑于 2024-04-19 19:18:15

正如@Barmar所说，您的列表理解正在迭代您的所有csv文件行，它不会在索引1000处停止，要在索引1000处停止，您可以使用islice：

with open("file.csv", 'r', newline = "\n") as f:
    reader = csv.reader(f, delimiter = ",")
    data = [r for r in islice(reader, 0, 1000)]

与您的列表理解等效的代码，以便更好地理解花费如此长时间的原因：

with open("file.csv", 'r', newline = "\n") as f:
    reader = csv.reader(f, delimiter = ",")
    data = []
    for i, r in enumerate(reader):
        if i < 1000:
            data.append(r)
        # else iterate till the end of file

相关问题更多 >

编程相关推荐

热门问题

热门文章