使用Python列表推导计数列表中的正整数元素

62 投票
8 回答
72303 浏览
提问于 2025-04-15 23:06

我有一个整数列表,我需要计算里面有多少个数字大于0。
现在我用一种叫做列表推导的方法来实现,代码是这样的:

sum([1 for x in frequencies if x > 0])

这个方法看起来还不错,但我不太喜欢里面的“1”;感觉这个数字有点神秘,不太直观。有没有更符合Python风格的方法来做这个呢?

8 个回答

10

你可以在过滤后的列表上使用 len() 函数来计算它的长度:

len([x for x in frequencies if x > 0])
35

一种更符合Python风格的方法是使用生成器:

sum(1 for x in frequencies if x > 0)

这样做可以避免在调用sum()之前先生成整个列表。

99

如果你想减少内存的使用,可以通过使用生成器来避免生成一个临时列表:

sum(x > 0 for x in frequencies)

这是因为 boolint 的一个子类:

>>> isinstance(True,int)
True

True 的值是 1:

>>> True==1
True

不过,正如 Joe Golton 在评论中提到的,这个方法速度不是很快。如果你有足够的内存来使用一个临时列表,那么 sth 的解决方案 可能会更快。这里有一些不同解决方案的时间比较:

>>> frequencies = [random.randint(0,2) for i in range(10**5)]

>>> %timeit len([x for x in frequencies if x > 0])   # sth
100 loops, best of 3: 3.93 ms per loop

>>> %timeit sum([1 for x in frequencies if x > 0])
100 loops, best of 3: 4.45 ms per loop

>>> %timeit sum(1 for x in frequencies if x > 0)
100 loops, best of 3: 6.17 ms per loop

>>> %timeit sum(x > 0 for x in frequencies)
100 loops, best of 3: 8.57 ms per loop

要注意,使用 timeit 测试的结果可能会因为 Python 的版本、操作系统或硬件的不同而有所变化。

当然,如果你在处理一个很大的数字列表时,最好使用 NumPy:

>>> frequencies = np.random.randint(3, size=10**5)
>>> %timeit (frequencies > 0).sum()
1000 loops, best of 3: 669 us per loop

NumPy 数组所需的内存比相同的 Python 列表要少,而且计算速度比任何纯 Python 的解决方案都要快得多。

撰写回答