使用Python列表推导计数列表中的正整数元素

62 投票

8 回答

72303 浏览

提问于 2025-04-15 23:06

我有一个整数列表，我需要计算里面有多少个数字大于0。
现在我用一种叫做列表推导的方法来实现，代码是这样的：

sum([1 for x in frequencies if x > 0])

这个方法看起来还不错，但我不太喜欢里面的“1”；感觉这个数字有点神秘，不太直观。有没有更符合Python风格的方法来做这个呢？

数据处理编程风格列表推导正整数列表计数

8 个回答

你可以在过滤后的列表上使用 len() 函数来计算它的长度：

len([x for x in frequencies if x > 0])

回答于 2025-04-15 由 Python大师

分享举报

一种更符合Python风格的方法是使用生成器：

sum(1 for x in frequencies if x > 0)

这样做可以避免在调用sum()之前先生成整个列表。

回答于 2025-04-15 由 Python大师

分享举报

如果你想减少内存的使用，可以通过使用生成器来避免生成一个临时列表：

sum(x > 0 for x in frequencies)

这是因为 bool 是 int 的一个子类：

>>> isinstance(True,int)
True

而 True 的值是 1：

>>> True==1
True

不过，正如 Joe Golton 在评论中提到的，这个方法速度不是很快。如果你有足够的内存来使用一个临时列表，那么 sth 的解决方案可能会更快。这里有一些不同解决方案的时间比较：

>>> frequencies = [random.randint(0,2) for i in range(10**5)]

>>> %timeit len([x for x in frequencies if x > 0])   # sth
100 loops, best of 3: 3.93 ms per loop

>>> %timeit sum([1 for x in frequencies if x > 0])
100 loops, best of 3: 4.45 ms per loop

>>> %timeit sum(1 for x in frequencies if x > 0)
100 loops, best of 3: 6.17 ms per loop

>>> %timeit sum(x > 0 for x in frequencies)
100 loops, best of 3: 8.57 ms per loop

要注意，使用 timeit 测试的结果可能会因为 Python 的版本、操作系统或硬件的不同而有所变化。

当然，如果你在处理一个很大的数字列表时，最好使用 NumPy：

>>> frequencies = np.random.randint(3, size=10**5)
>>> %timeit (frequencies > 0).sum()
1000 loops, best of 3: 669 us per loop

NumPy 数组所需的内存比相同的 Python 列表要少，而且计算速度比任何纯 Python 的解决方案都要快得多。

回答于 2025-04-15 由 Python大师

分享举报

使用Python列表推导计数列表中的正整数元素

8 个回答

撰写回答