使用Python列表推导计数列表中的正整数元素
我有一个整数列表,我需要计算里面有多少个数字大于0。
现在我用一种叫做列表推导的方法来实现,代码是这样的:
sum([1 for x in frequencies if x > 0])
这个方法看起来还不错,但我不太喜欢里面的“1”;感觉这个数字有点神秘,不太直观。有没有更符合Python风格的方法来做这个呢?
8 个回答
10
你可以在过滤后的列表上使用 len()
函数来计算它的长度:
len([x for x in frequencies if x > 0])
35
一种更符合Python风格的方法是使用生成器:
sum(1 for x in frequencies if x > 0)
这样做可以避免在调用sum()
之前先生成整个列表。
99
如果你想减少内存的使用,可以通过使用生成器来避免生成一个临时列表:
sum(x > 0 for x in frequencies)
这是因为 bool
是 int
的一个子类:
>>> isinstance(True,int)
True
而 True
的值是 1:
>>> True==1
True
不过,正如 Joe Golton 在评论中提到的,这个方法速度不是很快。如果你有足够的内存来使用一个临时列表,那么 sth 的解决方案 可能会更快。这里有一些不同解决方案的时间比较:
>>> frequencies = [random.randint(0,2) for i in range(10**5)]
>>> %timeit len([x for x in frequencies if x > 0]) # sth
100 loops, best of 3: 3.93 ms per loop
>>> %timeit sum([1 for x in frequencies if x > 0])
100 loops, best of 3: 4.45 ms per loop
>>> %timeit sum(1 for x in frequencies if x > 0)
100 loops, best of 3: 6.17 ms per loop
>>> %timeit sum(x > 0 for x in frequencies)
100 loops, best of 3: 8.57 ms per loop
要注意,使用 timeit 测试的结果可能会因为 Python 的版本、操作系统或硬件的不同而有所变化。
当然,如果你在处理一个很大的数字列表时,最好使用 NumPy:
>>> frequencies = np.random.randint(3, size=10**5)
>>> %timeit (frequencies > 0).sum()
1000 loops, best of 3: 669 us per loop
NumPy 数组所需的内存比相同的 Python 列表要少,而且计算速度比任何纯 Python 的解决方案都要快得多。