numpy.cross() 性能差

9 投票
4 回答
3616 浏览
提问于 2025-04-15 17:31

我最近在做一些性能测试,目的是为了提高我正在写的一个小项目的性能。这个项目需要进行大量的数字计算,所以我尝试使用Numpy来提升计算的效率。

不过,以下的性能测试结果让我感到很意外……

测试源代码 (更新了关于提升和批量提交的测试用例)

import timeit

numpySetup = """
import numpy
left = numpy.array([1.0,0.0,0.0])
right = numpy.array([0.0,1.0,0.0])
"""

hoistSetup = numpySetup +'hoist = numpy.cross\n'

pythonSetup = """
left = [1.0,0.0,0.0]
right = [0.0,1.0,0.0]
"""

numpyBatchSetup = """
import numpy

l = numpy.array([1.0,0.0,0.0])
left = numpy.array([l]*10000)

r = numpy.array([0.0,1.0,0.0])
right = numpy.array([r]*10000)
"""

pythonCrossCode = """
x = ((left[1] * right[2]) - (left[2] * right[1]))
y = ((left[2] * right[0]) - (left[0] * right[2]))
z = ((left[0] * right[1]) - (left[1] * right[0]))
"""

pythonCross = timeit.Timer(pythonCrossCode, pythonSetup)
numpyCross = timeit.Timer ('numpy.cross(left, right)' , numpySetup)
hybridCross = timeit.Timer(pythonCrossCode, numpySetup)
hoistCross = timeit.Timer('hoist(left, right)', hoistSetup)
batchCross = timeit.Timer('numpy.cross(left, right)', numpyBatchSetup) 

print 'Python Cross Product : %4.6f ' % pythonCross.timeit(1000000)
print 'Numpy Cross Product  : %4.6f ' % numpyCross.timeit(1000000) 
print 'Hybrid Cross Product : %4.6f ' % hybridCross.timeit(1000000) 
print 'Hoist Cross Product  : %4.6f ' % hoistCross.timeit(1000000) 
# 100 batches of 10000 each is equivalent to 1000000
print 'Batch Cross Product  : %4.6f ' % batchCross.timeit(100) 

原始结果

Python Cross Product : 0.754945 
Numpy Cross Product  : 20.752983 
Hybrid Cross Product : 4.467417 

最终结果

Python Cross Product : 0.894334 
Numpy Cross Product  : 21.099040 
Hybrid Cross Product : 4.467194 
Hoist Cross Product  : 20.896225 
Batch Cross Product  : 0.262964 

不用说,这个结果完全出乎我的意料。纯Python版本的速度几乎比Numpy快了30倍。而在其他测试中,Numpy的表现确实比Python版本要好,这也是我原本预期的结果。

所以,我有两个相关的问题:

  • 有没有人能解释一下为什么在这种情况下NumPy的表现这么差?
  • 有没有什么办法可以解决这个问题?

4 个回答

1

为了减少调用numpy时的开销,你可以尝试使用cython作为中间工具来调用numpy的函数。

详细信息可以查看 使用Cython进行快速数值计算(SciPy 2009)

5

你可以在这里查看源代码: http://www.google.com/codesearch/p?hl=en#5mAq98l-MUw/trunk/dnumpy/numpy/core/numeric.py&q=cross%20package:numpy&sa=N&cd=1&ct=rc

numpy.cross 这个函数处理了很多情况,并且做了一些额外的复制。

一般来说,numpy 在处理像矩阵乘法或求逆这样的慢操作时,速度已经足够快了,但对于像小向量这样的操作,开销会比较大。

6

试试用更大的数组。我觉得这里调用numpy的方法的开销,超过了Python版本中简单的几个列表访问。如果你处理更大的数组,我认为你会发现使用numpy会有很大的优势。

撰写回答