如何知道哪些SciPy/NumPy函数可以在多个核心上运行?
我想弄清楚在SciPy和NumPy中,哪些函数可以在多个处理器上运行。比如,我可以在SciPy的参考手册中看到它使用了这个功能,但我更想知道到底哪些函数可以进行并行计算,因为并不是所有的函数都支持这个功能。理想的情况是,当我输入help(SciPy.foo)的时候,能看到这些信息,但似乎并不是这样。
任何帮助都将非常感激。
祝好,
Matias
1 个回答
5
我觉得这个问题更适合问你使用的BLAS/LAPACK库,而不是SciPy/NumPy。
一些BLAS/LAPACK库,比如MKL,可以直接使用多个处理核心,而其他一些实现可能就做不到这一点。
以scipy.linalg.solve
为例,这里是它的源代码(为了清晰起见,省略了一些错误处理的代码):
def solve(a, b, sym_pos=0, lower=0, overwrite_a=0, overwrite_b=0,
debug = 0):
if sym_pos:
posv, = get_lapack_funcs(('posv',),(a1,b1))
c,x,info = posv(a1,b1,
lower = lower,
overwrite_a=overwrite_a,
overwrite_b=overwrite_b)
else:
gesv, = get_lapack_funcs(('gesv',),(a1,b1))
lu,piv,x,info = gesv(a1,b1,
overwrite_a=overwrite_a,
overwrite_b=overwrite_b)
if info==0:
return x
if info>0:
raise LinAlgError, "singular matrix"
raise ValueError,\
'illegal value in %-th argument of internal gesv|posv'%(-info)
你可以看到,它只是对两类LAPACK函数的一个简单封装(比如DPOSV
和DGESV
)。
在SciPy层面上并没有进行并行处理,但你却发现这个函数在你的系统上使用了多个核心。唯一的解释就是你的LAPACK库能够使用多个核心,而NumPy/SciPy并没有做任何事情来促成这一点。