如何知道哪些SciPy/NumPy函数可以在多个核心上运行?

5 投票
1 回答
2250 浏览
提问于 2025-04-16 22:52

我想弄清楚在SciPy和NumPy中,哪些函数可以在多个处理器上运行。比如,我可以在SciPy的参考手册中看到它使用了这个功能,但我更想知道到底哪些函数可以进行并行计算,因为并不是所有的函数都支持这个功能。理想的情况是,当我输入help(SciPy.foo)的时候,能看到这些信息,但似乎并不是这样。

任何帮助都将非常感激。

祝好,

Matias

1 个回答

5

我觉得这个问题更适合问你使用的BLAS/LAPACK库,而不是SciPy/NumPy。

一些BLAS/LAPACK库,比如MKL,可以直接使用多个处理核心,而其他一些实现可能就做不到这一点。

scipy.linalg.solve为例,这里是它的源代码(为了清晰起见,省略了一些错误处理的代码):

def solve(a, b, sym_pos=0, lower=0, overwrite_a=0, overwrite_b=0,
          debug = 0):
    if sym_pos:
        posv, = get_lapack_funcs(('posv',),(a1,b1))
        c,x,info = posv(a1,b1,
                        lower = lower,
                        overwrite_a=overwrite_a,
                        overwrite_b=overwrite_b)
    else:
        gesv, = get_lapack_funcs(('gesv',),(a1,b1))
        lu,piv,x,info = gesv(a1,b1,
                             overwrite_a=overwrite_a,
                             overwrite_b=overwrite_b)

    if info==0:
        return x
    if info>0:
        raise LinAlgError, "singular matrix"
    raise ValueError,\
          'illegal value in %-th argument of internal gesv|posv'%(-info)

你可以看到,它只是对两类LAPACK函数的一个简单封装(比如DPOSVDGESV)。

在SciPy层面上并没有进行并行处理,但你却发现这个函数在你的系统上使用了多个核心。唯一的解释就是你的LAPACK库能够使用多个核心,而NumPy/SciPy并没有做任何事情来促成这一点

撰写回答