如何将numpy.linalg.norm应用于矩阵的每一行?

2024-04-24 09:05:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个二维矩阵,我想取每一行的范数。但当我直接使用numpy.linalg.norm(X)时,它取整个矩阵的范数。

我可以使用for循环获取每一行的norm,然后获取每个X[i]的norm,但这需要很长时间,因为我有3万行。

有什么建议可以找到更快的方法吗?或者可以对矩阵的每一行应用np.linalg.norm


Tags: 方法numpy范数normfornp矩阵建议
3条回答

注意,作为perimosocordiae shows,从NumPy版本1.9开始,np.linalg.norm(x, axis=1)是计算二级规范的最快方法。


如果要计算二级规范,可以直接计算(使用axis=-1参数沿行求和):

np.sum(np.abs(x)**2,axis=-1)**(1./2)

当然,Lp范数也可以类似地计算。

它比np.apply_along_axis快得多,尽管可能不太方便:

In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop

In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop

其他ord形式的norm也可以直接计算(具有类似的加速比):

In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop

In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop

由于numpy更新而复活旧问题。从1.9版本开始,numpy.linalg.norm现在接受一个axis参数。[codedocumentation]

这是城里最快的新方法:

In [10]: x = np.random.random((500,500))

In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop

In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop

In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop

为了证明它在计算同样的东西:

In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True

比公认的答案快得多

numpy.sqrt(numpy.einsum('ij,ij->i', a, a))

注意对数刻度:

enter image description here


复制绘图的代码:

import numpy
import perfplot


def sum_sqrt(a):
    return numpy.sqrt(numpy.sum(numpy.abs(a)**2, axis=-1))


def apply_norm_along_axis(a):
    return numpy.apply_along_axis(numpy.linalg.norm, 1, a)


def norm_axis(a):
    return numpy.linalg.norm(a, axis=1)


def einsum_sqrt(a):
    return numpy.sqrt(numpy.einsum('ij,ij->i', a, a))


perfplot.show(
    setup=lambda n: numpy.random.rand(n, 3),
    kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
    n_range=[2**k for k in range(20)],
    logx=True,
    logy=True,
    xlabel='len(a)'
    )

相关问题 更多 >