Python大数据矩阵操作

nstep = 200 ndiv = ndata/nstep kstep = 200 kdiv = kdata/kstep xyloop2 = np.empty((ndata, kdata, 3, 3)) for j in xrange(ndiv): ji, jf = j*nstep, (j+1)*nstep for k in xrange(kdiv): ki, kf = k*kstep, (k+1)*kstep xyloop2[ji:jf,ki:kf] = einsum('pqrs, pqsu -> pqru', x[ji:jf,ki:kf], y[ji:jf,ki:kf] )

2条回答

网友

1楼 · 编辑于 2024-04-25 09:38:49

很明显，有时einsum是有效的。p、q、r、s为100、50、3、3的示例

示例一：

%timeit tt=np.einsum('pqrs, pqsu->pqru',x,y)
100 loops, best of 3: 3.45 ms per loop

%timeit zz= np.sum(x[:,:,:,None,:]*y[:,:,:,None],axis=-2)
10000 loops, best of 3: 153 µs per loop

例二：

^{pr2}$

网友

2楼 · 编辑于 2024-04-25 09:38:49

虽然我同意这样的评论，即确定知道的唯一方法是为自己分析情况，但是有几个指导原则可以帮助您在第一次尝试时编写高效的numpy代码。以下是一些针对您的问题的建议：

创建一个新的numpy数组的开销大约是加法/乘法开销的1000倍，因此方法2应该效率低下，因为每次调用np.dot都会创建一个数组，但只执行27次加法乘法。在
如果要在python中有一个慢for循环，尽可能在最左边的轴上执行（对于C顺序数组）。在
很难高效地编写非常通用的N维代码，因此我的猜测是，作为一系列更简单的numpy调用将比np.einsum更有效。尝试C = np.sum(A[...,:,None] * B[...,:,:], axis=-2)（尽管这是相当推测性的）。在

所以我会尝试以下方法：

xyloop2 = np.empty((ndata, kdata, 3, 3))

for i in xrange(ndata):
    xyloop2[i] = np.sum(x[i,:,:,:,None] * y[i,:,None,:,:], axis=-2)

与方法2类似，但for循环要简单得多（而且效率更高）。我也把矩阵乘法换成了我认为可能更快的方法。在

相关问题更多 >

编程相关推荐

热门问题

热门文章