两两平方差的有效Numpy计算

a = np.array([[ 4, 2, 3], [-1, -5, 4], [ 2, 1, 4], [-5, -1, 4], [6, -3, 3]]) a = a.reshape((5,1,3)) m = a.shape[0] n = a.shape[2] d = np.zeros((n,n)) for i in range(m): c = a[i,:] - np.transpose(a[i,:]) c = c**2 d += c print d [[ 0. 118. 120.] [ 118. 0. 152.] [ 120. 152. 0.]]

2条回答

网友

1楼 · 编辑于 2024-04-29 15:12:37

可以使用以下方法消除for循环：

In [48]: ((a - a.swapaxes(1,2))**2).sum(axis=0)
Out[48]: 
array([[  0, 118, 120],
       [118,   0, 152],
       [120, 152,   0]])

注意，如果a具有形状(N, 1, M)，那么{}具有形状{}。确保有足够的内存来容纳这种大小的数组。页面交换也会降低计算速度。在

如果内存太少，则必须将计算分成块：

^{2}$

这是对整个数组执行计算和逐行计算。如果有一百万行，而chunksize是10**4，那么循环只会有100次迭代，而不是100万次。因此，它应该比逐行计算要快得多。选择允许在RAM中执行计算的chunksize的最大值。在

网友

2楼 · 编辑于 2024-04-29 15:12:37

如果您不介意对scipy的依赖，可以使用^{}库中的函数：

In [17]: from scipy.spatial.distance import pdist, squareform

In [18]: a = np.array([[ 4,  2,  3], [-1, -5,  4], [ 2,  1,  4], [-5, -1,  4], [6, -3,  3]])

In [19]: d = pdist(a.T, metric='sqeuclidean')

In [20]: d
Out[20]: array([ 118.,  120.,  152.])

In [21]: squareform(d)
Out[21]: 
array([[   0.,  118.,  120.],
       [ 118.,    0.,  152.],
       [ 120.,  152.,    0.]])

相关问题更多 >

编程相关推荐

热门问题

热门文章