不同形状阵列的距离计算

3条回答

网友

1楼 · 编辑于 2024-04-19 14:46:52

实际上，编写自己的函数并不难做到这一点——这是我的函数，欢迎使用。在

如果您在大量点和速度问题上执行此操作，我想这个函数将在很大程度上击败基于for循环的速度解决方案-numpy被设计为在整个矩阵上执行操作时高效。在

import numpy
a = numpy.array([1,1,1])
b = numpy.random.rand(20,3)

def euclidean_distances(ref_point, co_ords_array):
    diffs = co_ords_array - ref_point
    sqrd_diffs = numpy.square(diffs)
    sum_sqrd_diffs = numpy.sum(sqrd_diffs, axis = 1)
    euc_dists = numpy.sqrt(sum_sqrd_diffs)
    return euc_dists

网友

2楼 · 编辑于 2024-04-19 14:46:52

scipy.spatial.distance.euclidean的documentation声明，只允许1D向量作为输入。因此，必须在数组上循环，例如：

distances = np.empty(b.shape[0])
for i in range(b.shape[0]):
    distances[i] = scipy.spatial.distance.euclidean(a, b[i])

如果你想要一个向量化的实现，你需要写你自己的函数。也许使用带有正确签名的np.vectorize也可以，但这实际上也是for循环的简写，因此将具有与简单for循环相同的性能。在

正如我对hannes wittingham的解决方案的评论中所述，我将发布一条关注性能的消息：

^{pr2}$

写出所有的计算可以减少单独函数调用的数量，从而减少将中间结果分配给新数组的次数。因此，对于b.shape == (20, 3)的阵列形状，它比使用hannes-wittingham的解快大约22%，对于阵列形状为 b.shape == (20000, 3)：

a = np.array([1, 1, 1,])
b = np.random.rand(20, 3)
%timeit ((b - a)**2).sum(axis=1)**0.5
# 5.37 µs ± 140 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
%timeit euclidean_distances(a, b)
# 6.89 µs ± 345 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

b = np.random.rand(20000, 3)
%timeit ((b - a)**2).sum(axis=1)**0.5
# 588 µs ± 43.2 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit euclidean_distances(a, b)
# 616 µs ± 36.3 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

但是您正在失去能够轻松更改为距离计算例行程序的灵活性。当使用scipy.spatial.distance模块时，您可以通过简单地调用另一个方法来更改计算路由。在

为了进一步提高计算性能，您可以在函数中使用numba之类的jit（实时）编译器：

import numba as nb
@nb.njit
def euc(a, b):
    return ((b - a)**2).sum(axis=1)**0.5

对于小阵列，这将计算所需的时间减少约70%，而对于大型阵列，则减少约60%。不幸的是，numba还不支持np.linalg.norm的axis关键字。在

网友

3楼 · 编辑于 2024-04-19 14:46:52

这段代码将得到欧几里德规范，在许多情况下都应该有效，而且相当快，而且只有一行代码。根据需要，其他方法更有效或更灵活，我更喜欢根据所做工作发布的其他一些解决方案。在

import numpy
a = numpy.array([1,1,1])
b = numpy.random.rand(20,3)

distances = numpy.linalg.norm(a - b, axis = 1)

相关问题更多 >

编程相关推荐

热门问题

热门文章