为什么城市街区(曼哈顿距离)值在空间距离.pdist和sklearn.metric.pairwise\u距离

2024-05-16 22:26:01 发布

您现在位置:Python中文网/ 问答频道 /正文

为了解决一个问题,我需要所有向量之间的曼哈顿距离。我试过sklearn.metrics.pairwise_distances,但是大小太大了,所以为了减少内存占用,我使用scipy.spatial.distance.pdist来获得距离的压缩1D矩阵。你知道吗

我用了以下公式:

index = diagonalShape*(diagonalShape-1)/2 - (diagonalShape-i)*(diagonalShape-i-1)/2 + j - i - 1

计算1D矩阵的索引,得到ij的距离值。你知道吗

我观察到,对于许多条目,距离的形式不同于scipysklearn。当两个图书馆计算城市街区距离的公式相同时,为什么会出现这种情况?你知道吗


Tags: 内存距离index矩阵scipysklearn向量spatial