为什么scipy.cluster.hierarchy.linkage需要度量?
我们需要传递一个距离矩阵,所以应该不需要再计算其他的距离,对吧?我是不是漏掉了什么?
这里的文档: http://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.cluster.hierarchy.linkage.html
2 个回答
0
我觉得这个指标是用来计算新形成的聚类之间的距离的(这取决于我们使用哪种方法)。
3
linkage
函数不需要 metric
参数,除非你传入的是原始数据而不是距离矩阵。
根据你提供的链接:
y : ndarray
[...] 另外,也可以传入一个包含 m 个观测向量的 n 维数组,形状为 m 行 n 列。
linkage
函数会检查你传入的是否是有效的距离矩阵——这可能是通过 is_valid_y
或 is_valid_dm
来判断。如果不是有效的距离矩阵,它会先使用你指定的度量方法来应用 pdist
(如果没有指定,就会使用欧几里得距离)。