我想用一个链接运行层次聚类,用300个特性和1500个观察值对文档进行聚类。我想找到这个问题的最佳簇数。在
下面的链接使用下面的代码来查找具有最大间隙的簇的数量。在
# Compute gap statistic
set.seed(123)
iris.scaled <- scale(iris[, -5])
gap_stat <- clusGap(iris.scaled, FUN = hcut, K.max = 10, B = 50)
# Plot gap statistic
fviz_gap_stat(gap_stat)
但在这一环节中,hcut的定义并不明确。{cdi>如何指定单层次链接?在
在python中我们是否有一个等价的clusGap()
?在
谢谢
hcut()
函数是您发布的链接中使用的factorextra
包的一部分:R还有一个内置函数
hclust()
,可用于执行层次聚类。但是,在默认情况下,它不执行单链接聚类,因此不能简单地将hcut
替换为hclust
。在但是,如果您查看
clusGap()
的帮助,您将看到您可以提供要应用的自定义群集函数:hclust()
函数能够执行单链接层次聚类,因此您可以执行以下操作:相关问题 更多 >
编程相关推荐