2024-04-26 14:59:55 发布
网友
我使用python中sklearn的KMeans和silhouette_score来计算我的集群,但是在>;10.000个具有>;1000个集群的示例上计算架构得分非常慢。
剪影得分,而更吸引人的措施之一,iw O(n^2)。这意味着,计算分数比计算k-means聚类要昂贵得多!
此外,这些分数只是试探性的。它们无论如何都不会产生“最优”的组合。他们只给出了一个关于如何选择k的提示,但通常你会发现其他k更好!所以不要盲目相信这些分数。
最常用的求聚类数的方法是肘曲线法。但它需要您多次运行KMeans算法来绘制图形。https://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_setwiki页面提到了一些确定集群数量的常用方法。
剪影得分,而更吸引人的措施之一,iw O(n^2)。这意味着,计算分数比计算k-means聚类要昂贵得多!
此外,这些分数只是试探性的。它们无论如何都不会产生“最优”的组合。他们只给出了一个关于如何选择k的提示,但通常你会发现其他k更好!所以不要盲目相信这些分数。
最常用的求聚类数的方法是肘曲线法。但它需要您多次运行KMeans算法来绘制图形。https://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_setwiki页面提到了一些确定集群数量的常用方法。
相关问题 更多 >
编程相关推荐