r和python的快速分层集群例程。
fastcluster的Python项目详细描述
这个库提供了用于分层集群的python函数。它 从距离矩阵或矢量数据生成层次簇。
此模块的一部分用于替换功能
linkage, single, complete, average, weighted, centroid, median, ward
在模块scipy.cluster.hierarchy中,具有相同的功能,但是 更快的算法。此外,函数linkage_vector提供 矢量数据的内存高效聚类。
该接口与Matlab的统计工具箱API非常相似,可以生成代码 更容易从Matlab移植到Python/Numpy。这个的核心实现 图书馆在C++中是为了提高效率。
用户手册:fastcluster.pdf。
windows的安装文件在PyPI和Christoph Gohlke’s web page上提供。
fastcluster包被认为是稳定的,并且将进行一些更改 从现在开始。如果几年后没有任何更新,这个 并不一定意味着包未被维护,但也许它只是 不需要更正任何内容。当然,请仍然报告潜在的 与daniel@danifold.net的漏洞和不兼容。您也可以使用my GitHub repository用于错误报告、拉取请求等。
注意,pypi和github存储库托管了python的源代码 仅接口。带有r和python接口的归档文件是 在CRAN和 github存储库“cran/fastcluster”。即使我以作者的身份出现 在第二个github存储库中,这只是一个自动的只读镜像 所以请不要试图报告错误或通过 这个仓库。
克里斯托夫·达利茨写了一首纯粹的C++ interface to fastcluster。
参考文献:daniel müllner,fastcluster:fast分层,聚合 r和python的集群例程,统计软件杂志,53 (2013),第9号,1-18,http://www.jstatsoft.org/v53/i09/。