基于密度峰值快速搜索和查找的python聚类包
Dcluster的Python项目详细描述
这个python包实现了alex rodriguez和alessandro laio提出的集群算法。它生成每个观测的初始rho和delta值,然后使用这些值将观测值分配给簇。
安装
这个版本适用于python2和python3。 第一步是安装python。python可从Python project page获得。dcluster依赖于numpy和matplotlib。下一步是安装dcluster。
您可以在Github或PyPi下载dcluster的源代码,然后运行:
$ python setup.py install
或者使用python的包管理器pip从pypi安装:
$ pip install Dcluster
用法
唯一的输入是观测值之间的距离度量。见test.dat。dcluster支持基于决策图的交互聚类:
import Dcluster as dcl filein="test.dat" dcl.run(fi=filein, sep='\t')
测试数据
请参阅test/中的test.dat。基于决策图可以选择不同的聚类中心。请先按“N”键,然后按“回车”键退出。结果将自动保存。
参考文献
Rodriguez,A.,&Laio,A.(2014年)。通过快速搜索和密度峰值的发现进行聚类。科学,344(6191),1492-1496。(paper)