相对聚类验证以选择最佳聚类数

reval的Python项目详细描述


reval:基于稳定性的相对聚类验证方法确定最佳聚类数

确定对数据集进行最佳分区的集群数量可能是一项具有挑战性的任务,因为1)缺少 无监督学习框架中的先验信息;2)缺乏唯一的聚类验证 评估聚类解决方案的方法。这里我们展示reval:一个Python包,它利用 基于稳定性的相对聚类验证方法,用于确定最佳聚类解决方案,如[1]所述。在

R和Python中的统计软件通常计算可利用的内部验证指标 选择最适合数据和易于实现的开源软件解决方案的集群数量 缺乏相关的聚类技术。相对方法相对于内部验证方法的优势 事实上,内部指标利用数据本身的特性来产生结果, 相对验证将无监督聚类算法转化为有监督的分类问题, 从而使结果具有普遍性和可复制性。在

要求

python>=3.6

安装

来自github:

^{pr2}$

PyPI替代方案:

pip install reval

文件

代码文档可以找到here。文档包括Python代码 说明,reval用法示例, 基准数据集的性能,以及可能遇到的与数据集数量的特性相关的常见问题 还有样品。在

参考文献

[1]Lange,T.,Roth,V.,Braun,M.L.和Buhmann,J.M.(2004年)。基于稳定性的聚类解决方案验证。 神经计算,16(6),1299-1323。在

引用为

Isotta Landi, Veronica Mandelli, & Michael Vincent Lombardo. (2020, June 29). 
reval: stability-based relative clustering validation method to determine the best number of clusters 
(Version v1.0.0). Zenodo. http://doi.org/10.5281/zenodo.3922334

BibTeX替代品

@software{isotta_landi_2020_3922334,
          author       = {Isotta Landi and
                          Veronica Mandelli and
                          Michael Vincent Lombardo},
          title        = {{reval: stability-based relative clustering 
                           validation method to determine the best number of
                           clusters}},
          month        = jun,
          year         = 2020,
          publisher    = {Zenodo},
          version      = {v1.0.0},
          doi          = {10.5281/zenodo.3922334},
          url          = {https://doi.org/10.5281/zenodo.3922334}
        }

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何使用SeleniumWebDriver捕获特定元素的屏幕截图而不是整个页面?   WAS 8.5中的java JAXWS异步IO异常   java Android Studio无法解析数组适配器中的符号项   swing Java在运行时添加和删除按钮   java Spring Boot 2.0。x禁用特定配置文件的安全性   java这是我的最后一个代码,我在“if(Users[B].substring(0,1)==“1”){//Find String Cut Char Function”上遇到错误   单击菜单选项后打开“活动”时发生java错误   java Tic Tac Toe NullPointerException   java如何做数学题。随机进入for循环   java Http状态404错误处理spring mvc   java循环依赖双向@OneToMany JPA关系   java我可以在不重新启动项目的情况下添加servlet吗   java在蓝色/绿色部署中如何管理共享数据库?   这是一个系统。currentTimeMillis()是Java中时间性能的最佳度量?