快速和内存高效的群集
pqkmeans的Python项目详细描述
pqk意味着[matsui、ogaki、yamasaki和aizawa,acmmm 17]是一个python库,用于高效地对大规模数据进行集群。pqk-means首先将输入向量压缩成短乘积量化(pq)码,即使是对高维向量,也能实现快速、高效的聚类。与k-means类似,pqk-means重复分配和更新步骤,这两个步骤都可以在pq代码域中执行。 为了比较,我们提供了用于二进制转换的itq编码和用于二进制码聚类的二进制k均值[gong+,cvpr 15]。 该库是用C++编写的,主要用于Python的包装器。所有编码/集群代码都与scikit learn兼容。