使用sklearn和一个大的相似性矩阵进行谱聚类

pairwise_dists = \ scipy.spatial.distance.squareform( scipy.spatial.distance.pdist(data_slice,'sqeuclidean')) similarity_matrix = scipy.exp(-pairwise_dists /(2 * self._sigma ** 2))

1条回答

网友

1楼 · 发布于 2024-05-14 13:02:32

谱聚类计算不同矩阵的特征向量。在

这个矩阵的大小为O（n^2），因此几乎任何实现都需要O（n2）内存。在

16000x1600x4（假设使用浮动存储，无开销）约为1gb。它可能需要一个工作拷贝（比如scipy.exp这样的方法可能会产生一个矩阵的副本；并且可能会有两倍的精度），以及一些开销，这就是为什么您最终使用3GB。。。在

这种算法不适用于大数据，就像其他需要O（n^2）内存的算法一样。选择一种不同的算法；也许可以使用索引结构来加速。或者减小数据集的大小，例如通过采样。在

编程相关推荐

安卓中通过TCP发送时java文件损坏
Java测试预期=异常失败，断言错误
java ssh4 LazyInitializationException
java是否可以在集合中添加重复项？
java是一个免费的开源数据库管理工具
java是否可以在导出的html中嵌入图像
编译器构造解释一些东西，并用Java运行生成的字节码？
java KeyPairGenerator未生成随机密钥
java使用正则表达式生成字符串而不是匹配字符串
java中的多线程线程间通信

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用sklearn和一个大的相似性矩阵进行谱聚类

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >