如何测量高斯混合气的性能?

2024-04-24 16:54:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个有27211个样本和90个属性的数据集。此数据集没有类标签。我想让高斯混合适合数据集,但我不知道如何衡量性能。你能帮助我吗?在

^{1}$

Tags: 数据属性标签性能样本
2条回答

因为你没有一个基本的事实(标签),你不能给出一个明确的性能估计,必须依赖于一个指标的选择。评价集群的质量是一个相当普遍的问题。因此,有大量的文件:

有几个选项来衡量这个无监督案件的表现。对于基于真实概率的GMM,最常见的是BIC和{a2}。它们立即包含在scikit GMM类中。在

但是,还有很多度量标准可以用来衡量一般集群的性能。它们在scikit documentation中有很好的描述。我觉得Silhouette-score有点直觉。在

你可以在无监督学习中使用不同的绩效评估。scikit-learn提供了一些信息here。有些评价是相互信息的。另外,this post可以给你一些见解。在

相关问题 更多 >