2024-04-24 16:54:33 发布
网友
我有一个有27211个样本和90个属性的数据集。此数据集没有类标签。我想让高斯混合适合数据集,但我不知道如何衡量性能。你能帮助我吗?在
因为你没有一个基本的事实(标签),你不能给出一个明确的性能估计,必须依赖于一个指标的选择。评价集群的质量是一个相当普遍的问题。因此,有大量的文件:
有几个选项来衡量这个无监督案件的表现。对于基于真实概率的GMM,最常见的是BIC和{a2}。它们立即包含在scikit GMM类中。在
但是,还有很多度量标准可以用来衡量一般集群的性能。它们在scikit documentation中有很好的描述。我觉得Silhouette-score有点直觉。在
你可以在无监督学习中使用不同的绩效评估。scikit-learn提供了一些信息here。有些评价是相互信息的。另外,this post可以给你一些见解。在
scikit-learn
因为你没有一个基本的事实(标签),你不能给出一个明确的性能估计,必须依赖于一个指标的选择。评价集群的质量是一个相当普遍的问题。因此,有大量的文件:
有几个选项来衡量这个无监督案件的表现。对于基于真实概率的GMM,最常见的是BIC和{a2}。它们立即包含在scikit GMM类中。在
但是,还有很多度量标准可以用来衡量一般集群的性能。它们在scikit documentation中有很好的描述。我觉得Silhouette-score有点直觉。在
你可以在无监督学习中使用不同的绩效评估。
scikit-learn
提供了一些信息here。有些评价是相互信息的。另外,this post可以给你一些见解。在相关问题 更多 >
编程相关推荐