我试图将基因型相似的动物分为4类。数据被标记,我们知道被分配给每个被测对象的基因型。我能够得到97%的测试精度使用随机森林分类器没有过/欠拟合。然而,我的问题是,基因型在现实中并不是完全不同的,它们之间可能存在一些相互关系/协方差。因此,我不想为新实例确定不同的基因型,而是想找出一个新实例属于四个类中任何一个的概率(例如,80%的类1,10%的类2,10%的类3)
我刚刚在Scikit learn中学习了高斯混合模型(GMM)。所以,我的问题是:第一,GMM是否是解决这个问题的合适方法,第二,对其他算法的建议。你知道吗
Tags:
我想我找到了解决办法。这将是多项逻辑回归。你知道吗
相关问题 更多 >
编程相关推荐