从距离矩阵计算亲和矩阵

2024-06-16 10:50:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我用clustal omega得到了500个蛋白质序列的距离矩阵(它们彼此是同源的)。在

我想用亲和力传播来聚类这些序列。在

最初,因为我用手观察到距离矩阵只有0到1之间的值,0距离=100%恒等式,所以我推断我可以用(1 - distance)来获得亲和力。在

我运行我的代码,集群看起来很合理,我觉得一切都很好。。。在我读到这篇文章之前,亲和力矩阵是通过应用“热核”从距离矩阵计算出来的。当我心碎的时候。在

我是不是觉得亲和矩阵的概念不正确?有没有一种简便的计算亲和力矩阵的方法?scikit learn提供了以下公式:

similarity = np.exp(-beta * distance / distance.std())

但是什么是beta?我知道距离.std()是距离的标准偏差。在

我现在对所涉及的概念非常困惑和迷茫(与实际的编码实现相反),所以任何帮助都是非常感谢的!在

注:我试着发邮件到Biostars.org网站但我还没有得到答案。。。在


Tags: 代码概念距离序列矩阵聚类蛋白质beta
1条回答
网友
1楼 · 发布于 2024-06-16 10:50:13

我认为1-distance和exp(-beta*distance)都是将距离转换为相似性的有效方法(尽管它们在概率框架中的解释不同)。我只会用能产生更好结果的方法。在

相关问题 更多 >