决定折叠这棵树的截止点的算法？

2条回答

网友

1楼 · 编辑于 2024-04-25 12:11:06

您可以尝试使用类似于@Jeff提到的tree reconction的方法。但标准的树和解实际上会失败。在

协调首先需要在目标树中添加表示进化特征“损失”的分支。然后指出进化特征发生“重复”的节点。损失和重复的加权和提供了一个可优化的成本函数。在

但是在你的例子中，你想要解决的问题是“把这棵超级树分解成大小合适的，正交的子树”。这意味着你不会真的想要像复制一样多地获得损失。你想要一种给树评分的方法，这样它就可以显示出有多少正交子树被合并到你的超级树中。因此，您可以尝试这种评分方法：

如果我们把这个分数称为“子树因子”，那么它等于：

S1-S2/N

推论：

网友

2楼 · 编辑于 2024-04-25 12:11:06

我想我需要了解更多，然后才能给出具体的建议。但也许这会有帮助。我假设每个终端节点是一个序列，每个内部节点是一个PSSM。在

X的计算是特定于应用程序的。例如，如果你想折叠超平行对数，你得到的X和你想要折叠所有同系物时得到的X是不一样的。在

因为基因是通过复制和物种形成不断产生的，所以没有一个X值可以通过进化关系来区分序列。因此，我不认为你会找到一个满意的代理来确定序列之间的进化关系，只看集群统计。在

一种更严格的方法是从每个调控基序的基因中构建一个基因树，并将其与物种树相协调。那里有软件和附加的启发式算法来识别正射测井仪。在

如果你这样做，你的树的内部节点将被推断出的进化事件（例如，复制，物种形成）修饰。然后，您可以在树上查找不关心的类的折叠节点。在