我正在写一个程序,它被设计为匹配两个序列。我已经有了两个包含SeqRecord对象的列表,后缀F和R是分开的。现在,我想从列表F中选择一个序列,并从列表R中找到最相似的序列。我想根据seq_record.id进行搜索。然后对这两个相似的序列进行全局匹配。并对列表f中的每个序列重复相同的步骤
下面是列表f中的示例id名称:BIE-1_ITS5;BIE-2_ITS5;BIE-3_ITS5;KAZ-5_-ITS5
这里来自列表r:BIE-1_ITS4;BIE-2_ITS4;BIE-3_-ITS4;KAZ-5_-ITS4
例如,对于id号为BIE-1_ITS5的序列,关键点是在列表r中找到序列BIE-1_ITS4,并对其进行全局序列对齐
将第一个与第一个、第二个与第二个匹配不是首选选项,因为可能存在没有任何对的序列
谢谢你的回答
我使用字符串匹配算法查找两个字符串的相似性分数,并找到最相似的字符串:
我得到了以下结果:
印刷词典是最相似项目的映射
注意:这不会返回唯一的映射,因为这需要更多关于如何映射的信息,即先到先得或最大匹配分数(需要有平局破发案例)
相关问题 更多 >
编程相关推荐