如何拼凑DNA的短片段？序列文件中的匹配碱基对

2条回答

网友

1楼 · 编辑于 2024-06-16 16:37:08

您只需在第二个序列中找到匹配序列的索引并将它们串联起来：

seq1 = 'AAAGGGTTTCCCGGGAAATCA'
seq2 = 'CCCGGGAAATCAGGGAAATTT'
match_pair_count = 5
match_seq = seq1[-match_pair_count:]
match_index = seq2.rfind(match_seq)
combined_seq = seq1[:-match_pair_count] + seq2[match_index:]

注意：如果您需要捕捉匹配序列没有出现在第二个序列中的情况，则需要添加代码来处理match_index == -1。你知道吗

网友

2楼 · 编辑于 2024-06-16 16:37:08

每个子序列的简单解计算5尾和5头。然后尝试所有与死神优先搜索的组合。你知道吗

一种更复杂的方法来绘制一个图形，其中有向边被标记为多个共线字母（比如4-9）。应用旅行商解或其他合适的算法来寻找所有顶点的最短路径。你知道吗

我确信有很多适合于基因组推断的工具和技术。https://www.youtube.com/watch?v=fGxx7TvQ3f4。你知道吗

为了找出两个序列之间的距离，将一个序列倒过来，找到最长的公共前缀。你知道吗

定义joinifmatch（seq1，seq2，minlen=4）：尾部=序列2[：4] 对于范围内的i（len（seq1），4，-1）如果seq1.startswith（seq2[n-i:]）返回“%s%s”（seq2[：n-i]，seq1）

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何拼凑DNA的短片段？序列文件中的匹配碱基对

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >