原生Python中的DNA序列比对（没有生物球）

网友

1楼 · 编辑于 2024-05-14 14:39:43

您可以很简单地使用regex来实现这一点？我不认为会那么复杂！事实上，我刚刚完成了一些代码，为这里的大学里的一个家伙做了一些与此类似的事情！在

如果不寻找引物的精确拷贝，由于突变，那么可以应用模糊匹配元素！我所做的版本只是在开始和结束处查找完全匹配的底漆，然后使用以下代码返回值减去这些底漆：

pattern = "^" + start_primer + "([A-Z]+)" + end_primer + "$" # start primer and end primer are sequences you are looking to match
regex = re.match(pattern, sequence) # sequence is the DNA sequence you are analyzing
print regex.group(1) # prints the sequence between the start and end primers

下面是python中fuzzy regex的链接http://hackerboss.com/approximate-regex-matching-in-python/

网友

2楼 · 编辑于 2024-05-14 14:39:43

下面是一篇关于这个主题的论文：

Rocke, On finding novel gapped motifs in DNA sequences, 1998。在

希望从那篇论文及其参考文献中，再加上引用上述内容的其他论文，你可以找到许多算法的想法。虽然找不到python代码，但是可以找到算法的描述，然后可以在python中实现这些算法。在

网友

3楼 · 编辑于 2024-05-14 14:39:43

简单地研究一下这个算法，这不是一件容易的事。这需要一些非常严肃的算法工作。试着把你的期望从“小时”调整到“几天或几周”。在

实现这一点的程序员需要：

精通通用python编程
有算法编程经验，对时间复杂度有很好的理解。在
很好地理解python数据结构，如dict、set和deque，以及它们的复杂性特征。在
熟悉单元测试。在

那个程序员现在可能是也可能不是你。这听起来是个很棒的项目，祝你好运！在

相关问题更多 >

编程相关推荐

热门问题

热门文章

原生Python中的DNA序列比对（没有生物球）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >