在python中设置Levenshtein(edit)距离的上限

2021-05-13 13:09:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要计算DNA序列之间的编辑距离以便将相似的序列组合在一起。如果序列的距离大于某个阈值,它们就被认为是不同的,我不在乎实际值是多少,所以自然我想设置一个Levenshtein距离的上界,并让函数在通过它时停止。增值税大多数的比较都应该以这个结果结束。在

我发现在python/C中有一些用python/C包装的快速实现,例如python-Levenshtein和{a2},但令我惊讶的是,这些或其他人都没有设置上限的选项,我认为这是基本的。我可以使用全python实现并修改它,但它比C实现慢得多。在

有没有人知道python工具允许这样做,或者知道如何调整实现,使其在某个阈值之后停止?在

谢谢