python模糊levenshtein比率得到了提前退出?

2024-06-10 17:35:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着互相比较100k的琴弦。我无法进一步减小问题大小(即集合中的字符串)。我用Levenshtein比值来比较。如果比率大于0.9,我希望将这两个字符串存储在一个列表中。我的问题是关于运行时的优化。既然0.9是我的标准,有没有办法把这个值传递给左旋睾酮比率()并期望在负面情况下提前退出?如果存在提前退出的方法,可以保存一些运行时。在Levenshtein算法中,在计算完整距离之前尽早得到比值是否可行。在

例如

import Levenshtein 
Levenshtein.ratio('lot of runtime','why not an early exit in this case by taking the intended ratio')

是否有类似于:

^{pr2}$

Tags: 方法字符串算法距离列表标准情况levenshtein
1条回答
网友
1楼 · 发布于 2024-06-10 17:35:53

是的,像你假设的那样提前退出是可能的。在

Levenshtein模块的源代码是免费提供的,因此您可以自己添加该特性。在

还有另一个优化你可能想考虑:三角形不等式。如果字符串A与字符串B相似20%,而字符串B与字符串C相似90%,则知道字符串A与字符串C的相似程度不会达到90%。这是不可能的,因此根本不必计算A-C Levenshtein距离。在

相关问题 更多 >