如何使用kdtrees来确定字符串的相似性?

2024-06-02 09:10:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图利用k-最近邻来解决字符串相似性问题,即给定一个字符串和一个知识库,我想输出k个与给定字符串相似的字符串。有没有什么教程可以解释如何利用kd树高效地进行k-最近邻查找字符串?字符串长度不能超过20个字符。在


Tags: 字符串利用知识库教程相似性kd个字符
1条回答
网友
1楼 · 发布于 2024-06-02 09:10:03

可能是我一年前读过的最热门的博客文章之一:Levenstein Automata。看看那篇文章。它不仅提供了算法的描述,还提供了要遵循的代码。从技术上讲,它不是kd树,但它与在现实世界中可能遇到/使用的字符串匹配和字典更正算法有很大关系。在

{2还有一个更好的匹配字符串的博客。这是另一个包含BK-tree源代码的资源(这个我无法验证其准确性或正确实现)

相关问题 更多 >