基于soundex的印度语模糊字符串搜索算法

inexactsearch的Python项目详细描述


https://travis-ci.org/Project-SILPA/inexactsearch.svg?branch=masterhttps://coveralls.io/repos/Project-SILPA/inexactsearch/badge.png?branch=master

这是一个Fuzzy string search 申请。此应用程序演示了Edit distanceIndic Soundex算法。

< P>混合文字(编辑距离)和声音(Soudix), 我们实现了一个高效的近似字符串搜索。此应用程序 也可以跨语言字符串搜索。也就是说,你可以 在马拉雅拉姆语文本中搜索印地语单词。如果有马拉雅拉姆语的话, 这是印地语单词的近似音译,或发音相似。 印地语单词,将作为一个近似匹配返回。这个 这里使用的“类似写”算法是bigram平均算法。这个 两个字符串中常见双字图的比率和双字图的平均数目 将给出一个大于零且小于零的因子 比1.同样,soundex算法也给出了权重。由 选择比较权重大于阈值的词 权重(0.6),我们得到搜索结果。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
使用SerializationUtils时java ClassNotFoundException。克隆()   java Cucumber+spring:如何通过测试触发SmartLifecycle事件?   java如何使ProGuard以简单的方式工作?   java JSP页面显示来自集合的日期   谷歌地图检查坐标是否位于JAVA中谷歌地图API的多边形中   java如何在终端中使用“tokens”打印令牌?   java获取编译错误:包com。威里奥。sdk不存在   java会使用JAXB或类似工具自动填充HATEAOS链接吗?   Javascript(GraalJS)与Java中未签名的右移>>>>   如何在Java代码中创建jdbc请求的Jmeter测试   java如何在CellList中添加或删除单个元素?   java Progressbar:如何创建原始对象的深度副本