用于对字符串进行近似匹配和语音匹配的库。

jellyfish的Python项目详细描述


https://travis-ci.com/jamesturk/jellyfish.svg?branch=masterhttps://coveralls.io/repos/jamesturk/jellyfish/badge.png?branch=masterhttps://img.shields.io/pypi/v/jellyfish.svgDocumentation Statushttps://ci.appveyor.com/api/projects/status/9xeyl1f5sd5pl40h?svg=true

水母是一个Python库,用于进行字符串的近似和语音匹配。

作者:詹姆斯·特克和迈克尔·斯蒂芬斯

有关贡献者,请参见https://github.com/jamesturk/jellyfish/graphs/contributors

有关文档,请参见http://jellyfish.readthedocs.io

可在http://github.com/jamesturk/jellyfish找到源。

jellyfish>;=0.7只支持python 3,如果需要python 2,请使用0.6.x。

包含的算法

字符串比较:

  • Levenshtein距离
  • 达梅劳距离
  • Jaro距离
  • Jaro Winkler距离
  • 匹配评分法比较
  • 汉明距离

拼音编码:

  • 美国Soundex
  • 变音
  • 纽约州身份和情报系统
  • 匹配等级代码

示例用法

>>> import jellyfish
>>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish')
2
>>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish')
0.89629629629629637
>>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs')
1
>>> jellyfish.metaphone(u'Jellyfish')
'JLFX'
>>> jellyfish.soundex(u'Jellyfish')
'J412'
>>> jellyfish.nysiis(u'Jellyfish')
'JALYF'
>>> jellyfish.match_rating_codex(u'Jellyfish')
'JLLFSH'

运行测试

如果你对水母感兴趣,你可以 在本地运行测试。水母使用tox来运行测试,您可以 设置并运行如下:

pip install tox
# cd jellyfish/
tox

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java查找事件分派线程冲突   java画布。DrawBitmap()不会在安卓上绘制任何内容!!:(   ruby+appium或java+appium用于移动本机应用程序自动化   java Jersey REST字符编码   java使用json将字符串转换为Arraylist   java如何在Groovy中检查字符串是否与模式匹配   java如何在抽象arraylist中添加抽象arraylist   Java servlets,JSP更改内容od DIV   java在J2ME中通过http发送和接收数据,并处理菜单和屏幕   Jar文件与JAVA类路径的结合   java按钮不可见,它将连接安卓 studio中的另一个活动   java是否可以使用SFTP JSch库进行多部分文件上载?   facelet中ui:composition和ui:decoration的java差异   java得到的数字不能被任何东西除   java logback:SizeAndTimeBasedRollingPolicy不删除包含4位“%i”的文件   java数据库管理器将连接“借用”到数据库   java javaFx标签wrapText不起作用   java是否可以在同一个系统上同时运行两台服务器?或者,当XAMPP/WAMP未运行时,如何在Eclipse中执行MySQL查询?   递归Java编程