用于对字符串进行近似匹配和语音匹配的库。

my3n-test1-jellyfish的Python项目详细描述


https://travis-ci.org/jamesturk/jellyfish.svg?branch=masterhttps://coveralls.io/repos/jamesturk/jellyfish/badge.png?branch=masterhttps://img.shields.io/pypi/v/jellyfish.svgDocumentation Statushttps://ci.appveyor.com/api/projects/status/9xeyl1f5sd5pl40h?svg=true

水母是一个Python库,用于进行字符串的近似和语音匹配。

作者:詹姆斯·特克和迈克尔·斯蒂芬斯。

有关贡献者,请参见https://github.com/jamesturk/jellyfish/graphs/contributors

有关文档,请参见http://jellyfish.readthedocs.io

可在http://github.com/jamesturk/jellyfish找到源。

jellyfish>;=0.7只支持python 3,如果需要python 2,请使用0.6.x。

包含的算法

字符串比较:

  • Levenshtein距离
  • 距离
  • Jaro距离
  • Jaro Winkler距离
  • 匹配评分法比较
  • 汉明距离

拼音编码:

  • 美国Soundex
  • 变音
  • 纽约州身份和情报系统
  • 匹配等级代码

示例用法

>>> import jellyfish
>>> jellyfish.levenshtein_distance(u'jellyfish', u'smellyfish')
2
>>> jellyfish.jaro_distance(u'jellyfish', u'smellyfish')
0.89629629629629637
>>> jellyfish.damerau_levenshtein_distance(u'jellyfish', u'jellyfihs')
1
>>> jellyfish.metaphone(u'Jellyfish')
'JLFX'
>>> jellyfish.soundex(u'Jellyfish')
'J412'
>>> jellyfish.nysiis(u'Jellyfish')
'JALYF'
>>> jellyfish.match_rating_codex(u'Jellyfish')
'JLLFSH'

运行测试

如果你对水母感兴趣,你可以 在本地运行测试。水母使用tox来运行测试,您可以 设置并运行如下:

pip install tox
# cd jellyfish/
tox

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java WebClient请求级别超时抛出名为default onErrorDropped的运算符   java JAXB外部绑定文件错误   Freemarker中的java转义宏参数值   java正在同步来自不同对象{已编辑}的线程   java如何在另一个类上更新活动中的元素   java Hibernate连接查询   java可以使用Apache Crunch创建类似于图形的数据结构吗?   java在JLabel的开头加上3个点   java 安卓应用程序显示线程错误   java@RequestBody在Spring中总是空的   java Android异步任务永远不会结束   具有多个属性的java Jaxws枚举   java中的安卓 Stripe InvalidRequestException   多线程java。util。非多线程程序中的ConcurrentModificationException   Minecraft Java插件如何删除HashMap中存储的所有块   空Java字符串的大小   从AJP连接器请求检索Shibboleth属性的java   oracle11g将Java类文件加载到Oracle数据库