用于计算字符串编辑距离和相似性的python扩展。
python-Levenshtein的Python项目详细描述
内容
Introduction
levenshtein python c扩展模块包含快速 计算
- levenshtein(编辑)距离和编辑操作
- 字符串相似性
- 近似中值字符串,一般字符串平均
- 字符串序列和集合相似性
它支持普通字符串和Unicode字符串。
需要Python2.2或更新版本;支持Python3。
py是一个示例SequenceMatcher类类,构建在 利文施坦。它错过了SequenceMatcher的一些功能,并且有一些 额外的奥托。
levenshtein.c也可以用作纯c库。你只需要定义 编译时没有python预处理器符号(-dno_python)。这个 功能类似于python扩展。没有单独的文档 已经准备好了,rtfs。但它们不能互换:
- 使用-dno_python编译时导出的C函数(请参见levenshtein.h) 在编译为python扩展时不导出(反之亦然)
- 与-dno_python一起使用的unicode字符类型是wchar_t,python扩展名 使用py_unicode,它们可能相同,但不依赖于它
Documentation
gendoc.sh生成HTML API文档, 你可能想要一个自包含的版本而不是可包含的版本,所以运行 在./gendoc.sh --selfcontained中。它需要Levenshtein已经安装 还有genextdoc.py。
License
Levenshtein可以根据GNU General的条款进行复制和/或修改 公共许可证,请参阅文件复制以获取完整的许可证文本。
History
这个包从pypi中丢失很久了,只能作为源签出使用。 我们需要为Go Mobile for Plone还原此包 以及依赖于此的Pywurfl项目。
0.12.0
- 修正了stringmatcher.stringmatcher.get_matching_块中的错误/ 解压缩python 3的editops;现在只允许 Python2和Python3,都是为了更简单和更有效的代码。
- 在源发行版和git中添加了文档
- 修复了包布局:将.so/.dll重命名为'u levenshtein, 把它和StringMatcher一起放在一个包里 上课。
- 修正了拼写错误。
0.11.2
- 修复了setup.py中的一个错误:如果区域设置为 未指定utf-8字符集(felix yan)。
- 在manifest.in中添加了copying、stringmatcher.py、gendoc.sh和news,因为它们 源发行版中缺少。
0.11.1
- 将levenshtein.h添加到manifest.in
0.11.0
- python 3支持,将维护权传递给antti haapala
0.10.1 - 0.10.2
- 使python-lehvenstein-git兼容,并使用setuptools上传pypi
- 创建history.txt并使readme rest兼容