两个字符串的Jaccard索引
jaccard-index的Python项目详细描述
Jaccard_索引
Jaccard索引计算
这个包提供了基于字符串n-grams的计算jaccard索引。这可以用作计算两个字符串之间相似性的度量,例如一致性分辨率
安装
使用pip安装:
# pip install jaccard-index
要使用存档文件进行安装,请将其解压缩并运行:
# python setup.py install
用法
一个常见的用例是比较字符串的相似性:
>>> from jaccard_index.jaccard import jaccard_index
>>> jaccard_index("abc","")
0
>>> jaccard_index("accessary", "accessory")
0.6
>>> jaccard_index("coffee", "coffee")
1