python的模糊匹配聚类库。
fog的Python项目详细描述
雾
python的模糊匹配/聚类库。
安装
可以使用pip通过以下命令安装fog
:
pip install fog
用法
指标
稀疏余弦相似性
计算两个稀疏加权集的余弦相似性。这些集合必须表示为计数器。
fromfog.metricsimportsparse_cosine_similarity# Basicsparse_cosine_similarity({'apple':34,'pear':3},{'pear':1,'orange':1})>>>~0.062
参数
- acounter:第一加权集。必须是将键映射到权重的字典。
- bcounter:第二加权集。应该是一本字典,将键映射到权重。
雅卡相似性
计算两个任意iterable的jaccard相似性。
fromfog.metricsimportjaccard_similarity# Basicjaccard_similarity('context','contact')>>>~0.571
参数
- aiterable:要比较的第一个序列。
- biterable:要比较的第二个序列。
加权相似性
计算两个加权集的加权jaccard相似性。这些集合必须表示为计数器。
fromfog.metricsimportweighted_jaccard_similarity# Basicweighted_jaccard_similarity({'apple':34,'pear':3},{'pear':1,'orange':1})>>>~0.026
参数
- acounter:第一加权集。必须是将键映射到权重的字典。
- bcounter:第二加权集。应该是一本字典,将键映射到权重。