python的模糊匹配聚类库。

fog的Python项目详细描述


Build Status

python的模糊匹配/聚类库。

安装

可以使用pip通过以下命令安装fog

pip install fog

用法

指标

稀疏余弦相似性

计算两个稀疏加权集的余弦相似性。这些集合必须表示为计数器。

fromfog.metricsimportsparse_cosine_similarity# Basicsparse_cosine_similarity({'apple':34,'pear':3},{'pear':1,'orange':1})>>>~0.062

参数

  • acounter:第一加权集。必须是将键映射到权重的字典。
  • bcounter:第二加权集。应该是一本字典,将键映射到权重。

雅卡相似性

计算两个任意iterable的jaccard相似性。

fromfog.metricsimportjaccard_similarity# Basicjaccard_similarity('context','contact')>>>~0.571

参数

  • aiterable:要比较的第一个序列。
  • biterable:要比较的第二个序列。

加权相似性

计算两个加权集的加权jaccard相似性。这些集合必须表示为计数器。

fromfog.metricsimportweighted_jaccard_similarity# Basicweighted_jaccard_similarity({'apple':34,'pear':3},{'pear':1,'orange':1})>>>~0.026

参数

  • acounter:第一加权集。必须是将键映射到权重的字典。
  • bcounter:第二加权集。应该是一本字典,将键映射到权重。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
junit cucumber为什么会找到“runTest.java”来运行测试?   在Eclipse中找不到java KeyPairGenerator   java NotSerializableException即使在实现Serializable之后   noclassdeffounderror(java字符串连接)为什么会出现这种异常?   java Guice:将接口绑定到由动态代理创建的实例   使用Spring数据neo4j创建空间索引时发生java错误   java对于需要在50多个excel文件上运行并且每个文件平均包含25k行的项目,最佳的方法是什么   javaNIO中的java缓冲区写入/发送消息问题   如何在Java/eclipse中添加不调用super()的警告   JavaSpring:mvcUrl映射错误的id   java应该在getInstance或构造函数中使用Init方法吗?   安卓中的java空指针异常错误   java Jsoup不能完全获取原始html代码