用于执行字符串相似性联接的python库。

py-stringsimjoin的Python项目详细描述


py_stringsimjoin

本项目旨在构建一个python软件包,为jaccard、dice、cosine、overlap、overlap coefficient和edit distance等常用的相似度度量提供两个表上字符串相似度连接的可伸缩实现。该软件包是免费的,开源的,并且有bsd许可。

依赖关系

py_stringsimjoin已经在python 2.7、3.5+上进行了测试。

构建包所需的依赖项是pandas 0.16.0或更高版本,py_stringmatching 0.2.1或更高版本, JoopLIB、PyPrimd、六和C++编译器。对于开发版本,您还需要cython。

平台

py_stringsimjoin已经在linux、os x和windows上进行了测试。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何解析大型SOAP响应   java如何在ionic 3应用程序屏幕上设置自定义微调器   java如何在没有GPU的情况下运行libGDX headless,但仍然渲染帧?   java SpringBoot项目部署到服务器时发生异常   java Firestore:检查文档中的值是否存在   从其他类填充数组时出现java未识别的NullPointerException   java BouncyCastle最后一个字节解密问题   java使用属性将ListMultimap<Object,Object>写入和读取到文件   从jar执行程序时的java动态加载问题   java比较泛型类型(使用nodes私有类在LinkedList的上下文中扩展vs实现)   使用java编程的版本控制   java如何强制文本转到面板的按钮?   安全编码用户分层java   java将数字格式化为货币   使用printf的java格式化表   java如何使用LiveData更新RecyclerView示例:SeenCounter、CommentCounter、LikeCounter   数组逻辑OR和模运算符在Java中表现异常   java需要分别管理/集成32位和64位JVM运行的两个JAR