高性能模糊业务实体匹配

seamster的Python项目详细描述


裁缝

PyPI versionPipeline statusCoverage report

高性能模糊业务实体匹配

动机

这个一揽子计划的目的是促进一个更广泛的目标,即集中化和标准化 企业可用数据。Juniper这样做是因为我们相信创新的关键 在商业保险承保中,公开数据的可访问性、可靠性和完整性是关键。在

特点

  • 在Pandas和Scipy的基础上构建了字符串相似性的并行计算。在
  • 可扩展的Join类允许自定义联接

安装

Seamster需要Python3.5或更高版本才能运行。在

Python包

您可以使用pip轻松安装Seamster:

pip3 install seamster

手动

或者,要获得最新的开发版本,可以克隆此存储库,然后手动安装:

git clone git@gitlab.com:juniperlabs-foss/seamster.git
cd seamster
python3 setup.py install

使用

^{pr2}$

托多

  • 创建可以置换和丰富数据帧的转换类(例如geolocation)
  • 支持多个模糊连接

贡献

有关如何为项目贡献的信息,请查看Contributor's Guide。在

联系人

support@juniperlabs.io

incoming+juniperlabs-foss/seamster@gitlab.com

许可证

Apache 2.0版

学分

此包是用Cookiecutterpython-cookiecutter项目模板创建的。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java CXF和授权   java在网站中部署使用swing创建的表单   java为什么getHeaderField()返回一个字符串,其中getHeaderFields()返回HttpUrlConnection中的Map<String,List<String>>   java如何检测恶意数据包?   webview中的java网页为空   java SWT图像资源,用于将我的所有图像存储在一个位置   java计算数组的最大长度,使平均值小于给定值   java“发件人电话号码无效”和美国号码   将Swing组件作为内容的自定义Java工具提示不会显示   在并发HashMap中重新灰化期间的java检索   Java 7和Tomcat 7.0.64 ClassFormatException:常量池中的字节标记无效   使用JUnit的java assertNull因NullPointerException失败   java内存中的文件是否与文件系统中的文件大小相同?   循环内实例化的类型的java注入依赖项