Python deduplication-0.0.3-py3-none-any.whl模块包


下面是该Python项目安装包的资源下载地址:

  • deduplication-0.0.3-py3-none-any.whl.wheel

  • 文件名称:deduplication-0.0.3-py3-none-any.whl

    版权声明:本程序为网上收集,用户上传,仅供研究学习计算机编程等技术为目的,版权归原作者所有。

    所属PyPI项目:deduplication


  • 文件大小: 7.6 kB

    文件类型: Wheel

    适用的Python版本:py3

    下载文件的哈希值:
        SHA256:93d281032bf44c6311b532146a9cb63a39f9b77b1037533f78180b9b3afcdedf
        MD5:1d04ecf536ef033ac5539f4847e0800c
        BLAKE2-256:10fa2c13ae4cf01ef31991ab3d7ecbc0fe86e24f6b1f9b26c7dde36797c691b9






  1. 如果发现本程序安装包或源码失效或下载失败,可以联系站长修复!谢谢。
  2. 可以使用迅雷等多线程下载专用软件进行加速下载。
  3. 少部分程序支持BT/磁力下载。
  4. 少部分程序可能需要编译安装,或下载源码自行安装,也可以使用 pip 命令进行安装。
  5. 放在网盘上的资源可能会被限速,可能需要注册或者购买对方VIP服务才能快速的下载。
  6. 如遇压缩包需要密码解压的,密码为 www.cnpython.com (全部小写),不是此密码非本站下载资源。

PyPI项目包:deduplication

重复数据消除

通过流行的算法(如simhash、spotsig、shingling等)删除重复的文档。

安装

运行以下命令:

# install current library
pip install deduplication

# install required pretrained NLP models 
python -m spacy download xx_ent_wiki_sm
python -m

查看全文