Python deduplication-0.0.3.tar.gz模块包
下面是该Python项目安装包的资源下载地址:
deduplication-0.0.3.tar.gz.source
文件名称:deduplication-0.0.3.tar.gz
版权声明:本程序为网上收集,用户上传,仅供研究学习计算机编程等技术为目的,版权归原作者所有。
所属PyPI项目:deduplication
文件大小: 2.7 kB
文件类型: Source
适用的Python版本:None
下载文件的哈希值:
SHA256:545e75b2e6acd9a9ac0d32dfb9e50c6fcb6d11f79eeec5cef9a1ad3182efc983
MD5:560fc54f419473a488456643ab707690
BLAKE2-256:6375c2c29b42bcdaf9a9790f74e84e035a76e8be9a3f74402ef05db9cdbb8dd2
选择下载地址 热度
851 ℃ | 2024-05-19
- 如果发现本程序安装包或源码失效或下载失败,可以联系站长修复!谢谢。
- 可以使用迅雷等多线程下载专用软件进行加速下载。
- 少部分程序支持BT/磁力下载。
- 少部分程序可能需要编译安装,或下载源码自行安装,也可以使用
pip
命令进行安装。 - 放在网盘上的资源可能会被限速,可能需要注册或者购买对方VIP服务才能快速的下载。
- 如遇压缩包需要密码解压的,密码为 www.cnpython.com (全部小写),不是此密码非本站下载资源。
PyPI项目包:deduplication
重复数据消除
通过流行的算法(如simhash、spotsig、shingling等)删除重复的文档。
安装
运行以下命令:
# install current library
pip install deduplication
# install required pretrained NLP models
python -m spacy download xx_ent_wiki_sm
python -m查看全文