Python deduplication-0.0.3-py3-none-any.whl模块包
下面是该Python项目安装包的资源下载地址:
deduplication-0.0.3-py3-none-any.whl.wheel
文件名称:deduplication-0.0.3-py3-none-any.whl
版权声明:本程序为网上收集,用户上传,仅供研究学习计算机编程等技术为目的,版权归原作者所有。
所属PyPI项目:deduplication
文件大小: 7.6 kB
文件类型: Wheel
适用的Python版本:py3
下载文件的哈希值:
SHA256:93d281032bf44c6311b532146a9cb63a39f9b77b1037533f78180b9b3afcdedf
MD5:1d04ecf536ef033ac5539f4847e0800c
BLAKE2-256:10fa2c13ae4cf01ef31991ab3d7ecbc0fe86e24f6b1f9b26c7dde36797c691b9
选择下载地址 热度
851 ℃ | 2024-05-19
- 如果发现本程序安装包或源码失效或下载失败,可以联系站长修复!谢谢。
- 可以使用迅雷等多线程下载专用软件进行加速下载。
- 少部分程序支持BT/磁力下载。
- 少部分程序可能需要编译安装,或下载源码自行安装,也可以使用
pip
命令进行安装。 - 放在网盘上的资源可能会被限速,可能需要注册或者购买对方VIP服务才能快速的下载。
- 如遇压缩包需要密码解压的,密码为 www.cnpython.com (全部小写),不是此密码非本站下载资源。
PyPI项目包:deduplication
重复数据消除
通过流行的算法(如simhash、spotsig、shingling等)删除重复的文档。
安装
运行以下命令:
# install current library
pip install deduplication
# install required pretrained NLP models
python -m spacy download xx_ent_wiki_sm
python -m查看全文