为nlp任务下载和预处理数据

nlprep的Python项目详细描述


特色

  • 处理超过100个数据集
  • 生成已处理数据集的统计报表
  • 支持多种预处理方式
  • 提供一个面板,用于在运行时输入参数
  • 易于调整您自己的数据集和预处理实用程序

在线资源管理器

https://voidful.github.io/NLPrep-Datasets/

文件

docs了解更多信息。在

快速入门

通过pip安装

pip install nlprep

获取一个数据集

^{pr2}$

你也可以在googlecolab中尝试nlprep:Google Colab

概述

$ nlprep
arguments:
  --dataset     which dataset to use     
  --outdir      processed result output directory       

optional arguments:
  -h, --help    show this help message and exit
  --util        data preprocessing utility, multiple utility are supported 
  --cachedir    dir for caching raw dataset
  --infile      local dataset path
  --report      generate a html statistics report

贡献

谢谢你兴趣。那里有很多方法可以为这个项目做出贡献。开始here。在

许可证PyPI - License

图标参考

图标修改自Darius Danwww.flaticon.com网站
图标从Freepik修改www.flaticon.com网站在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在Android Studio中使用while循环显示包含textview对象的数据   创建名为“userController”的bean时发生java错误:通过字段“userService”表示未满足的依赖关系   java PDFBox PDFImageWrite。writeImage未正确处理所有字符   java无法识别代码中的nzec错误   无法更改java TabLayout字体   在Java中使用子字符串删除部分字符串   Java中的listener addPropertyChangeListener方法   java可以同时拖动多个对象   java如何将数组中的值添加到向量中   java为什么在Camel 3.7.3中无法正确计算属性?   与后端问题不同的机器中的java客户端资源   带字符串的java分割字节数组?   java On_选项_项目_选择的方法说明   java如何在画布的父画中画一个圆?   连接超时和打开连接数的java Netty通道配置   java mysql中如何防止向数据库中插入重复数据   升级到macOS Big Sur后,java无法启动Neo4j控制台应用程序   在Java中使用XSLT将XML转换为HTMLString的ajax   java无法使用Apache POI获取Excel工作表中的数据