带有脏类别的机器学习。

dirty_cat的Python项目详细描述


dirty_cat是一个python模块,用于机器学习dirty分类变量。

网站:https://dirty-cat.github.io/

对于编码脏分类数据的问题的详细描述, 见Similarity encoding for learning with dirty categorical variables[1]

安装

依赖性

脏猫需要:

  • Python(>;=3.5)
  • 纽比(>;=1.8.2)
  • scipy(>;=1.0.1)
  • 科学套件学习(>;=0.20.0)

可选依赖项:

  • python levenshtein用于更快的编辑距离(不用于n-gram 距离)

用户安装

如果你已经安装了Numpy和Scipy, 安装脏猫最简单的方法是使用pip

pip install -U --user dirty_cat

参考文献

[1]Patricio Cerda, Gaël Varoquaux, Balázs Kégl. Similarity encoding for learning with dirty categorical variables. 2018, Machine Learning journal, Springer.

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
html Java spring框架:应用程序上下文不会设置属性   java如何保持已通过电话登录的用户登录   基于LWJGL的二维矩形图像java旋转   java如何将这些图像图标调整到我的棋盘格?   java如何在play框架中禁用http端口?   使用spring4@Transactional时,java事务不起作用   java堆栈由编译器或OS/体系结构创建   用vbscript杀死Java进程   java如何使用ApacheSparkML和两列文本作为特性来训练逻辑回归?   Tomcat上的java ElasticSearch节点客户端无法读取请求数据   java访问SharedReference在Android中不起作用   java流式处理使用springdatamongodb的聚合操作的结果   电子邮件javax。邮政AuthenticationFailedException Java邮件