提供一个输入csv和一个要预测的目标字段,生成一个model+代码来运行它。

automl_gs的Python项目详细描述


向automl gs提供一个输入csv文件和一个要预测的目标字段,并获得一个经过训练的高性能机器学习或深度学习模型以及本机代码管道,允许您将该模型集成到任何预测工作流中。没有黑匣子:您可以看到确切地如何处理数据,如何构造模型,并且可以根据需要进行调整。

automl gs是一个automl工具,与微软的[nni](https://github.com/Microsoft/nni)、uber的[ludwig](https://github.com/uber/ludwig)和[tpot](https://github.com/EpistasisLab/tpot)不同,它提供了一个零代码/模型定义接口以在多个流行的ml/dl框架中获得优化的模型和数据转换管道,使用最少的python依赖项(pandas+scikit learn+your framework of choice)。automl gs是为没有深厚统计背景的公民数据科学家和工程师设计的,其理念是,你不需要知道任何现代数据预处理和机器学习工程技术,就可以创建一个强大的预测工作流。

如今,计算许多不同模型和超参数的成本远低于数据科学家的时间成本。automl gs是一个python 3模块,旨在抽象出转换表格数据、构建机器学习/深度学习模型以及执行随机超参数搜索以识别性能最佳的模型的常用方法。这使得数据科学家和研究人员能够更好地利用他们的时间进行模型性能优化。

  • 生成本机python代码;无平台锁定,并且在创建模型脚本后无需使用automl gs。
  • 使用google colaboratory中的tpu免费提供列车模型配置超快
  • 处理通常需要手动干预的凌乱数据集,例如日期时间/分类编码和间隔/分隔的列名。
  • 生成的模型管道的每个部分都是它自己的函数w/docstrings,这使得它更容易集成到生产工作流中。
  • 非常详细的度量报告存储在一个整洁的csv中,允许您识别和可视化模型的优点和缺点。
  • 磁盘上数据管道编码器的正确序列化(即没有pickled python对象!)
  • 在新数据上重新训练生成的模型,而不进行任何代码/管道更改。
  • 随时退出超参数搜索,因为每次试用后都会保存结果。

由automl gs生成的模型旨在为解决给定问题提供一个非常强大的baseline;它们并不是automl宣传中经常出现的全部结果,但是生成的代码很容易从基线中得到改进。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
从FXML转换为JAVA时,不会加载javafx映像   泛型Java模板调用运行时推断   javascript为什么我的活动没有响应我在样式文件中所做的更改?   如何在HttpClient(java、apache)中自动重定向   java CSV到H2字符编码不匹配   在Java中使用BorderLayout按比例调整用户界面大小   Java中的重定向异常   java RecyclerView搜索过滤器仅过滤一个值   java标准api multiselect与count和distinct不起作用   java为什么我在Solr上做的每一个查询都会占用我10s MB的堆内存?   java如何使用方法解决:锁定帐户三次后?   java如何实现睡眠以显示图像的幻灯片   在Java中,按对象参数对映射<对象,列表<对象>>进行排序   java无法从密钥库读取密钥   java试图将水平recycleview嵌套到垂直recycleview中   认识C++对Web应用开发的重要性   使用共享对象实例化多个Runnable的java含义?   javabeans何时使用JavaBean?