提供一个输入csv和一个要预测的目标字段,生成一个model+代码来运行它。

automl_gs的Python项目详细描述


向automl gs提供一个输入csv文件和一个要预测的目标字段,并获得一个经过训练的高性能机器学习或深度学习模型以及本机代码管道,允许您将该模型集成到任何预测工作流中。没有黑匣子:您可以看到确切地如何处理数据,如何构造模型,并且可以根据需要进行调整。

automl gs是一个automl工具,与微软的[nni](https://github.com/Microsoft/nni)、uber的[ludwig](https://github.com/uber/ludwig)和[tpot](https://github.com/EpistasisLab/tpot)不同,它提供了一个零代码/模型定义接口以在多个流行的ml/dl框架中获得优化的模型和数据转换管道,使用最少的python依赖项(pandas+scikit learn+your framework of choice)。automl gs是为没有深厚统计背景的公民数据科学家和工程师设计的,其理念是,你不需要知道任何现代数据预处理和机器学习工程技术,就可以创建一个强大的预测工作流。

如今,计算许多不同模型和超参数的成本远低于数据科学家的时间成本。automl gs是一个python 3模块,旨在抽象出转换表格数据、构建机器学习/深度学习模型以及执行随机超参数搜索以识别性能最佳的模型的常用方法。这使得数据科学家和研究人员能够更好地利用他们的时间进行模型性能优化。

  • 生成本机python代码;无平台锁定,并且在创建模型脚本后无需使用automl gs。
  • 使用google colaboratory中的tpu免费提供列车模型配置超快
  • 处理通常需要手动干预的凌乱数据集,例如日期时间/分类编码和间隔/分隔的列名。
  • 生成的模型管道的每个部分都是它自己的函数w/docstrings,这使得它更容易集成到生产工作流中。
  • 非常详细的度量报告存储在一个整洁的csv中,允许您识别和可视化模型的优点和缺点。
  • 磁盘上数据管道编码器的正确序列化(即没有pickled python对象!)
  • 在新数据上重新训练生成的模型,而不进行任何代码/管道更改。
  • 随时退出超参数搜索,因为每次试用后都会保存结果。

由automl gs生成的模型旨在为解决给定问题提供一个非常强大的baseline;它们并不是automl宣传中经常出现的全部结果,但是生成的代码很容易从基线中得到改进。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何强制用户在允许访问活动之前处理对话框?我的许可证代码怎么了?   java ArraysList作为JSON   mysql如何在java中创建包含多个可选where子句的搜索语句?   java如何让Apache Camel在“直接”路径的末尾删除文件?   使用socket在两个Androids之间进行java实时数据传输。IO(websocket)和4G   如何在java中实现两个CORBA服务器之间的通信   会话树xml表示为java对象   java Skype4Java编号swtwin323325   java RecyclerView getAdapterPosition()不工作:第一次单击返回正确位置,第二次单击返回1   java在$TOMCAT/conf/context上为JNDI设置资源。xml   java为什么第二个矩形冲突在第一个矩形冲突时不起作用?   JScrollPane上的java JTextArea未出现在JPanel上   java如何将实现的PriorityQueue打印为字符串?   jpa使用Jersey更新用户角色RESTJava(JAXRS)