可重复数据科学的机器学习数据流
HackDuck的Python项目详细描述
理想的HACKDUCK项目
使用REST应用程序(MLflow)从运行模型:
- 为每个项目保存一个github文件夹
- 可以很容易地预测一堆数据
特点:
- 种子再生性
- 映射要在列表上循环的参数
- mlflow集成(自动记录参数,可以记录度量或工件)
- 所有完美的先锋
- 处理子流
- 任务库做基本操作
- 病房单元测试处理
待办事项:
- []映射子流?在
- []创建一个脚本用HackDuck运行它文件.yaml--argsname参数值。。。在
- []在docker中运行
- []为所有要求保存版本(需要重新运行流)
- []将python文件保存在mlruns/。。。把他们交出来,省去git commit
- []能够重新运行以前的流(保存args和kwargs以及output ref)
- []由于travis CI创建了MLflow git回购,所以投入生产
- []生成示例供人们使用
使用它
fromHackDuckimportrun_flowconfig=yaml.load(open('/home/alex/awesome/HackDuck/iris/flows/iris_classif_with_sub.yaml','r'),Loader=yaml.FullLoader)run_flow(config,{})
- 项目
标签: