在aws现场实例和gcp抢占vms上训练深度学习模型

spott的Python项目详细描述


DocumentationPyPIPyPI - Python VersionPyPI - License

spotty极大地简化了AWS上的深度学习模型的培训 以及GCP

  • 它使gpu实例的培训与本地机器上的培训一样简单
  • 它自动管理所有必要的云资源,包括图像、卷、快照和ssh密钥
  • 它使您的模型可以在云中由每个人通过几个命令进行培训
  • 它使用tmux轻松地将远程进程与其终端分离
  • 使用AWS Spot Instances可以节省高达70%的成本 以及GCP Preemtible VMs

文档

安装

要求:

使用pip安装或升级spotty:

$ pip install -U spotty

开始

  1. 准备一个spotty.yaml文件并将其放到项目的根目录:

    • 请参阅文件规范here
    • 阅读this 文章为现实世界的例子。
  2. 启动实例:

    $ spotty start
    

    它将运行一个spot实例,恢复快照(如果有的话),将项目与正在运行的实例同步 用环境启动Docker容器。

  3. 训练一个模型或运行笔记本。

    要通过ssh连接到正在运行的容器,请使用以下命令:

    $ spotty ssh
    

    它运行一个tmux会话,因此您始终可以使用 Ctrl + b,然后d组合键。要稍后附加到该会话,只需使用 spotty ssh再次命令。

    此外,还可以使用spotty run <SCRIPT_NAME>命令在Docker容器中运行自定义脚本。阅读更多 关于文档中的自定义脚本: Configuration: "scripts" section

贡献

欢迎任何反馈或贡献!请查看guidelines

许可证

MIT License

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何下载多个。java中的PDF文件   linux Java打开文件,形成实际用户主页~/   java如何在时间线内维护TableView选择?   java Hibernate注释@Where vs@WhereJoinTable   Java读/写访问异常FileNotFoundException(访问被拒绝)   继承在Java中是否可以扩展最后一个类?   Android HttpClient使用java使应用程序崩溃。lang.OutOfMemoryError:pthread_create   java为什么即使我在proguardproject中添加了jar文件,也会出现这种错误。txt?   如果添加JButton,swing Java FocusListener和KeyListener将无法工作   java使用solrj检索json格式的SolrDocument   使用Microsoft Visual Studio代码进行Java编程   java NoClassDefFoundError:org/apache/log4j/Logger   哈希集中包含相等对象的java   java中的参数化构造函数是否需要有一个主体?   java类似于NetBeans不必要的代码检测器   Java实践问题   java Blackberry“[projectname].调试文件丢失”和“I/O错误:找不到程序”jar