Pythorch分布式培训

pytorch-distbelief的Python项目详细描述


距离信度

执行谷歌的distfeedle文件。

安装/开发说明

您首先需要通过运行make setup来创建python3 virtualenv,然后应该运行make install

然后,您将可以通过导入dist信念来使用dist信念

fromdistbelief.optimimportDownpourSGDoptimizer=DownpourSGD(net.parameters(),lr=0.1,n_push=5,n_pull=5,model=net)

作为一个例子,您可以看到我们的实现通过使用example/main.py中提供的脚本来运行。

要在本地运行2-training节点设置,请打开三个终端窗口,获取venv源代码,然后运行make firstmake secondmake server。 这将开始使用所有默认参数在cifar10上本地培训alexnet。

基准

注意:我们用图表表示每个节点的列车/测试精度,因此是node1、node2、node3。更好的比较是评估参数服务器的params并使用该值。 但是,我们可以看到三个节点之间的准确性相当一致,添加求值器可能会给服务器带来太多压力。

我们将节点的学习率缩放为learning_rate/freq(.03)。

train

test

我们使用aws c4.xlarge实例来比较cpu运行情况,并使用gtx 1060来比较gpu运行情况。

喷灯的倾盆大雨

图表

这里23同时发生。

您可以阅读更多关于我们的实现here

参考文献

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javascript如何找到socket。同一局域网上的IO服务器?   将Java代码格式化为Word/RTF格式   java学习对象以及如何将分配的变量封装到私有变量   java Websocket客户端不在Tomcat中工作   java如何在点击按钮时打开本机表情键盘?   java使用哪个Maven GlassFish插件?   Eclipse Java构建路径不允许添加外部JAR   继承Java6集合。勾选适当的用法   JavaApacheDateUtils:使用多个模式解析日期   java hibernate如何生成查询?   具有id或链接的java Dropbox下载文件或文件夹   java模态对话框未在PrimeFaces 5上显示   java将类对象转换为人类可读的字符串   更新数据库中字段的java通用方法   java无法通过Apache Tomcat访问网络文件夹