Pythorch管道

torchgpipe的Python项目详细描述


PyTorch中的GPipe实现。

fromtorchgpipeimportGPipemodel=nn.Sequential(a,b,c,d)model=GPipe(model,balance=[1,1,1,1],chunks=8)forinputindata_loader:output=model(input)

什么是gpipe?

gpipe是google brain发布的一个可伸缩的流水线并行库, 它允许有效地训练大型的、消耗内存的模型根据 论文中,gpipe可以通过使用8x设备(tpu)来训练一个25倍大的模型,并且 通过使用4个设备,训练3.5倍的速度

GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism

谷歌通过gpipe训练了5.57亿个参数的变形虫b。这个型号有 在ImageNet分类中达到84.3%的top-1和97.0%的top-5精度 基准(截至2019年5月的最新表现)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
datetime如何使用JodaTime在Java中设置时间属性   java固定算法的性能时间   java如何从JMenu中获取所选项以更改文本区域的文本颜色?   java配置单元UDF传递数组<string>作为参数   javaapachebeam和BigQuery   java与PrintWriter之间的差异。printf和PrintWriter。格式方法   继承如何处理按Java版本更改的导入,以及在多个版本上编译   xml java。lang.noClassDefFoundant生成错误   java如何使用包含映射的JSON发送POST请求?   java如何在任何应用程序的JAR文件中绑定MySql数据库?   Java脚本解释器   sslhttpclientjava。网SocketException:未实现未连接的socket   java如何为Android应用程序创建类似于Cron作业的东西   java JButton+radiobox+复选框   java内存管理将文件写入内存   java这是计算对象实例的有效方法吗?   用于死锁情况的java代码?   JavaSpring容器作为新实体插入,而不是存储在表中