Pythorch管道

torchgpipe的Python项目详细描述


PyTorch中的GPipe实现。

fromtorchgpipeimportGPipemodel=nn.Sequential(a,b,c,d)model=GPipe(model,balance=[1,1,1,1],chunks=8)forinputindata_loader:output=model(input)

什么是gpipe?

gpipe是google brain发布的一个可伸缩的流水线并行库, 它允许有效地训练大型的、消耗内存的模型根据 论文中,gpipe可以通过使用8x设备(tpu)来训练一个25倍大的模型,并且 通过使用4个设备,训练3.5倍的速度

GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism

谷歌通过gpipe训练了5.57亿个参数的变形虫b。这个型号有 在ImageNet分类中达到84.3%的top-1和97.0%的top-5精度 基准(截至2019年5月的最新表现)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Cassandra复制因子大于节点数   java J2EE JTA事务回滚不适用于OSE Glassfish 4.0(Build 89)   java spring安全预认证用户登录   org的java类文件。反应流。从RxJava编译示例时未找到Publisher?   java在使用dataFormat作为POJO通过Camel调用Web服务时无法设置SOAP标头   Javafx类的java静态实例   java如何防止一个部件在关闭时覆盖另一个部件的位置   sql server无法从我的java代码连接到数据库   java在JList(Swing)中显示带有的ArrayList   从Java中的CXF服务获取WSAddressing数据   使用资产文件夹进行java简单json解析(本地)   java LDAPException未绑定的无效凭据   JavaJSFspring部署到weblogic   JAVA中字符数组中的特定元素排列?   如果脚本位于不同的目录中,则ant不会使用exec标记运行Javashell脚本