swats算法的pytorch实现。

pytorch-swats的Python项目详细描述


从ADAM切换到SGD

Wilson et al. (2018)表明,“自适应方法发现的解比sgd更差(通常明显更差),即使这些解具有更好的训练性能。这些结果表明,实践者应该重新考虑使用自适应方法来训练神经网络。

swats来自2018年iclr的高分论文Keskar & Socher (2017),该方法建议自动从adam切换到sgd,以获得更好的泛化性能。算法本身的思想非常简单。它使用adam,尽管最小的调整效果很好,但是在学习到某个阶段之后,它被sgd接管。

用法

直接从这个git存储库使用pip或使用以下命令之一从pypi安装包是很简单的。

pip install git+https://github.com/Mrpatekful/swats
pip install pytorch-swats

安装后swats可以用作任何其他torch.optim.Optimizer。下面的代码片段是如何使用算法的简单概述。

importswatsoptimizer=swats.SWATS(model.parameters())data_loader=torch.utils.data.DataLoader(...)forepochinrange(10):forinputs,targetsindata_loader:# deleting the stored grad valuesoptimizer.zero_grad()outputs=model(inputs)loss=loss_fn(outputs,targets)loss.backward()# performing parameter updateoptimizer.step()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java无动作映射Struts 2   在eclipse中导入代码时遇到的Java问题   java JSOUP将原始html转换为一些额外的编码值   postgres id生成和hibernate的java问题   首次安装后,java Android应用程序类实例为空   java计算过了多少时间   在Java中检查项目时出错   java NativeQuery字符串,取决于数据库驱动程序   java为什么我们有时使用十六进制格式而不是十进制格式?   使用ASyncTask时,java数组未显示在ArrayAdapter中   java我可以与GWT plus AngularJs协作吗。?   mysql SQLException:java。util。日期不能强制转换为java。sql。使用hibernate的时间   java为什么按位AND运算不适用于值>=8?   在Java中实现质数查找算法的最佳方法是什么?我们如何制作库类并在Java中使用它们?   java在所有问题逐一显示后,我希望再次显示第一条消息   java比较数组不能正常工作?   编译类名中带有特殊字符的Java文件时发生javac错误   java中的swing BorderLayout,按钮未移动   在java中重新格式化JSON数组/对象