通用递归神经网络的rwth可扩展训练框架

returnn的Python项目详细描述


GitHub repositoryRETURNN paper 2016RETURNN paper 2018

returnn-rwth通用递归神经网络可扩展训练框架, 是一种基于theano/tensorflow的现代递归神经网络结构的实现。 针对多gpu环境下递归神经网络的快速可靠训练问题,对其进行了优化。

功能包括:

  • 前馈神经网络的小批量训练
  • 基于序列分块的递归神经网络批训练
  • 长短期记忆递归神经网络 包括我们自己的快速cuda内核
  • 多维LSTM(仅GPU,没有CPU版本)
  • 大型数据集的内存管理
  • 跨多个设备的工作分配
  • 灵活快速的体系结构,允许各种编码器注意力解码器模型

documentation。 见basic usage 还有technological overview

Here is the video recording of a RETURNN overview talkslidesexercise sheet; 由易趣主办)。

many example demos 对人工生成的数据起作用, 也就是说,他们应该按原样工作。

some real-world examples 例如在交换机或librispeech语料库上进行语音识别的设置。

一些针对其他框架的基准设置 可以找到here。 结果在RETURNN paper 2016中。 lstm内核与cudnn和其他tensorflow内核的性能基准 在TensorFlow LSTM benchmark中。

还有a wiki。 也可以在 StackOverflow using the RETURNN tag

https://travis-ci.org/rwth-i6/returnn.svg?branch=master

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何计算安卓摄像头的光圈角度   客户端应用C++ java SOLR   java为什么要打印这个输出,似乎不合适   java正在从字符串获取信息。安卓 studio中的xml不起作用   java检查TreeView JavaFX中的所有CheckBoxTreeCells   基于内部映射的java通用返回类型?   Struts操作中的java多入口点(迁移Struts 2.2.3>2.3.1)   java按属性激活Maven概要文件不适用于依赖项目吗?   JavaWildfly:是否可以在EAR的EJB模块内定义websocket端点?   Android我怎么能找到Java代码两点之间的距离?   java WebDriverWait未使用Selenium 3.3.1编译   java Jhipster实体子生成器:如何创建liquibase增量变更日志?   java是否有使用JasperReports的气泡图资源?   hibernatecore的java渐变构建:如何正确添加依赖项?   java为什么处理trycatch而不抛出任何异常不会降低程序的速度?   java解析XSD以列出元素   java Hibernate 4.1至5.1 SessionFactory ConnectionProvider   使用DropWizardian的java调度作业