可重复强化学习研究的框架
garage的Python项目详细描述
车库
garage是一个开发和评估强化学习算法的框架。它包括广泛的连续控制任务和算法实现。
车库与OpenAI Gym完全兼容。所有车库环境都实现gym.env,因此所有车库组件也可以与任何实现gym.env的环境一起使用。
Garage仅正式支持Python3.5+。
garage支持神经网络框架的TensorFlow。TensorFlow模块可以在garage/tf下找到。
文档
文档可在https://garage.readthedocs.org/en/latest/在线获取。
引用车库
如果您使用Garage进行学术研究,我们强烈建议您引用以下有关原始RLLab实现的论文:
- 段彦、陈曦、雷恩·霍索夫、约翰·舒尔曼、彼得·阿比勒。”Benchmarking Deep Reinforcement Learning for Continuous Control。第33届机器学习国际会议记录,2016年。
学分
garage基于一个名为rllab的前一个项目。garage项目感谢rllab原始作者的贡献,并希望本着同样的精神继续推进rl研究的可重复性状态。
RLLab最初由Rocky Duan(UC Berkeley/OpenAI)、Peter Chen(UC Berkeley)、Rein Houthooft(UC Berkeley/OpenAI)、John Schulman(UC Berkeley/OpenAI)和Pieter Abbeel(UC Berkeley/OpenAI)开发。