稳定基线的Contrib包3,实验代码。
sb3-contrib的Python项目详细描述
稳定基线3-贡献(SB3 Contrib)
Stable-Baselines3实验强化学习(RL)代码的Contrib包。 简称“sb3 contrib”。在
什么是SB3 Contrib?
RL算法和工具被认为是实验性的,例如最新出版物的实现。目标是保持稳定基线3的简单性、文档化和风格,但对于不太成熟的实现。在
为什么要创建此存储库?
在稳定基线和稳定基线3的范围内,社区一直渴望以更好的日志实用程序、环境包装器、扩展支持(例如不同的操作空间)和学习算法的形式作出贡献。在
然而,有时这些公用事业过于利基,无法考虑稳定的基线或 事实证明,很难在没有混乱的情况下很好地集成到现有代码中。sb3contrib的目标是通过不要求与现有代码进行最简洁的代码集成,也不限制过于利基的代码来解决这个问题:几乎所有远程有用的东西都去了!我们希望这样可以将稳定基线样式和文档的已知质量扩展到主存储库相对较小的实用程序范围之外。在
特点
有关包含功能的完整列表,请参阅文档。在
RL算法:
文件
可在线获取文档:https://sb3-contrib.readthedocs.io/
安装
注意:您需要master
版本的Stable Baselines3。在
要安装稳定的基线3master
版本:
pip install git+https://github.com/DLR-RM/stable-baselines3
使用pip安装稳定基线3-Contrib:
^{pr2}$- 项目
标签: