稳定基线的Contrib包3,实验代码。

sb3-contrib的Python项目详细描述


稳定基线3-贡献(SB3 Contrib)

Stable-Baselines3实验强化学习(RL)代码的Contrib包。 简称“sb3 contrib”。在

什么是SB3 Contrib?

RL算法和工具被认为是实验性的,例如最新出版物的实现。目标是保持稳定基线3的简单性、文档化和风格,但对于不太成熟的实现。在

为什么要创建此存储库?

在稳定基线和稳定基线3的范围内,社区一直渴望以更好的日志实用程序、环境包装器、扩展支持(例如不同的操作空间)和学习算法的形式作出贡献。在

然而,有时这些公用事业过于利基,无法考虑稳定的基线或 事实证明,很难在没有混乱的情况下很好地集成到现有代码中。sb3contrib的目标是通过不要求与现有代码进行最简洁的代码集成,也不限制过于利基的代码来解决这个问题:几乎所有远程有用的东西都去了!我们希望这样可以将稳定基线样式和文档的已知质量扩展到主存储库相对较小的实用程序范围之外。在

特点

有关包含功能的完整列表,请参阅文档。在

RL算法

文件

可在线获取文档:https://sb3-contrib.readthedocs.io/

安装

注意:您需要master版本的Stable Baselines3。在

要安装稳定的基线3master版本:

pip install git+https://github.com/DLR-RM/stable-baselines3

使用pip安装稳定基线3-Contrib:

^{pr2}$

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
当您有许多具有不同密钥值的位置时,java Enterprise是加密环境变量的正确方法   java如何使用视图保持器模式制作自定义适配器?   java如何迭代Camel体中的嵌套列表?   序列化用base 64进行Java序列化   java打开文件的最佳方式(并确保选择了文件)   java marvin图像色差插件错误   java如何在eclipse中添加属性文件文件夹   比较java。util。日历日期到java。util。日期   java无法在下一个类(活动)中获取哈希表   java如何将这段代码转换为循环?   java查找通过REST失败   java getIntent返回null   在Java中,如何通过外部集合从内部集合检索数据?   java单点登录以保护REST API和内部基于web的系统