易于使用的强化学习图书馆
rlberr的Python项目详细描述
Section | Description |
---|---|
Goals | The philosophy of ^{ |
Installation | How to install ^{ |
Getting started | A quick usage guide of ^{ |
Documentation | A link to the documentation |
Contributing | A guide for contributing |
Citation | How to cite this work |
目标
- 在
为每个实现的算法编写详细的文档和可理解的教程/示例(Jupyter笔记本)。在
在 - 在
为代理提供一个通用接口
- 在
对代理代码施加最小限制(=>;使其易于包含新算法和修改现有算法)
在 - 在
允许使用简单和统一的评估接口在代理之间进行比较(=>;使之更容易比较deep和“传统”RL算法)。在
在
- 在
- 在
统一种子机制:只定义一个全局种子,所有其他种子都将从中继承,增强随机数生成器的独立性。在
在 - 在
用于创建和呈现新环境的简单界面。在
在
安装
克隆和创建虚拟环境
建议使用Python或Miniconda创建虚拟环境:
git clone https://github.com/rlberry-py/rlberry.git conda create -n rlberry python=3.7
基本安装
安装时不要使用繁重的库(例如Pythorch)。在
^{pr2}$完全安装
安装所有功能
conda activate rlberry pip install -e .[full]
其中包括:
入门
测试
要运行测试,请使用pip install -e .[test]
安装测试依赖项,然后运行pytest
。要运行覆盖率测试,请安装测试依赖项并运行bash run_testscov.sh
。参见cov_html/index.html
中的覆盖率报告。在
文件
贡献
想为rlberry
捐款吗?请检查our contribution guidelines。一份有趣的待办事项清单很快就会出来。如果要添加任何新的代理或环境,请不要犹豫open an issue!
实施说明
- 在
从
在Agent
类继承时,确保在基类中添加新功能时使用**kwargs
调用{},并确保{ }和{ }始终是任何代理的选项。在 - 在
代理中冗长的约定:
verbose=0
:不打印任何内容verbose>1
:打印进度消息
使用logging
库打印错误和警告。在
引用rlberry
- 项目
标签: