一个简单的rl库。

RLkit的Python项目详细描述


rlkit:一个简单的强化学习库

这个项目还在进行中。即将提供更多算法和详细文档:)

当前支持的代理-

  1. 随机代理
  2. 加强(政策梯度)
  3. dqn
  4. 带基线的dqn
  5. 演员评论家

有关如何使用库的详细信息,请参见示例。

要求-

tensorflow==1.11.0
gym==0.10.8
numpy==1.15.4

v0.2中的新功能

  • 添加了dqn和dqn以及基线药物
  • 添加了关键作用剂
  • 增加了对各种激活功能的支持

即将推出

  • 决斗dqn
  • 支持记录和绘图
  • 支持添加种子
  • 支持自定义环境

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java泛型和基类   ProcessBuilder或DefaultExecutor启动的“RunAs”子进程的java读取标准输出   java应用程序在尝试登录时突然停止   Java:神秘的Java未捕获异常处理程序[带代码]   java JavaFX NumberAxis自动范围无限循环   最新版本和旧版本冲突的java双Maven依赖关系   java如何导入带有部署变量类名的静态函数?   编译器构造不同的JDK更新会产生不同的Java字节码吗?   java无法在struts 1.1中上载任何超过250 MB大小的文件   java调整jcombobox下拉菜单的宽度   java如何在某些情况下忽略@SQLDelete注释   在Eclipse for Java EE developers edition中禁用HTML警告   java HttpUrlConnection重置请求属性   java@Provider资源未在rest应用程序中注册   java TOP N使用JPA连接   java在使用反射调用方法时区分int和Integer参数