Python chainerrl包_程序模块 - PyPI

chainerl，一个深度强化学习库

chainerrl的Python项目详细描述

链错误

ChaneRL是一个深度强化学习库，利用{a5}，一个灵活的深度学习框架，在Python中实现了各种最先进的深度增强算法。

Breakout Humanoid Grasping

安装

chainerrl使用python 2.7+和3.5.1+进行测试。有关其他要求，请参见requirements.txt。

chainerrl可以通过pypi安装：

pip install chainerrl

也可以从源代码安装它：

python setup.py install

有关安装的详细信息，请参阅Installation。

开始

你可以先试一下ChainerRL Quickstart Guide，或者检查一下examples准备好去参加阿塔里2600，然后打开人工智能健身房。

有关详细信息，请参阅ChainerRL's documentation。

算法

Algorithm	Discrete Action	Continous Action	Recurrent Model	CPU Async Training
DQN (including DoubleDQN etc.)	✓	✓ (NAF)	✓	x
Categorical DQN	✓	x	✓	x
Rainbow	✓	x	✓	x
IQN	✓	x	x	x
DDPG	x	✓	✓	x
A3C	✓	✓	✓	✓
ACER	✓	✓	✓	✓
NSQ (N-step Q-learning)	✓	✓ (NAF)	✓	✓
PCL (Path Consistency Learning)	✓	✓	✓	✓
PPO	✓	✓	✓	x
TRPO	✓	✓	x	x
TD3	x	✓	x	x

在chainerl中实现了以下算法：

a3c（异步优势参与者评论员）
宏（带体验重播的演员评论家）
异步n步q-学习
彩虹
分类dqn
智商
DQN（包括双DQN、持续优势学习（PAL）、双PAL、动态策略规划（DPP））
DDPG（深度确定性策略梯度）（包括SVG（0））
政策梯度定理
路径一致性学习
PPO（近端策略优化）
trpo（信任区域策略优化）
TD3（双延迟深层确定性策略梯度算法）

基于q函数的算法（如dqn）可以利用标准化优势函数（naf）来解决连续动作问题以及类dqn的离散输出网络。

纸面实现

以下文件已在chainerrl中实现：

可视化

chainerrl有一组附带的visualization tools，以帮助开发人员理解和调试其rl代理。有了这个可视化工具，chainerl代理的行为可以从浏览器ui中轻松地检查。

环境

可以使用支持openai gym接口子集（reset和step方法）的环境。

贡献

任何对Chainerrl的贡献都将非常感谢！如果您对chainerrl感兴趣，请阅读CONTRIBUTING.md。

许可证

MIT License。

欢迎加入QQ群-->： 979659372

chainerrl 0.7.0

chainerrl的Python项目详细描述

链错误

安装

开始

算法

纸面实现

可视化

环境

贡献

许可证

推荐PyPI第三方库

SaiGene

PyTouchBar

sts-lib

RequestSoup

avato-tflite-dynamic

pysocketftp-eba

eve-panel

NotSoFastQC

datasette-column-inspect

numpy-ext

fairdatapoint

pyopenms-nightl

oomf

odoo12-addon-account-group-invoice-line

DKAN-client

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

chainerrl 0.7.0

chainerrl的Python项目详细描述

链错误

安装

开始

算法

纸面实现

可视化

环境

贡献

许可证

推荐PyPI第三方库

SaiGene

PyTouchBar

sts-lib

RequestSoup

avato-tflite-dynamic

pysocketftp-eba

eve-panel

NotSoFastQC

datasette-column-inspect

numpy-ext

fairdatapoint

pyopenms-nightl

oomf

odoo12-addon-account-group-invoice-line

DKAN-client

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签