加强学习环境

rlenvs的Python项目详细描述


强化学习环境

这个软件包通过提供可用于测试RL算法的易于生成的RL环境来简化RL实验的生活。在

这项工作仍在进行中,然而,希望这将作为一个有用的功能,精确的RL实验,在一个可重复的,轻量和科学的方式。在


开始吧

安装

使用PyPi安装

pip3 install rlenvs

从源安装

^{pr2}$

示例:

班迪特
fromrlenvs.banditsimportMultiarmBernoulliBanditenv=MultiarmBernoulliBandit(arms=5)reward,observation,is_finished,internal_state=env.step(0)#picks arm 0

树MDP

fromrlenvs.mdpsimportBalancedDenseTreeDeterministicMDPenv=BalancedDenseTreeDeterministicMDP(branching=3,depth=5)#creates a tree with 3 choices each turn and a total of 5 turns.reward,observation,is_finished,internal_state=env.step(3)#picks arm 0

这样的环境是这样的: BalancedTree


文件:

概述:

总的来说,这个包提供了环境,其API与Deepmind和OpenAI提供的环境非常相似。(用于互操作性。)

这是每个环境提供的接口:

classBaseEnvironment(object):"""    Implements the following methods inspired by both OpenAI gym and Deepmind Bsuite (dm_env).    :initialise() -> observation, resets and initialises the environment and returns first observation:    :step(action) -> reward(float), observation(Optional[Any]), is_finished(bool), state(Optional[Any]):    :reset() -> "resets the environement":    :undo() -> "goes to the previous state of the environment" reward, observation, is_finished(bool), sate(Optional[Any]):    :go_to_state(state) -> "goes to a specific state of the environment" is_finished(bool):    :seed(int) -> "sets the seed":    :render() -> "renders the environment":    :get_specs() -> returns the custom specs of the environment:    """

故障排除/常见问题解答:

要求:(要求是什么):

在未来,这将有望是可配置的

python >= 3.6
networkx
graphviz
...

版权所有(C)-Nikolai Rozanov 2020至今

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java 401在API URL上带有声明性Http客户端,并带有@Secured(SecurityRule.IS_ANONYMOUS)注释   java如何在Android中创建计时器?   Java8WebStart安全弹出窗口   java会通过以下两种方式导致堆空间耗尽吗?   java项目调度GA:染色体的高效数据结构   java Apache POI:如何在Excel文件中插入列   java在JRE系统库中每个jar扮演什么角色   java如何在抽象类中执行@mock(不是注入mock)   java如何使用opensearch和Lucene发送搜索查询?   java在ApachePOI中处理空列   java广播接收器未接收到目标   java错误ELF类:ELF类64(可能原因:体系结构字宽不匹配)   java调用Web服务(SSL)时出错   用于iot集线器设备固件更新的java Rest API   通过xslt将xml转换为文本文件时引发java异常   Java linux打印问题   Java XML转换器重复行   java从另一个类的方法将数组导入mainActivity类   多线程选择与Java交互的线程   我想在java程序中打印以下格式的文件: