rddl2tensorflow解析器、编译器和模拟器。
tfrddlsim的Python项目详细描述
#tf rddlsim[![构建状态](https://travis-ci.org/thiagopbeno/tf-rddlsim.svg?branch=master)“(https://travis-ci.org/thiagopbueno/tf-rddlsim)[![文档状态](https://readthedocs.org/projects/tf-rddlsim/badge/?版本=最新](https://tf-rddlsim.readthedocs.io/en/latest/?徽章=最新的)[![许可证](https://img.shields.io/aur/license/yaourt.svg)(https://www.shields.sields.io/aur/license/yaourt.svg)(https://github.com/thiagobbeno/tf-rddlsim/blob/master/license)
rdthon3中的rddl2tensorflow编译器和轨迹模拟器。
```快速入门
```文本
$pip3安装tfrddlsim tfrddlsim
`` ` ` ` `
独立脚本或以编程方式进行。
``text
$tfrddlsim--help
````文本
$tfrddldlsim[-h][-policy{默认,随机}[--viz{{generic,导航}]>
>
[-br/>[-hr-hr-HORIZON[-数字图书馆路径文件或文件名问题>可选参数,导航}
可视化工具类型(默认值=通用值)
-hr水平线,--horizon水平线
每条轨迹的时间步数(默认值=40)
-b批处理大小,--batch大小批处理大小
批处理中的轨迹数(默认值=75)
-v,--详细详细的详细信息模式
`````
>
`````````
>$tfrddlsim Navigation-v1—策略随机—即Navigation—hr 50—b 32—b 32—v
``````
`````````````````````````````
$tfrddlsim水库-8—策略默认—即generic—hr 20—b 128—b 128—v
``````````
>>``````````````
>>
>``````````````````br/>
来自tfrddlsim.policy从tfrddlsim.simulation.policy_simulator导入randompolicy
从tfrddlsim导入policysimulator
即导入通用可视化工具
批处理大小)
模拟器=模拟器(rddl2tf,策略,批处理大小)
轨迹=模拟器。运行(地平线)
可视化轨迹verbose=True)
即呈现(轨迹)
```
每个RNN单元封装一个“tfrddlsim.policy”模块,为当前状态生成操作,并理解转换(由CPF指定)和奖励函数。采样是通过动态展开带有嵌入“tfrddlsim.policy”的RNN模型来完成的。
[https://tf rddlsim.readthedocs.io/](https://tf-rddlsim.readthedocs.io/en/latest/)获取代码文档。
请让我知道:【thiago.pbueno@gmail.com】(mailto://thiago.pbueno@gmail.com)。
自由软件基金会,许可证的3版本,或(在BR/>您的选项)任何以后的版本。
BR/> TF RDDLSIM被分发,希望它是有用的,但是
没有任何保证;甚至没有隐含的保证:BR/>商品性或适合性。AR目的有关详细信息,请参阅gnu lesser
通用公共许可证。
您应该已收到gnu lesser通用公共许可证的副本
以及tf rddlsim。如果没有,请参阅http://www.gnu.org/licenses/。
```快速入门
```文本
$pip3安装tfrddlsim tfrddlsim
`` ` ` ` `
独立脚本或以编程方式进行。
``text
$tfrddlsim--help
````文本
$tfrddldlsim[-h][-policy{默认,随机}[--viz{{generic,导航}]>
>
[-br/>[-hr-hr-HORIZON[-数字图书馆路径文件或文件名问题>可选参数,导航}
可视化工具类型(默认值=通用值)
-hr水平线,--horizon水平线
每条轨迹的时间步数(默认值=40)
-b批处理大小,--batch大小批处理大小
批处理中的轨迹数(默认值=75)
-v,--详细详细的详细信息模式
`````
>
`````````
>$tfrddlsim Navigation-v1—策略随机—即Navigation—hr 50—b 32—b 32—v
``````
`````````````````````````````
$tfrddlsim水库-8—策略默认—即generic—hr 20—b 128—b 128—v
``````````
>>``````````````
>>
>``````````````````br/>
来自tfrddlsim.policy从tfrddlsim.simulation.policy_simulator导入randompolicy
从tfrddlsim导入policysimulator
即导入通用可视化工具
批处理大小)
模拟器=模拟器(rddl2tf,策略,批处理大小)
轨迹=模拟器。运行(地平线)
可视化轨迹verbose=True)
即呈现(轨迹)
```
每个RNN单元封装一个“tfrddlsim.policy”模块,为当前状态生成操作,并理解转换(由CPF指定)和奖励函数。采样是通过动态展开带有嵌入“tfrddlsim.policy”的RNN模型来完成的。
[https://tf rddlsim.readthedocs.io/](https://tf-rddlsim.readthedocs.io/en/latest/)获取代码文档。
请让我知道:【thiago.pbueno@gmail.com】(mailto://thiago.pbueno@gmail.com)。
自由软件基金会,许可证的3版本,或(在BR/>您的选项)任何以后的版本。
BR/> TF RDDLSIM被分发,希望它是有用的,但是
没有任何保证;甚至没有隐含的保证:BR/>商品性或适合性。AR目的有关详细信息,请参阅gnu lesser
通用公共许可证。
您应该已收到gnu lesser通用公共许可证的副本
以及tf rddlsim。如果没有,请参阅http://www.gnu.org/licenses/。