带负值的OpenAiGym离散空间

1条回答

网友

1楼 · 发布于 2024-06-16 13:18:36

AFAIK，在OpenAI环境中，每个可能的操作都有索引，因此不需要负值。但是，您可以将每个操作索引映射为任意值（正数或负数）。你知道吗

例如，在Cartpole环境中，可以对cart施加正（向右推）力或负（向左推）力。这个问题是使用离散环境建模的，其中action 0 = negative force和action 1 = positive force。有关更多详细信息，请查看Cartpole source code（例如，第95行）。你知道吗

类似地，在您的例子中，虽然您的200个动作索引都是正的，但它们可以表示正的或负的动作。你知道吗

编程相关推荐

java通过两个整数数组对正整数和负整数进行排序
java无参数和默认构造函数混淆
java加载文件MD5的最快方法是什么？
java如何在变量声明中使用带“e”的float
java将项目导入到STS iMac
java在使用图像时旋转图像
java Break语句不起作用
java提供了错误类型Spring的id
java如何为多个变量设置相同的函数属性？
JavaMaven：如何添加编译阶段后生成的资源

相关问题更多 >

编程相关推荐

热门问题

热门文章

带负值的OpenAiGym离散空间

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >