不确定下一状态的机器人Q学习算法 - 问答 - Python中文网

不确定下一状态的机器人Q学习算法

2024-04-26 01:06:50 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我是机器学习的新手，我正在开发一个环境是动态的机器人。我使用python作为我项目的编程语言。你知道吗

我有一个目标状态，机器人有四个动作，比如向前，向后，右转和左转。你知道吗

问题是我无法定义机器人执行一个动作时的下一个状态。但我可以在每一集之后确定状态是否是目标状态。你知道吗

如何应用强化学习模型。我能用pomdp吗？？？你知道吗

Tags：项目模型机器目标定义环境状态机器人

1条回答

网友

1楼 · 发布于 2024-04-26 01:06:50

即使环境是动态的，你也应该有一些运动模型的概念，在这个模型中，离散的动作应该导致机器人向前“一步”直行。在一个网格化的世界中，这很容易，但是，在一个连续的环境中，你可以网格化世界并且仍然使用离散的动作。如果下一个状态未定义，则机器学习/决策算法无法工作。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章