不确定下一状态的机器人Q学习算法

2024-04-26 01:06:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我是机器学习的新手,我正在开发一个环境是动态的机器人。 我使用python作为我项目的编程语言。你知道吗

我有一个目标状态,机器人有四个动作,比如向前,向后,右转和左转。你知道吗

问题是我无法定义机器人执行一个动作时的下一个状态。但我可以在每一集之后确定状态是否是目标状态。你知道吗

如何应用强化学习模型。我能用pomdp吗???你知道吗


Tags: 项目模型机器目标定义环境状态机器人
1条回答
网友
1楼 · 发布于 2024-04-26 01:06:50

即使环境是动态的,你也应该有一些运动模型的概念,在这个模型中,离散的动作应该导致机器人向前“一步”直行。在一个网格化的世界中,这很容易,但是,在一个连续的环境中,你可以网格化世界并且仍然使用离散的动作。如果下一个状态未定义,则机器学习/决策算法无法工作。你知道吗

相关问题 更多 >