2024-04-26 01:06:50 发布
网友
我是机器学习的新手,我正在开发一个环境是动态的机器人。 我使用python作为我项目的编程语言。你知道吗
我有一个目标状态,机器人有四个动作,比如向前,向后,右转和左转。你知道吗
问题是我无法定义机器人执行一个动作时的下一个状态。但我可以在每一集之后确定状态是否是目标状态。你知道吗
如何应用强化学习模型。我能用pomdp吗???你知道吗
即使环境是动态的,你也应该有一些运动模型的概念,在这个模型中,离散的动作应该导致机器人向前“一步”直行。在一个网格化的世界中,这很容易,但是,在一个连续的环境中,你可以网格化世界并且仍然使用离散的动作。如果下一个状态未定义,则机器学习/决策算法无法工作。你知道吗
即使环境是动态的,你也应该有一些运动模型的概念,在这个模型中,离散的动作应该导致机器人向前“一步”直行。在一个网格化的世界中,这很容易,但是,在一个连续的环境中,你可以网格化世界并且仍然使用离散的动作。如果下一个状态未定义,则机器学习/决策算法无法工作。你知道吗
相关问题 更多 >
编程相关推荐