基于openai的石头剪纸机(确定性)rl环境
rock-paper-scissors的Python项目详细描述
石头剪纸环境
这只是一个简单版的石头纸剪刀游戏。然而,为了使博弈具有确定性 它需要玩家的移动并学会最大化它的胜利。
运行Jupyter笔记本
出于明显的原因,在运行之前,您需要在系统中安装jupyter,numpy。 完成后,可以启动笔记本并运行示例。
输出中发生了什么
您将在输出中看到以下内容
一个矩阵->;它表示对玩家的多个游戏中的机器人体验。
开发/探索-机器人有一些初步经验(见顶部的np.uniform),但它开始了 当它认为自己没有任何经验时,就开始探索,然后开始利用已经获得的经验。
统计数据->;它们只是告诉您玩家的移动方式
常见问题
- 机器人是否在与玩家预先定义的一组动作对抗?
不。玩家的移动是随机产生的,然后被机器人用来获得经验和胜利。
- 游戏不是这样玩的。正确的?
很好的发现。在这个版本的游戏中,我接受用户移动,然后训练机器人优化自身。在我的 如果机器人总是在训练完成后获胜,但在真正的游戏中,机器人有时也会抽签 因为玩家的动作是随机的。
- 我如何检验你的样品?
安装依赖项并运行放置在repo中的笔记本。
- 如何安装此软件包?
pip3 install rock-paper-scissors