基于openai的石头剪纸机(确定性)rl环境

rock-paper-scissors的Python项目详细描述


石头剪纸环境

这只是一个简单版的石头纸剪刀游戏。然而,为了使博弈具有确定性 它需要玩家的移动并学会最大化它的胜利。

运行Jupyter笔记本

出于明显的原因,在运行之前,您需要在系统中安装jupyter,numpy。 完成后,可以启动笔记本并运行示例。

输出中发生了什么

您将在输出中看到以下内容

  • 一个矩阵->;它表示对玩家的多个游戏中的机器人体验。

  • 开发/探索-机器人有一些初步经验(见顶部的np.uniform),但它开始了 当它认为自己没有任何经验时,就开始探索,然后开始利用已经获得的经验。

  • 统计数据->;它们只是告诉您玩家的移动方式

常见问题

  • 机器人是否在与玩家预先定义的一组动作对抗?

不。玩家的移动是随机产生的,然后被机器人用来获得经验和胜利。

  • 游戏不是这样玩的。正确的?

很好的发现。在这个版本的游戏中,我接受用户移动,然后训练机器人优化自身。在我的 如果机器人总是在训练完成后获胜,但在真正的游戏中,机器人有时也会抽签 因为玩家的动作是随机的。

  • 我如何检验你的样品?

安装依赖项并运行放置在repo中的笔记本。

  • 如何安装此软件包?

pip3 install rock-paper-scissors

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
添加组件后,java JTable为空   java将json发送到php并插入mysql,但返回null   java Spring引导JNDI CommonJ资源   从不同PC创建和合并后的Java servlet问题   java如何在使用findelements时从xpath获取文本   java使用spring boot使用gmail smtp发送电子邮件   java在不使用pojo、bean或getter和setter的情况下获取Json标题的Json数组   Java中的OpenFile对话框将null作为响应   JavaBuilder模式。扩展接口   java中无需替换的数据结构选取   java如何评价Encog中的预测神经网络   java如何在安卓中使用实际的HttpURLConnection进行单元测试?   java使用XML配置禁用WebSocket中的CSRF保护   java如何通过hibernate从多表查询中获取数据?   mysql如何在java中获取更新的行Id   java AEM/CQ组件单一组件/有限组件   java FFmpeg Javacv延迟问题   显示整数数组的java不起作用