我正在使用Python编写一个简单的棋盘游戏(基于generals.io),并让系统从观察用户如何玩游戏中学习策略;如何将其表述为机器学习问题?
当一个玩家抓住另一个玩家的将军时,游戏就赢了。通常,胜利者拥有比失败者大得多的军队,所以我认为军队规模可以用来衡量结果,但也可以通过使用一些更复杂的策略,用一支小得多的军队获胜,所以基本上结果是一个二元的输赢。在
程序可用的一些类型的数据包括回合数、对手军队的规模和二维列表,其中每个元素都是一个字典,代表棋盘的一个正方形。每本字典都会记录谁拥有这个广场,它是什么类型的广场(起始位置、障碍物等)以及广场的价值(上面的军队规模)。在
我看了看a MCTS似乎是一个不错的选择,但这不是一个回合制的游戏,而且大多数情况下其他玩家的位置和移动都是未知的(直到发生冲突)。在
目前没有回答
相关问题 更多 >
编程相关推荐