Othello Alpha-Beta剪枝表现不佳 python
我现在正在尝试为黑白棋(Othello)制作一个好的人工智能,我使用了最小最大算法(Minimax)。但是,当我尝试使用一种叫做“α-β剪枝”的方法进行更深层次的搜索时,发现这个算法的表现非常糟糕。我查阅了维基百科和伯克利大学的网站,觉得我实现得没问题,但还是找不到出错的地方。
def alphabeta(board, player, a, b, lev):
h = heur(board, player)
if lev == 0:
return h, None
poss = get_legal_moves(board, player)
if len(poss) == 0:
return h, None
move = 0
for x in poss:
cpboard = board[:]
cpboard[x] = player
bracket(cpboard, player, x)
a1, q = alphabeta(cpboard, opponent_color(player), a, b, lev-1)
if player is me:
if a1 > a:
a, move = a1, x
else:
if a1 < b:
b, move = a1, x
if b <= a:
break
if player is me:
return a, move
else:
return b, move
2 个回答
1
你的alphabeta实现看起来没问题。因为当minimax和alphabeta都正确实现时,它们会产生相同的结果。所以你可以用之前的minimax代码来检查alphabeta,至少在搜索深度不太大的情况下。如果它们在搜索同一个游戏树时结果不一样,那说明你哪里出了问题。
不过,很可能你表现不好的原因是你的“heur”评估函数出了问题。
2
你的 alpha-beta 代码可能有问题。要注意当一个玩家“跳过回合”(也就是没有可用的动作)时会发生什么。我在我的代码中就遇到了一个棘手的错误,就是因为这个原因。
你在调用递归的时候,alpha 和 beta 的值有没有搞错?我的代码是这样工作的(Java 代码):
private float minimax(OthelloBoard board, OthelloMove best, float alpha, float beta, int depth)
{
float bestResult = -Float.MAX_VALUE;
OthelloMove garbage = new OthelloMove();
int state = board.getState();
int currentPlayer = board.getCurrentPlayer();
if (state == OthelloBoard.STATE_DRAW)
return 0.0f;
if ((state == OthelloBoard.STATE_BLACK_WINS) && (currentPlayer == OthelloBoard.BLACK))
return INFINITY;
if ((state == OthelloBoard.STATE_WHITE_WINS) && (currentPlayer == OthelloBoard.WHITE))
return INFINITY;
if ((state == OthelloBoard.STATE_BLACK_WINS) && (currentPlayer == OthelloBoard.WHITE))
return -INFINITY;
if ((state == OthelloBoard.STATE_WHITE_WINS) && (currentPlayer == OthelloBoard.BLACK))
return -INFINITY;
if (depth == maxDepth)
return OthelloHeuristics.eval(currentPlayer, board);
ArrayList<OthelloMove> moves = board.getAllMoves(currentPlayer);
for (OthelloMove mv : moves)
{
board.makeMove(mv);
alpha = - minimax(board, garbage, -beta, -alpha, depth + 1);
board.undoMove(mv);
if (beta <= alpha)
return alpha;
if (alpha > bestResult)
{
best.setFlipSquares(mv.getFlipSquares());
best.setIdx(mv.getIdx());
best.setPlayer(mv.getPlayer());
bestResult = alpha;
}
}
return bestResult;
}
调用的方式是:
OthelloMove bestFound = new OthelloMove();
int maxDepth = 8;
minimax(board, bestFound, -Float.MAX_VALUE, Float.MAX_VALUE, maxDepth);
//Wait for Thread to finish
board.makeMove(bestFound);
补充一下,如果一个玩家没有可用的动作,getAllMoves() 会返回一个“虚拟动作”,这个动作不会改变棋盘,只是跳过了回合。
希望这能帮到你!