solidot新版网站常见问题,请点击这里查看。

AI 在 Stratego 游戏中达到专业人类玩家水平

人工智能
Wilson (42865)发表于 2022年12月07日 16时03分 星期三
来自火星合成人
DeepMind 的 AI DeepNash 在西洋陆军棋(Stratego)中达到了专业级人类玩家的水平。Stratego 是一款需在信息缺失情况下进行战略思考的棋盘游戏。它要比此前 AI 掌握的国际象棋、围棋或扑克复杂得多。在游戏中,双方各有 40 枚棋子,且彼此看不到棋子的真实“身份”。双方轮流移动棋子,来消灭对手的棋子,最终夺得对方军旗或消灭所有能动的棋子的一方获胜。因此,玩家需要进行战略部署、收集信息,并与对方博弈。一局 Stratego 游戏中会有 10^535 种可能的布局。相比之下,围棋的布局有 10^360 种可能。此外,在 Stratego 中,AI 需要推理对手超过 10^66 种部署策略,这使德州扑克中初始的 10^6 种可能情况相形见绌。DeepNash 以提出纳什均衡的数学家约翰·纳什的名字命名。DeepNash 将强化学习算法与深度神经网络相结合,以找到纳什均衡。


https://www.deepmind.com/blog/mastering-stratego-the-classic-game-of-imperfect-information
https://news.sciencenet.cn/htmlnews/2022/12/490736.shtm