solidot新版网站常见问题,请点击这里查看。

AlphaZero 靠自己精通三种棋类游戏

人工智能
pigsrollaroundinthem (39396)发表于 2018年12月07日 20时01分 星期五
来自看看就好
Google AI 子公司 DeepMind 的研究人员去年宣布他们的 AI 程序进化到了 AlphaZero,利用自对弈强化学习在短时间内打败了顶尖的国际象棋和日本将棋程序。在只知道基本规则的情况下,AlphaZero 靠自对弈精通了围棋、国际象棋和日本将棋。本周,DeepMind 在《科学》期刊上发表了他们的通用强化学习算法论文预印本PDF),确认和更新了去年的结果。论文描述了 AlphaZero 如何快速的学习三种棋类游戏成为史上最强的棋手,尽管它只知道基本规则没有其它该领域的知识。