DeepMind 的新 AI 无需知道规则就能精通游戏

人工智能
WinterIsComing (31822)发表于 2020年12月28日 20时37分 星期一
来自部门
DeepMind 的最新 AI 无需知道规则就能精通游戏。该公司的研究人员在《自然》期刊上发表研究(预印本)报告了新 AI 算法 MuZero。DeepMind 以打败围棋世界冠军的 AlphaGo 闻名,AlphaGo 利用了无数棋局进行训练。2017 年 DeepMind 推出了 AlphaZero,只需要知道基本规则就能自我训练精通游戏的 AI 算法。MuZero 则不再需要知道规则。它通过不断的试错去了解规则所允许的动作,同时了解特定动作所带来的奖励。它在此过程中不断学习找到更容易获得奖励的方法。通过同时学习规则和改进玩法,MuZero 在数据利用效率超过了 AlphaZero 等前辈。研究人员正尝试将 MuZero 应用于视频压缩、自动驾驶和蛋白质设计。这一系统需要的算力非常多,但训练完成之后决策所需要的处理能力不需要多少,可以通过智能手机完成操作。儿童掌握知识的能力曾让很多人惊叹,语言学家 Noam Chomsky 曾主张儿童需要灌输语法知识否则难以掌握语言。这一观点受到越来越多的质疑。