奇客Solidot | DeepMind 的新 AI 无需知道规则就能精通游戏

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 5396 次

DeepMind 的新 AI 无需知道规则就能精通游戏

WinterIsComing (31822)发表于 2020年12月28日 20时37分星期一

来自

DeepMind 的最新 AI 无需知道规则就能精通游戏。该公司的研究人员在《自然》期刊上发表研究（预印本）报告了新 AI 算法 MuZero。DeepMind 以打败围棋世界冠军的 AlphaGo 闻名，AlphaGo 利用了无数棋局进行训练。2017 年 DeepMind 推出了 AlphaZero，只需要知道基本规则就能自我训练精通游戏的 AI 算法。MuZero 则不再需要知道规则。它通过不断的试错去了解规则所允许的动作，同时了解特定动作所带来的奖励。它在此过程中不断学习找到更容易获得奖励的方法。通过同时学习规则和改进玩法，MuZero 在数据利用效率超过了 AlphaZero 等前辈。研究人员正尝试将 MuZero 应用于视频压缩、自动驾驶和蛋白质设计。这一系统需要的算力非常多，但训练完成之后决策所需要的处理能力不需要多少，可以通过智能手机完成操作。儿童掌握知识的能力曾让很多人惊叹，语言学家 Noam Chomsky 曾主张儿童需要灌输语法知识否则难以掌握语言。这一观点受到越来越多的质疑。

我每天只吃四类食物：早饭、午饭、晚饭和零食。--加菲猫

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn