奇客Solidot | DeepMind 认为增强学习足以实现通用 AI

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 6266 次

DeepMind 认为增强学习足以实现通用 AI

WinterIsComing (31822)发表于 2021年06月12日 22时43分星期六

来自

过去几十年计算机科学家创造的 AI 系统只能在受限环境下解决特定问题，离通用 AI 还有一段距离。DeepMind 的科学家现在认为，通用 AI 能通过一个简单而强有力的原则去实现：奖励最大化。他们发表了论文《Reward is Enough》，认为奖励最大化和试错足以发展出与智能相关的行为。AI 的一个分支强化学习（reinforcement learning）是基于奖励最大化，能引领通用 AI 的发展。DeepMind 的研究人员提出一个假说：奖励最大化的通用目标足以驱动大部分如果不是全部的智能行为。大自然就是如此运作的，复杂有机物不存在自上而下的智能设计，数十亿年的自然选择和随机突变过滤出适合生存和繁殖的生命形式。能更好处理挑战和适应环境的生命生存和繁衍，其余则销声匿迹。这种简单而有效的机制演化出生命的各种能力和技能。

就算它工作不正常也别担心。如果一切正常，你早该失业了--Mosher的软件工程定律

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn