奇客Solidot | 计算机科学家证明为什么更大的神经网络表现更好

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 4274 次

计算机科学家证明为什么更大的神经网络表现更好

wanwan (42055)发表于 2022年02月11日 17时35分星期五

来自阿尔法计划

人类多亏有对生拇指。但就算演化给了我们更多的拇指，情况也不会有太大的改善。每只手有一个拇指就足够了。神经网络不是这样，神经网络是执行类人任务的先进人工智能系统。随着它们变得更大，它们就能掌握更多。这会让旁观者大吃一惊。基本的数学结果表明，网络应该只需要这么大，但是现代神经网络的规模通常会远超出预测的需求——这种情况被称为过度参数化。在 12 月会议 NeurIPS 上发布的一篇论文中，微软研究院的 Sébastien Bubeck 和斯坦福大学的 Mark Sellke 为规模放大成功背后的奥秘提出了一种新的解释。他们表明，神经网络必须比传统预期的大得多，才能避免某些基本问题。这一发现为一个持续了几十年的问题提供了一般性的见解。对神经网络规模的标准预期来自对它们如何记忆数据的分析。但要了解记忆，我们必须首先了解网络的作用。神经网络的一项常见任务是识别图像中的对象。研究人员首先为其提供许多图像和对象标签，训练它学习两者之间的相关性。之后网络将正确识别它看过的图像中的对象。换句话说，训练使网络记住数据。更值得注意的是，一旦网络记住了足够多的训练数据，它就能以不同程度的准确度预测它从未见过的物体的标签。后一个过程被称为泛化。

所谓现实只不过是一个错觉，虽然这个错觉非常持久。--爱因斯坦

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn