solidot新版网站常见问题,请点击这里查看。
人工智能
WinterIsComing(31822)
发表于2022年04月11日 21时19分 星期一
来自神间失格
面部识别公司 Clearview AI 向乌克兰免费提供了它的人脸识别服务,利用照片帮助识别俄罗斯士兵的身份。这项技术的潜力不仅在于识别伤亡人员或追踪特定单位。华盛顿智库新美国的安全学者彼得·辛格表示,人们及其行动的数据越来越容易获得,这将使追踪犯下战争罪行的个人变得更容易。但这也让平民更加难以在紧张的环境中藏身。辛格说,“未来的战士将越来越难以保守身份的秘密,走在你的城市街道上的普通市民也是一样。”“在一个收集越来越多数据的世界里,每个人都会留下可以连接起来的线索,”他补充道。
人工智能
wanwan(42055)
发表于2022年04月11日 19时08分 星期一
来自神们自己
机器人可以按照程序设定举起汽车,甚至可以帮助进行手术,但如果要捡起它们之前从未接触过的物体——例如鸡蛋,它们就经常会遭遇惨败。现在工程师想出了一种可以克服这种局限的人造指尖,让机器能以类似人类指尖的方式感知表面的纹理。当布里斯托大学的研究人员在 2009 年开始设计人造指尖时,他们仿效了人体皮肤。第一个手工组装的指尖大约类似苏打水罐。到 2018 年,他们转而使用 3D 打印。让制作出像成年人大脚趾大小的指尖和所有的部件成为可能,且更容易创造出近似于人类皮肤多层结构的多个层。最近科学家将神经网络整合到他们称之为 TacTip 的人造指尖中。神经网络帮助机器人快速处理它所感知的内容并做出相应的反应——看起来就像一根真正的手指。

当我们指尖的皮肤和物体接触时,一层神经末梢就会变形,并告诉大脑发生了什么。这些神经发送“快”信号帮助我们避免掉落东西并发送“慢”信号来传达物体的形状。TacTip 的等效信号来自橡胶表面层之下的针状突起阵列,当表面被触摸时,这些针突就会移动。阵列的针突就像是发刷上的刷毛:坚硬但是可以弯曲。在该阵列之下,除了其他一些东西之外,还有一个摄像头,可以检测针突何时以及如何移动。针突的弯曲量提供慢信号,弯曲速度提供快信号。神经网络将这些信号转化为指尖的动作,例如使其握得更紧,或调整指尖的角度……在第二个项目中,Lepora 的团队为 TacTip 添加了更多的针突和麦克风。麦克风模仿我们皮肤深处的另一组神经末梢,当我们用手指在表面上滑动时,它们会感觉到振动。这些神经末梢增强了我们感受表面粗糙程度的能力。当研究人员测试增强后的指尖区分13种织物的能力时,麦克风起到了类似的作用。
人工智能
WinterIsComing(31822)
发表于2022年04月10日 17时02分 星期日
来自暗黑童话
OpenAI 的文本生成神经网络 GPT-3 被认为能产生以假乱真的文章,那么搜索引擎应该如何对待它生成的内容? Google 表示 AI 工具自动生成内容将被视为垃圾信息,此类内容可能会在搜索结果中受到惩罚。但 Google 的系统如果没有人类审阅者的帮助可能检测不出 AI 生成的内容。特定类型的 AI 写作助手在今天的媒体中实际上很常见。Google 的 Search Advocate John Mueller 表示如果 Google 的 webspam 团队发现了 AI 生成的内容,他们被授权可以对此采取行动。
人工智能
wanwan(42055)
发表于2022年04月01日 17时31分 星期五
来自影舞
国际象棋大奖赛系列赛是世界国际象棋锦标赛的重要组成部分,赛事主办方世界国际象棋联合会(国际棋联)表示,系列赛最后几轮的官方直播将采用选手心率指示器。这是世界国际象棋锦标赛循环赛事首次在直播中测量并显示选手的心率。它将让观众能更好地了解选手的情绪和真实感受(只要它们反映在心率之中)——这些顶尖棋手都受过训练、特别擅长不动声色,这是难得的窥见他们心理状态的机会。通过添加心率指示器,国际棋联为国际象棋直播添加了新的维度,开启了粉丝了解棋局的新篇章。为了在不打扰选手的情况下准确测量心率,国际棋联正部署一种定制的人工智能技术,类似于医院通过视频跟踪患者生命体征的技术。这是该技术首次用于体育直播。人工智能经过训练,可以读取皮肤因为心率在反射出的肤色上的变化,这些变化几乎看不见。观众可以在worldchess.com 以及 World Chess Youtube 和 Twitch 频道上免费观看国际象棋大奖赛的官方直播。国际棋联将在未来的赛事和直播中继续开发并使用视频心率读取技术。
人工智能
WinterIsComing(31822)
发表于2022年03月26日 18时41分 星期六
来自外交豁免权
英伟达研究院宣布了 Instant NeRF(Instant Neural Graphics Primitives),能在数秒内使用多幅 2D 照片转创建 3D 模型。源代码发布在 GitHub 上。根据 2D 照片创建 3D 场景的技术被称为逆向渲染(Inverse Rendering),传统方法需要数小时甚至更长时间,英伟达开发的 NeRF 能将这一过程在极短时间内完成。NeRF 训练一个小型神经网络,通过预测 3D 空间任意点向任意方向辐射的光线颜色重建场景。英伟达负责图形研究的副总裁 David Luebke 称,Instant NeRF 对 3D 的重要性不亚于数码相机和 JPEG 压缩对 2D 摄影的重要性。该公司利用这项新技术使用旧照片重建了著名的安迪·沃霍尔(Andy Warhol)拍摄快照的 3D 场景(YouTube)。
人工智能
wanwan(42055)
发表于2022年03月23日 16时05分 星期三
来自彗星来临
系外行星研究领域正经历翻天覆地的变化。迄今为止已确认了数千颗系外行星。有如此之多的行星可供研究,再加上望远镜灵敏度和数据分析的改进,研究的重点正在从发现转向界定。天文生物学家不再简单地寻找更多的行星,而是研究“潜在可居住”的世界,寻找可能的“生物特征”。水是地球上所有生命依赖的物质,因此它对系外行星和天体生物学研究非常重要。这种重要性反映在 NASA 的口号之中——“跟着水走”,这也是 Lisa Kaltenegger 和 Dang Pham 在 arXiv 上所发表论文的标题的灵感来源。“行星表面的液态水是潜在生命的明显标志之一——我在这里说‘潜在’是因为我们不知道还需要什么才能让生命产生。但是液态水是一个良好开端。所以我们使用了 NASA 的口号‘跟着水走’并提出疑问:怎样才能在宜居带系外行星的岩石表面上找到水?做光谱分析很花时间,因此我们正寻找一种更快捷的方法初步识别出有希望的行星——那些有液态水的行星。”目前天文学家仅限于寻找莱曼-α吸收线,这表明系外行星大气中存在氢气。这是大气水蒸气暴露在太阳紫外线辐射之下的副产品,这个过程导致它被化学分解成氢气和氧分子(O2)——前者散失到太空中,后者则被保留下来。
人工智能
WinterIsComing(31822)
发表于2022年03月18日 14时18分 星期五
来自惨败
中国围棋协会宣布,在 3 月 15 日进行的倡棋杯中国职业围棋锦标赛首轮中,刘睿智初段因违反“严禁使用人工智能”的规定被禁赛一年。鉴于疫情防控形势,倡棋杯此番在线上进行,组委会要求每位棋手在比赛时须有监督人员。根据比赛规程,比赛中严禁使用人工智能,一经查实禁赛一年,如为国家集训队队员立即开除出队。刘睿智 1996 年出生,2019 年定段成功成为职业初段。装备工业研究所所长左世全表示,AI 能通过分析参赛者的历史数据计算其接下来的走法而帮助棋手。
人工智能
wanwan(42055)
发表于2022年03月17日 14时11分 星期四
来自巨龙之夜
算法——让程序对数据进行排序、过滤和组合的代码块——是现代计算的标准工具。就像手表里的小齿轮,算法在更复杂的程序中执行明确定义的任务。它们无处不在,也(部分地)正因如此,随着时间的推移,它们经过了精心优化。当程序员需要对列表进行排序时,他们会使用用了几十年的标准“排序”算法。现在研究人员使用被称为机器学习的人工智能分支,重新审视传统算法。他们的方法被称为具有预测的算法,利用了机器学习工具可以提供的、对传统算法处理的数据的洞察力。这些工具重新激发了对基本算法的研究

MIT 计算机科学家 Piotr Indyk 表示,机器学习和传统算法是“两种截然不同的计算方式,而带有预测的算法是连接两者的一种方式。”“这是一种将两种完全不同的线程结合起来的方法。”最近对这种方法的兴趣不断上升,情况始于 2018 年,当时 MIT 的计算机科学家 Tim Kraska 和 Google 的一个研究团队发表了一篇论文。在论文中,作者表示机器学习可以改进一种经过充分研究的传统算法——布隆过滤器(Bloom filter),该算法解决了一个简单但是令人生畏的问题。

想象你管理着公司的 IT 部门,你需要检查员工是否会访问存在安全风险的网站。你可能会很天真地以为你需要检查他们访问的每一个网站,同已知的站点黑名单比较。如果这个黑名单很大(互联网上不受欢迎的网站可能就是这种情况),问题就会变得很棘手——你无法在很短的加载时间内将每个网站与庞大的列表对比。布隆过滤器提供了一个解决方案,让你可以快速准确地检查任何特定站点的地址(URL)是否在黑名单上。本质上它是通过将巨大的列表压缩成一个较小的列表,提供一些特定的保证的方式做到这一点的。
人工智能
wanwan(42055)
发表于2022年03月14日 15时55分 星期一
来自开普勒62号2:计时
Mindway AI 公司使用心理学家训练 AI 算法识别与赌博成瘾相关的行为。CEO Rasmus Kjærgaard 表示,挑战在于没有单一指标判断一个人是否赌博成瘾。在大多数赌场,人们对赌博成瘾的监测只关注几个因素——主要是花的钱和玩的时间。Mindway 的系统将 14 种不同的风险纳入考量。这些风险包括金钱和时间,也包括取消的银行提款,玩家在一天中赌博时间的变化以及赌注的不规则变化。每个因素都有一个从 1 到 100 的分数,然后人工智能对每个玩家进行风险评估,通过扑克的每一手或者轮盘赌的每一轮进行改进。玩家的得分从绿色(你做得很好)到血红色(立刻离开赌局)。

华达大学拉斯维加斯分校(UNLV)国际博彩学院的研究主任Brett Abarbanel认为,最棘手的地方在于获取这些数据并向玩家解释。“如果我的算法标记了某个人,认为他赌博成瘾,我不会给他递上一张写着‘嗨,好消息,我的算法已经将你识别为潜在的赌博成瘾者,你应该立刻停止赌博!’的便条。”Abarbanel 博士表示,对方的反应显而易见,会伸出中指:“这就是会出现的情况……”Kjærgaard 表示,自 2018 年开始,Mindway 同七家丹麦的运营商、德国和荷兰的各两家运营商、一家全球运营商和一家美国体育博彩运营商签约,为他们提供服务。在线赌博巨头 Flutter Entertainment 和 Entain 的年报显示,他们也与 Mindway 建立了合作伙伴关系。由于这项技术太新了,还没有监管机构制定标准,Mindway 和类似公司目前基本上是自由发挥。
人工智能
WinterIsComing(31822)
发表于2022年03月08日 21时29分 星期二
来自记忆
GitHub 的 Copilot 可能是目前最为知名的 AI 代码生成系统,只需要提示它就能根据上下文写出相应的代码,帮助开发者减少重复性的编程工作。Copilot 是基于 OpenAI 的 Codex,其训练集未公开,研究人员无法对 AI 模型进行微调或调查其可解释性。为弥补这一缺陷,卡内基梅隆大学的研究人员开发了 基于 OpenAI GPT-2 语言模型的代码生成模型 PolyCoder,它使用了 12 种编程语言的 249 GB 代码数据库进行训练。虽然在性能上比不上顶尖的代码生成器,但研究人员表示 PolyCoder 在 C 语言上其代码精度高于包括 Codex 在内的其它模型。研究人员称大型科技企业不公开模型阻碍科学研究和大型代码语言模型的大众化。他们希望自己的开源代码生成模型能说服其他人采用类似的做法。
Facebook
WinterIsComing(31822)
发表于2022年02月24日 13时52分 星期四
来自守卫者
Facebook 母公司Meta 首席执行官扎克伯格周三表示,公司正在进行人工智能(AI)研究,以通过语音生成世界,改进人们与语音助手的聊天方式,并在不同语言之间进行翻译。他勾勒出了建立元宇宙的关键步骤。扎克伯格押注元宇宙将接替移动互联网。元宇宙是一个未来主义的想法,即用户可以在其中工作、社交和游戏的虚拟环境。扎克伯格说,Meta 正在研究一类新的生成式 AI模型,它将允许人们描述一个世界并生成它的各个方面。在一个预先录制的演示中,扎克伯格展示了一个名为 Builder Bot(YouTube)的 AI 概念,他以一个无腿的 3D 化身形象出现在一个小岛上,并发出语音命令来创建一个海滩,然后添加云、树甚至野餐毯。
人工智能
WinterIsComing(31822)
发表于2022年02月23日 14时16分 星期三
来自记忆残留
美国版权局拒绝了授予 AI 创作作品版权的请求。三人委员会审查了 2019 年对 Steven Thaler 的裁决,他试图为名为 Creativity Machine 的算法所创作的一幅作品申请版权。委员会指出 AI 创作的作品不包含人类著作权的元素——这是版权保护的必要标准。这幅 AI 创作的作品取名为 A Recent Entrance to Paradis,是模拟濒死体验系列作品的一部分。AI 对图像进行重新处理创造出幻觉图像和对来世的虚拟描述。人类思维和创意表达之间的联系是版权保护的重要因素,虽然版权法律没有直接涉及到非人类作品的规定,但过去几年法庭对动物作品或神灵作品的版权保护是持反对立场的。
人工智能
wanwan(42055)
发表于2022年02月21日 14时56分 星期一
来自挽救计划
发表在 PNAS 期刊上的一项研究调查了深度伪造(deep fakes)的有效性,发现人类真的很容易迷上机器生成的面孔——甚至会认为它们比真实的面孔更值得信赖。研究合作者、加州伯克利分校教授 Hany Farid 表示:“我们发现,合成面孔不仅高度逼真,而且显得比真实的面孔更值得信赖。”这一结果引发了担忧,“这些面孔在用于邪恶目的时候可能会非常有效。”第一组在区分真假人脸方面的表现不比抛硬币决定更好,平均准确率为 48.2%……该组给合成人脸的可信度评分平均为 4.82,略高于给真实人脸的可信度评分 4.48。研究参与者确实压倒性地识别出了一些假脸。研究合作者 Sophie Nightingale 表示:“我们并不是说每张生成的图像都和真的人脸没有区别,但是里面有不少图像确实如此。”研究作者强调,深度伪造的欺骗性应用将继续构成威胁,他们得出了一个明确的结论:“我们鼓励开发这些技术的人思考相关的风险是否大于收益。”“如果是这样,我们不鼓励开发此类技术。”
人工智能
wanwan(42055)
发表于2022年02月18日 15时57分 星期五
来自人猿泰山之绝地反击
今天最成功的 AI 算法——人工神经网络大致是基于大脑复杂的真实神经网络。但和我们高效的大脑不同,在计算机上运行 AI 算法消耗的能量惊人:最大的模型在其生命期中消耗的能量几乎相当于五辆汽车。 更接近大脑设计原理和物理特性的神经形态计算可能会是节能 AI 的未来。神经形态设计不让数据在中央处理单元和内存芯片之间长途跋涉,而是模仿人类大脑中的果冻状物质的结构,计算单元(神经)被安放在内存旁边(存储在连接神经元的突触中)。为了让它们更像大脑,研究人员将神经形态芯片与模拟计算相结合,模拟计算可以处理连续的信号,就像真正的神经元一样。由此产生的芯片与当前依赖于 0 和 1 二进制信号处理的纯数字计算机的架构和计算模式有很大不同。

以大脑为向导,神经形态芯片有望能降低人工智能等数据密集型计算任务的能耗。不幸的是,人工智能算法在这些芯片的模拟版本上表现不佳,这是由于设备不匹配问题造成的:在芯片上,模拟神经元内的微小组件由于制造工艺而在尺寸上不匹配。由于单个芯片不够复杂,无法运行最新的训练程序,因此必须先在计算机上对算法进行数字化训练。当算法转移到芯片上时,一旦遇到模拟硬件上的不匹配,它们的性能就会崩溃。上个月发表在《美国国家科学院院刊》上的一篇论文提出了一种绕过这个问题的方法。由 Friedrich Miescher 生物医学研究所的 Friedemann Zenke 和海德堡大学的 Johannes Schemmel 领导的一组研究人员表明,一种被称为尖峰神经网络的人工智能算法——它使用被称为尖峰的大脑独特的通信信号——可以与芯片配合学习如何补偿设备不匹配。这篇论文是朝着模拟神经形态计算人工智能方向迈出的重要一步
人工智能
wanwan(42055)
发表于2022年02月17日 16时02分 星期四
来自神秘博士:闪光的人
Alphabet 旗下的 AI 子公司 DeepMind 训练强化学习算法控制托卡马克装置内的炙热等离子体。托卡马克是设计用于容纳核聚变反应的环形容器,其内部呈现出一种特殊的混乱状态。氢原子在不可思议的高温下相撞,产生比太阳表面还热的旋转翻滚的等离子体。找到控制并限制等离子体的智能方法将是释放核聚变潜力的关键,核聚变数十年来一直被认为是未来的清洁能源。目前聚变背后的科学原理已经明朗,剩下的只是工程方面的挑战。这正是 DeepMind 的用武之地。该公司此前将业务转向游戏和蛋白质折叠,它一直在与瑞士等离子中心(Swiss Plasma Center)进行一项联合研究项目,目标是开发一种用于控制核聚变反应的人工智能。在同样由聚变驱动的恒星中,纯粹的引力质量足以将氢原子拉到一起并克服它们的互斥电荷。在地球上,科学家改为使用强大的磁线圈约束核聚变反应,将其推到所需的位置,并像陶工在转盘上塑造粘土一样塑造它。必须仔细控制线圈以防止等离子体接触容器的侧面:这会损坏容器壁并减慢聚变反应。爆炸的风险很小,因为没有磁约束,聚变反应无法存在。但每次研究人员想改变等离子体的配置,尝试不同的形状以产生更多的能量或更清洁的等离子体时,都需要进行大量的工程和设计工作。洛桑联邦理工学院瑞士等离子中心主任 Ambrogio Fasoli 表示,传统的系统由计算机控制,基于模型和仔细的模拟,但是它们“很复杂,且不一定经过了优化”。DeepMind 开发了一种可自主控制等离子体的人工智能。发表在《自然》期刊上的一篇论文描述了两个小组的研究人员如何教授一个深度强化学习系统来控制 TCV 内的 19 个磁线圈,TCV 是瑞士等离子中心的可变配置托卡马克装置,用于进行未来更大聚变反应堆的设计研究。
人工智能
wanwan(42055)
发表于2022年02月11日 17时35分 星期五
来自阿尔法计划
人类多亏有对生拇指。但就算演化给了我们更多的拇指,情况也不会有太大的改善。每只手有一个拇指就足够了。神经网络不是这样,神经网络是执行类人任务的先进人工智能系统。随着它们变得更大,它们就能掌握更多。这会让旁观者大吃一惊。基本的数学结果表明,网络应该只需要这么大,但是现代神经网络的规模通常会远超出预测的需求——这种情况被称为过度参数化。在 12 月会议 NeurIPS 上发布的一篇论文中,微软研究院的 Sébastien Bubeck 和斯坦福大学的 Mark Sellke 为规模放大成功背后的奥秘提出了一种新的解释。他们表明,神经网络必须比传统预期的大得多,才能避免某些基本问题。这一发现为一个持续了几十年的问题提供了一般性的见解。对神经网络规模的标准预期来自对它们如何记忆数据的分析。但要了解记忆,我们必须首先了解网络的作用。神经网络的一项常见任务是识别图像中的对象。研究人员首先为其提供许多图像和对象标签,训练它学习两者之间的相关性。之后网络将正确识别它看过的图像中的对象。换句话说,训练使网络记住数据。更值得注意的是,一旦网络记住了足够多的训练数据,它就能以不同程度的准确度预测它从未见过的物体的标签。后一个过程被称为泛化。
人工智能
WinterIsComing(31822)
发表于2022年02月10日 23时34分 星期四
来自泰坦棋手
索尼 AI 部门的研究人员使用深度强化学习,训练 AI 玩 GT赛车游戏,在正面比赛中击败了世界最顶尖的玩家研究报告发表在《自然》 期刊上。赛车并不简单,除了控制速度外,还涉及到战术、战略甚至某种不明确的礼仪概念。实时控制具有复杂非线性动力学的汽车同时在前后左右车辆的毫厘之间进行操作是一项巨大的挑战。目前赛车游戏中最先进的 AI 方法来自于微软的 Forza Motorsport 系列,它始于微软研究院的一项神经网络项目,使用了人类玩家的数据训练 AI 车手。
人工智能
wanwan(42055)
发表于2022年02月08日 17时59分 星期二
来自沙皇的邮件
2018 年美国主要超算集群运算周期的第三大用途是气候模拟。夸克等亚原子粒子的研究排在第二位。位居榜首的是物理学中被引用最多的理论——尽管很少有人听说过它。它就是密度泛函理论(DFT),是物理学家和化学家用以理解任何比氢原子更复杂的事物的主要方法。几十年来,研究人员使用 DFT 的能力预测各种事物——从咖啡的味道到木星核心的密实度。DFT 为科学家提供了一种强大的捷径,可以预测电子的去向,进而预测原子、分子和其他“披着”电子的物体将如何作用。长期以来,物理学家和化学家一直在用深厚的物理学专业知识让方程式能更好地反映所有电子共有的复杂舞蹈。但是最近,神经网络设计的新工具可以与手工制作的“前辈”相媲美,并且在某些方面青出于蓝。一些研究人员现在认为,机器学习可以帮助研究人员以更快、更大的步伐迈向主电子方程,从而解开新药、超导和奇异材料的奥秘。
人工智能
WinterIsComing(31822)
发表于2022年02月07日 21时09分 星期一
来自棕榈上的霜
至少在部分问题上 AI 程序员能与真正的程序员竞争了。Alphabet 旗下 AI 子公司 DeepMind 宣布了 AI 代码生成系统 AlphaCode(PDF),声称测试显示其水平在编程竞赛中已经具备了竞争力。计算机科学家 Scott Aaronson 也为 AI 在编程方面的进步惊叹不已。DeepMind 称,AlphaCode 使用了基于 transformer 的语言模型去生成代码,然后筛选出其中一部分有前景的程序。它使用了数万编程竞赛题和题目的数百万解进行训练,对每一项编程挑战它会生成一百万候选程序,通过检查示例数据丢弃掉大部分候选程序。编程竞赛平台 Codeforces 上的测试显示,AlphaCode 在三分之一的问题中达到了中等人类程序员的水平。标志着 AI 代码生成系统首次在编程竞赛中具有了竞争力。
人工智能
wanwan(42055)
发表于2022年01月26日 20时29分 星期三
来自你在天堂里遇见的下一个人
人工智能很大程度上是数字游戏。10 年前深度神经网络开始超越传统算法,这是因为我们终于拥有了足够的数据和处理能力。深度神经网络是一种学习识别数据模式的人工智能形式。今天的神经网络愈加渴望数据和算力。网络的参数有数百万甚至是数十亿个,参数代表了人工神经元之间连接的强度,训练神经网络需要对其仔细调整。目标是寻找到近于理想的值,该过程被称为优化,但是训练网络达到这一点并不容易。伦敦 DeepMind 的研究科学家 Petar Veličković 表示:“训练可能需要几天、几周甚至是几个月的时间。”

这种情况也许很快会改变。安大略省圭尔夫大学的 Boris Knyazev 和同事设计并训练了一个“超网络(hypernetwork)”——一种其他神经网络的霸主——可以加快训练的过程。对于一个为了某项任务设计的、未经训练的新神经网络,超网络可以在几分之一秒内预测出它的参数,从理论上让训练变得不再有必要。由于超网络学习了深度神经网络设计中极其复杂的模式,因此这项工作也可能具有更深层次的理论意义。

现阶段超网络在某些环境中的表现好得出人意料,但仍然有改善的空间——考虑到问题的量级,这是很自然的。Veličković 表示,如果他们能解决这个问题,“将对机器学习产生全方位的影响。”

目前训练和优化神经网络的最好方法是随机梯度下降法(SGD)技术的变体。训练涉及最小化网络在给定任务(例如图像识别)中所犯的错误。SGD 算法通过大量标记数据调整网络参数并减少错误或损失。梯度下降是从损失函数的高值下降到某个最小值的迭代过程,代表了足够好的(有时甚至是最好的)参数值。

但是这种技术只有在你有一个网络需要优化的时候才有效。为了构建最初的神经网络——通常由从输入到输出之间的多层人工神经元组成,工程师必须依靠直觉和经验法则。这些架构在神经元的层数,每层的神经元数量等方面会有所不同。