文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
ken:feigaobox@gmail.com
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
Solidot 公告
投 票
热门评论
- 所以这家公司原本有 80 人? (1 points, 一般) by cupen 在 2023年01月13日00时09分 星期五 评论到 Parler 裁员四分之三仅剩 20 人
- 什么是真正的文明。唉。回不去了 (1 points, 一般) by devfsdvyui 在 2023年01月09日03时21分 星期一 评论到 只有最富有的古希腊人纳税,他们还为此炫耀
- Solidot什么时候有“基本原则”了? (1 points, 一般) by solids 在 2022年12月30日03时20分 星期五 评论到 为什么你应该接种有效疫苗而不只是靠感染?
- 同意~ (1 points, 一般) by devfsdvyui 在 2022年12月27日10时45分 星期二 评论到 为什么你应该接种有效疫苗而不只是靠感染?
- 这篇还是删了吧 (1 points, 一般) by 梦绕神州 在 2022年12月26日09时17分 星期一 评论到 为什么你应该接种有效疫苗而不只是靠感染?
- 那个不叫二进制 而是二叉树 (1 points, 一般) by solidot1544068314 在 2022年12月14日21时34分 星期三 评论到 内核补丁将 kallsyms_lookup_name()查找速度提高 715 倍
- 陈冠希说你们早干嘛去了? (1 points, 一般) by kokerkov 在 2022年11月28日17时04分 星期一 评论到 调查发现电脑维修店员工会访问客户个人数据
- 我不信 (1 points, 一般) by Craynic 在 2022年11月28日14时44分 星期一 评论到 Google 称互联网的六成是重复内容
- 支持 (1 points, 一般) by zagfai 在 2022年11月22日14时29分 星期二 评论到 Tumblr 将加入对 ActivityPub 协议的支持
- 权力 (1 points, 一般) by mep 在 2022年11月22日11时25分 星期二 评论到 记者想在 Mastodon 上重造 Twitter,但 Mastodon 不想参合
当大学讲师 Angela Dancey 想知道一年级英语学生是否理解了她试图在课堂上传授的内容时,他们的面部表情和身体语言没有透露多少线索。伊利诺伊大学芝加哥分校的高级讲师 Dancey 表示:“即使是在面对面的课堂上,也很难弄清楚学生的状态。通常情况下,本科生不会通过面部流露出太多东西,特别是当他们不理解的时候。”Dancey 使用了一些久经考验的方法,例如要求学生在讲课或者讨论结束之后确定他们“最不明白的点”——她认为学生仍然难以理解的概念或想法。她表示:“我要求他们把它写下来,分享出来,我们全班一起解决,让每个人都受益。”但是英特尔和销售 Class 虚拟课堂软件的 Classroom Technologies 认为可能有更好的方法。两家公司合作将英特尔开发的 AI 技术与运行在 Zoom 之上的 Class 集成在一起。英特尔宣称其系统可以通过评估学生的面部表情以及他们如何与教育内容互动检测他们是否感到无聊、分心或者困惑。
Classroom Technologies 的联合创始人兼首席执行官 Michael Chasen 表示:“我们可以为教师提供更多见解,以便于他们更好地进行交流。”他表示在疫情期间,教师在虚拟教室环境中与学生互动时遇到了困难。他的公司计划测试英特尔的学生参与度分析技术,该技术使用计算机摄像头和计算机视觉技术捕捉学生面部图像,将其与学生当时正在做什么的情景信息结合在一起,评估学生的理解状态。帮助开发该技术的英特尔研究科学家 Sinem Aslan 表示,英特尔希望将这项技术转变为一种可以更广泛提供的产品。Aslan 表示:“我们正在努力实现大规模的一对一辅导,”补充表示该系统旨在帮助教师识别学生何时需要帮助,并告诉他们应该如何根据学生和教育内容的互动来改变教学材料。“高度无聊将导致(学生)完全脱离教学内容。”但是批评者认为,根本不可能通过面部表情或者其他外部信号准确判断某个人是否感到无聊、困惑、快乐或者悲伤。
Classroom Technologies 的联合创始人兼首席执行官 Michael Chasen 表示:“我们可以为教师提供更多见解,以便于他们更好地进行交流。”他表示在疫情期间,教师在虚拟教室环境中与学生互动时遇到了困难。他的公司计划测试英特尔的学生参与度分析技术,该技术使用计算机摄像头和计算机视觉技术捕捉学生面部图像,将其与学生当时正在做什么的情景信息结合在一起,评估学生的理解状态。帮助开发该技术的英特尔研究科学家 Sinem Aslan 表示,英特尔希望将这项技术转变为一种可以更广泛提供的产品。Aslan 表示:“我们正在努力实现大规模的一对一辅导,”补充表示该系统旨在帮助教师识别学生何时需要帮助,并告诉他们应该如何根据学生和教育内容的互动来改变教学材料。“高度无聊将导致(学生)完全脱离教学内容。”但是批评者认为,根本不可能通过面部表情或者其他外部信号准确判断某个人是否感到无聊、困惑、快乐或者悲伤。
过去两年人工智能程序的语言流畅度达到了惊人的水平。其中最优秀的程序都是基于 2017 年发明的、被称为 Transformer 的架构。它以方程式列表的形式,作为程序遵循的一种蓝图。除了这个简单的数学概述之外,我们不知道 Transformer 对处理的单词做了什么。普遍的理解是它们以某种方式同时关注多个单词,从而可以立即进行“大图景”分析,但究竟是如何工作的——或者甚至这是否是准确理解 Transformer 的方式——都还不清楚。我们知道成分,但不知道配方。Anthropic 公司的研究人员进行的两项研究开始从根本上弄清楚 Transformer 在处理和生成文本时在做什么。在 12 月发布的首篇论文中,他们着眼于架构的简化版本并充分解释了它们的功能。作者还展示了从学习基本语言模式到获得语言处理通用能力的简单 Transformer。
在 3 月8 日发表的第二篇论文中,研究人员表明,负责这种能力的相同组件在最复杂的 Transformer 中也发挥作用。虽然这些模型的运算在很大程度上仍难以理解,但是这些结果为理解提供了一个途径。理解Transformer 的难点在抽象性。传统程序遵循着一个可以理解的过程,如看到“绿色的”时输出“草”,而Transformer 则是将“绿色的”这个单词转换为数字,然后将其乘以某些值。这些值(也被称为参数)决定下一个单词是什么。它们在训练过程中得到微调,模型在这个过程中学会了如何产生最佳输出,但尚不清楚模型在学习的是什么。大多数机器学习程序将运算打包成模块化的成分,这些成分被称为神经元。Transformer 加入了一种额外的成分,被称为注意力头(attention head),成组的头分层排列(就像神经元一样)。但是头执行的操作和神经元完全不同。头通常被理解为允许程序记住输入的多个单词,但这种解释远非定论。
在 3 月8 日发表的第二篇论文中,研究人员表明,负责这种能力的相同组件在最复杂的 Transformer 中也发挥作用。虽然这些模型的运算在很大程度上仍难以理解,但是这些结果为理解提供了一个途径。理解Transformer 的难点在抽象性。传统程序遵循着一个可以理解的过程,如看到“绿色的”时输出“草”,而Transformer 则是将“绿色的”这个单词转换为数字,然后将其乘以某些值。这些值(也被称为参数)决定下一个单词是什么。它们在训练过程中得到微调,模型在这个过程中学会了如何产生最佳输出,但尚不清楚模型在学习的是什么。大多数机器学习程序将运算打包成模块化的成分,这些成分被称为神经元。Transformer 加入了一种额外的成分,被称为注意力头(attention head),成组的头分层排列(就像神经元一样)。但是头执行的操作和神经元完全不同。头通常被理解为允许程序记住输入的多个单词,但这种解释远非定论。
名叫 Speedcam Anywhere 的应用利用 AI 对车速进行测量,允许公众向警方递交司机超速的证据,共同实现公路更安全的愿景。应用背后的科学家团队希望它能鼓励警察更严肃的对待超速,让公众能记录本地的交通犯罪。但应用开发者现在表示他们受到了恶毒的攻击,以至于担心披露身份。应用的匿名创始人 Sam 说他们收到了大量谩骂的邮件,人们对该产品的立场爱憎分明,部分人认为它是好事,另一部分人认为它将创造一个监视国度。他说,如果公路对速度有限制,那么司机就应该遵守法律,警察就应该执行法律。这里不存在什么私人恩怨,而是如何让公路更安全。如何减少每年发生在公路上的 2 万起严重事故?他们的应用旨在对超速行驶进行威慑。Speedcam Anywhere 尚未被苹果应用商店批准,而 Google 一开始也拒绝认为不可能只靠 AI 就能测速。Sam 表示不清楚苹果拒绝这一应用上架的理由。
面部识别公司 Clearview AI 向乌克兰免费提供了它的人脸识别服务,利用照片帮助识别俄罗斯士兵的身份。这项技术的潜力不仅在于识别伤亡人员或追踪特定单位。华盛顿智库新美国的安全学者彼得·辛格表示,人们及其行动的数据越来越容易获得,这将使追踪犯下战争罪行的个人变得更容易。但这也让平民更加难以在紧张的环境中藏身。辛格说,“未来的战士将越来越难以保守身份的秘密,走在你的城市街道上的普通市民也是一样。”“在一个收集越来越多数据的世界里,每个人都会留下可以连接起来的线索,”他补充道。
机器人可以按照程序设定举起汽车,甚至可以帮助进行手术,但如果要捡起它们之前从未接触过的物体——例如鸡蛋,它们就经常会遭遇惨败。现在工程师想出了一种可以克服这种局限的人造指尖,让机器能以类似人类指尖的方式感知表面的纹理。当布里斯托大学的研究人员在 2009 年开始设计人造指尖时,他们仿效了人体皮肤。第一个手工组装的指尖大约类似苏打水罐。到 2018 年,他们转而使用 3D 打印。让制作出像成年人大脚趾大小的指尖和所有的部件成为可能,且更容易创造出近似于人类皮肤多层结构的多个层。最近科学家将神经网络整合到他们称之为 TacTip 的人造指尖中。神经网络帮助机器人快速处理它所感知的内容并做出相应的反应——看起来就像一根真正的手指。
当我们指尖的皮肤和物体接触时,一层神经末梢就会变形,并告诉大脑发生了什么。这些神经发送“快”信号帮助我们避免掉落东西并发送“慢”信号来传达物体的形状。TacTip 的等效信号来自橡胶表面层之下的针状突起阵列,当表面被触摸时,这些针突就会移动。阵列的针突就像是发刷上的刷毛:坚硬但是可以弯曲。在该阵列之下,除了其他一些东西之外,还有一个摄像头,可以检测针突何时以及如何移动。针突的弯曲量提供慢信号,弯曲速度提供快信号。神经网络将这些信号转化为指尖的动作,例如使其握得更紧,或调整指尖的角度……在第二个项目中,Lepora 的团队为 TacTip 添加了更多的针突和麦克风。麦克风模仿我们皮肤深处的另一组神经末梢,当我们用手指在表面上滑动时,它们会感觉到振动。这些神经末梢增强了我们感受表面粗糙程度的能力。当研究人员测试增强后的指尖区分13种织物的能力时,麦克风起到了类似的作用。
当我们指尖的皮肤和物体接触时,一层神经末梢就会变形,并告诉大脑发生了什么。这些神经发送“快”信号帮助我们避免掉落东西并发送“慢”信号来传达物体的形状。TacTip 的等效信号来自橡胶表面层之下的针状突起阵列,当表面被触摸时,这些针突就会移动。阵列的针突就像是发刷上的刷毛:坚硬但是可以弯曲。在该阵列之下,除了其他一些东西之外,还有一个摄像头,可以检测针突何时以及如何移动。针突的弯曲量提供慢信号,弯曲速度提供快信号。神经网络将这些信号转化为指尖的动作,例如使其握得更紧,或调整指尖的角度……在第二个项目中,Lepora 的团队为 TacTip 添加了更多的针突和麦克风。麦克风模仿我们皮肤深处的另一组神经末梢,当我们用手指在表面上滑动时,它们会感觉到振动。这些神经末梢增强了我们感受表面粗糙程度的能力。当研究人员测试增强后的指尖区分13种织物的能力时,麦克风起到了类似的作用。
OpenAI 的文本生成神经网络 GPT-3 被认为能产生以假乱真的文章,那么搜索引擎应该如何对待它生成的内容?
Google 表示 AI 工具自动生成内容将被视为垃圾信息,此类内容可能会在搜索结果中受到惩罚。但 Google 的系统如果没有人类审阅者的帮助可能检测不出 AI 生成的内容。特定类型的 AI 写作助手在今天的媒体中实际上很常见。Google 的 Search Advocate John Mueller 表示如果 Google 的 webspam 团队发现了 AI 生成的内容,他们被授权可以对此采取行动。
国际象棋大奖赛系列赛是世界国际象棋锦标赛的重要组成部分,赛事主办方世界国际象棋联合会(国际棋联)表示,系列赛最后几轮的官方直播将采用选手心率指示器。这是世界国际象棋锦标赛循环赛事首次在直播中测量并显示选手的心率。它将让观众能更好地了解选手的情绪和真实感受(只要它们反映在心率之中)——这些顶尖棋手都受过训练、特别擅长不动声色,这是难得的窥见他们心理状态的机会。通过添加心率指示器,国际棋联为国际象棋直播添加了新的维度,开启了粉丝了解棋局的新篇章。为了在不打扰选手的情况下准确测量心率,国际棋联正部署一种定制的人工智能技术,类似于医院通过视频跟踪患者生命体征的技术。这是该技术首次用于体育直播。人工智能经过训练,可以读取皮肤因为心率在反射出的肤色上的变化,这些变化几乎看不见。观众可以在worldchess.com 以及 World Chess Youtube 和 Twitch 频道上免费观看国际象棋大奖赛的官方直播。国际棋联将在未来的赛事和直播中继续开发并使用视频心率读取技术。
英伟达研究院宣布了 Instant NeRF(Instant Neural Graphics Primitives),能在数秒内使用多幅 2D 照片转创建 3D 模型。源代码发布在 GitHub 上。根据 2D 照片创建 3D 场景的技术被称为逆向渲染(Inverse Rendering),传统方法需要数小时甚至更长时间,英伟达开发的 NeRF 能将这一过程在极短时间内完成。NeRF 训练一个小型神经网络,通过预测 3D 空间任意点向任意方向辐射的光线颜色重建场景。英伟达负责图形研究的副总裁 David Luebke 称,Instant NeRF 对 3D 的重要性不亚于数码相机和 JPEG 压缩对 2D 摄影的重要性。该公司利用这项新技术使用旧照片重建了著名的安迪·沃霍尔(Andy Warhol)拍摄快照的 3D 场景(YouTube)。
系外行星研究领域正经历翻天覆地的变化。迄今为止已确认了数千颗系外行星。有如此之多的行星可供研究,再加上望远镜灵敏度和数据分析的改进,研究的重点正在从发现转向界定。天文生物学家不再简单地寻找更多的行星,而是研究“潜在可居住”的世界,寻找可能的“生物特征”。水是地球上所有生命依赖的物质,因此它对系外行星和天体生物学研究非常重要。这种重要性反映在 NASA 的口号之中——“跟着水走”,这也是 Lisa Kaltenegger 和 Dang Pham 在 arXiv 上所发表论文的标题的灵感来源。“行星表面的液态水是潜在生命的明显标志之一——我在这里说‘潜在’是因为我们不知道还需要什么才能让生命产生。但是液态水是一个良好开端。所以我们使用了 NASA 的口号‘跟着水走’并提出疑问:怎样才能在宜居带系外行星的岩石表面上找到水?做光谱分析很花时间,因此我们正寻找一种更快捷的方法初步识别出有希望的行星——那些有液态水的行星。”目前天文学家仅限于寻找莱曼-α吸收线,这表明系外行星大气中存在氢气。这是大气水蒸气暴露在太阳紫外线辐射之下的副产品,这个过程导致它被化学分解成氢气和氧分子(O2)——前者散失到太空中,后者则被保留下来。
算法——让程序对数据进行排序、过滤和组合的代码块——是现代计算的标准工具。就像手表里的小齿轮,算法在更复杂的程序中执行明确定义的任务。它们无处不在,也(部分地)正因如此,随着时间的推移,它们经过了精心优化。当程序员需要对列表进行排序时,他们会使用用了几十年的标准“排序”算法。现在研究人员使用被称为机器学习的人工智能分支,重新审视传统算法。他们的方法被称为具有预测的算法,利用了机器学习工具可以提供的、对传统算法处理的数据的洞察力。这些工具重新激发了对基本算法的研究。
MIT 计算机科学家 Piotr Indyk 表示,机器学习和传统算法是“两种截然不同的计算方式,而带有预测的算法是连接两者的一种方式。”“这是一种将两种完全不同的线程结合起来的方法。”最近对这种方法的兴趣不断上升,情况始于 2018 年,当时 MIT 的计算机科学家 Tim Kraska 和 Google 的一个研究团队发表了一篇论文。在论文中,作者表示机器学习可以改进一种经过充分研究的传统算法——布隆过滤器(Bloom filter),该算法解决了一个简单但是令人生畏的问题。
想象你管理着公司的 IT 部门,你需要检查员工是否会访问存在安全风险的网站。你可能会很天真地以为你需要检查他们访问的每一个网站,同已知的站点黑名单比较。如果这个黑名单很大(互联网上不受欢迎的网站可能就是这种情况),问题就会变得很棘手——你无法在很短的加载时间内将每个网站与庞大的列表对比。布隆过滤器提供了一个解决方案,让你可以快速准确地检查任何特定站点的地址(URL)是否在黑名单上。本质上它是通过将巨大的列表压缩成一个较小的列表,提供一些特定的保证的方式做到这一点的。
MIT 计算机科学家 Piotr Indyk 表示,机器学习和传统算法是“两种截然不同的计算方式,而带有预测的算法是连接两者的一种方式。”“这是一种将两种完全不同的线程结合起来的方法。”最近对这种方法的兴趣不断上升,情况始于 2018 年,当时 MIT 的计算机科学家 Tim Kraska 和 Google 的一个研究团队发表了一篇论文。在论文中,作者表示机器学习可以改进一种经过充分研究的传统算法——布隆过滤器(Bloom filter),该算法解决了一个简单但是令人生畏的问题。
想象你管理着公司的 IT 部门,你需要检查员工是否会访问存在安全风险的网站。你可能会很天真地以为你需要检查他们访问的每一个网站,同已知的站点黑名单比较。如果这个黑名单很大(互联网上不受欢迎的网站可能就是这种情况),问题就会变得很棘手——你无法在很短的加载时间内将每个网站与庞大的列表对比。布隆过滤器提供了一个解决方案,让你可以快速准确地检查任何特定站点的地址(URL)是否在黑名单上。本质上它是通过将巨大的列表压缩成一个较小的列表,提供一些特定的保证的方式做到这一点的。
Mindway AI 公司使用心理学家训练 AI 算法识别与赌博成瘾相关的行为。CEO Rasmus Kjærgaard 表示,挑战在于没有单一指标判断一个人是否赌博成瘾。在大多数赌场,人们对赌博成瘾的监测只关注几个因素——主要是花的钱和玩的时间。Mindway 的系统将 14 种不同的风险纳入考量。这些风险包括金钱和时间,也包括取消的银行提款,玩家在一天中赌博时间的变化以及赌注的不规则变化。每个因素都有一个从 1 到 100 的分数,然后人工智能对每个玩家进行风险评估,通过扑克的每一手或者轮盘赌的每一轮进行改进。玩家的得分从绿色(你做得很好)到血红色(立刻离开赌局)。
华达大学拉斯维加斯分校(UNLV)国际博彩学院的研究主任Brett Abarbanel认为,最棘手的地方在于获取这些数据并向玩家解释。“如果我的算法标记了某个人,认为他赌博成瘾,我不会给他递上一张写着‘嗨,好消息,我的算法已经将你识别为潜在的赌博成瘾者,你应该立刻停止赌博!’的便条。”Abarbanel 博士表示,对方的反应显而易见,会伸出中指:“这就是会出现的情况……”Kjærgaard 表示,自 2018 年开始,Mindway 同七家丹麦的运营商、德国和荷兰的各两家运营商、一家全球运营商和一家美国体育博彩运营商签约,为他们提供服务。在线赌博巨头 Flutter Entertainment 和 Entain 的年报显示,他们也与 Mindway 建立了合作伙伴关系。由于这项技术太新了,还没有监管机构制定标准,Mindway 和类似公司目前基本上是自由发挥。
华达大学拉斯维加斯分校(UNLV)国际博彩学院的研究主任Brett Abarbanel认为,最棘手的地方在于获取这些数据并向玩家解释。“如果我的算法标记了某个人,认为他赌博成瘾,我不会给他递上一张写着‘嗨,好消息,我的算法已经将你识别为潜在的赌博成瘾者,你应该立刻停止赌博!’的便条。”Abarbanel 博士表示,对方的反应显而易见,会伸出中指:“这就是会出现的情况……”Kjærgaard 表示,自 2018 年开始,Mindway 同七家丹麦的运营商、德国和荷兰的各两家运营商、一家全球运营商和一家美国体育博彩运营商签约,为他们提供服务。在线赌博巨头 Flutter Entertainment 和 Entain 的年报显示,他们也与 Mindway 建立了合作伙伴关系。由于这项技术太新了,还没有监管机构制定标准,Mindway 和类似公司目前基本上是自由发挥。
GitHub 的 Copilot 可能是目前最为知名的 AI 代码生成系统,只需要提示它就能根据上下文写出相应的代码,帮助开发者减少重复性的编程工作。Copilot 是基于 OpenAI 的 Codex,其训练集未公开,研究人员无法对 AI 模型进行微调或调查其可解释性。为弥补这一缺陷,卡内基梅隆大学的研究人员开发了 基于 OpenAI GPT-2 语言模型的代码生成模型 PolyCoder,它使用了 12 种编程语言的 249 GB 代码数据库进行训练。虽然在性能上比不上顶尖的代码生成器,但研究人员表示 PolyCoder 在 C 语言上其代码精度高于包括 Codex 在内的其它模型。研究人员称大型科技企业不公开模型阻碍科学研究和大型代码语言模型的大众化。他们希望自己的开源代码生成模型能说服其他人采用类似的做法。
Facebook 母公司Meta 首席执行官扎克伯格周三表示,公司正在进行人工智能(AI)研究,以通过语音生成世界,改进人们与语音助手的聊天方式,并在不同语言之间进行翻译。他勾勒出了建立元宇宙的关键步骤。扎克伯格押注元宇宙将接替移动互联网。元宇宙是一个未来主义的想法,即用户可以在其中工作、社交和游戏的虚拟环境。扎克伯格说,Meta 正在研究一类新的生成式 AI模型,它将允许人们描述一个世界并生成它的各个方面。在一个预先录制的演示中,扎克伯格展示了一个名为 Builder Bot(YouTube)的 AI 概念,他以一个无腿的 3D 化身形象出现在一个小岛上,并发出语音命令来创建一个海滩,然后添加云、树甚至野餐毯。
美国版权局拒绝了授予 AI 创作作品版权的请求。三人委员会审查了 2019 年对 Steven Thaler 的裁决,他试图为名为 Creativity Machine 的算法所创作的一幅作品申请版权。委员会指出 AI 创作的作品不包含人类著作权的元素——这是版权保护的必要标准。这幅 AI 创作的作品取名为 A Recent Entrance to Paradis,是模拟濒死体验系列作品的一部分。AI 对图像进行重新处理创造出幻觉图像和对来世的虚拟描述。人类思维和创意表达之间的联系是版权保护的重要因素,虽然版权法律没有直接涉及到非人类作品的规定,但过去几年法庭对动物作品或神灵作品的版权保护是持反对立场的。
发表在 PNAS 期刊上的一项研究调查了深度伪造(deep fakes)的有效性,发现人类真的很容易迷上机器生成的面孔——甚至会认为它们比真实的面孔更值得信赖。研究合作者、加州伯克利分校教授 Hany Farid 表示:“我们发现,合成面孔不仅高度逼真,而且显得比真实的面孔更值得信赖。”这一结果引发了担忧,“这些面孔在用于邪恶目的时候可能会非常有效。”第一组在区分真假人脸方面的表现不比抛硬币决定更好,平均准确率为 48.2%……该组给合成人脸的可信度评分平均为 4.82,略高于给真实人脸的可信度评分 4.48。研究参与者确实压倒性地识别出了一些假脸。研究合作者 Sophie Nightingale 表示:“我们并不是说每张生成的图像都和真的人脸没有区别,但是里面有不少图像确实如此。”研究作者强调,深度伪造的欺骗性应用将继续构成威胁,他们得出了一个明确的结论:“我们鼓励开发这些技术的人思考相关的风险是否大于收益。”“如果是这样,我们不鼓励开发此类技术。”
今天最成功的 AI 算法——人工神经网络大致是基于大脑复杂的真实神经网络。但和我们高效的大脑不同,在计算机上运行 AI 算法消耗的能量惊人:最大的模型在其生命期中消耗的能量几乎相当于五辆汽车。 更接近大脑设计原理和物理特性的神经形态计算可能会是节能 AI 的未来。神经形态设计不让数据在中央处理单元和内存芯片之间长途跋涉,而是模仿人类大脑中的果冻状物质的结构,计算单元(神经)被安放在内存旁边(存储在连接神经元的突触中)。为了让它们更像大脑,研究人员将神经形态芯片与模拟计算相结合,模拟计算可以处理连续的信号,就像真正的神经元一样。由此产生的芯片与当前依赖于 0 和 1 二进制信号处理的纯数字计算机的架构和计算模式有很大不同。
以大脑为向导,神经形态芯片有望能降低人工智能等数据密集型计算任务的能耗。不幸的是,人工智能算法在这些芯片的模拟版本上表现不佳,这是由于设备不匹配问题造成的:在芯片上,模拟神经元内的微小组件由于制造工艺而在尺寸上不匹配。由于单个芯片不够复杂,无法运行最新的训练程序,因此必须先在计算机上对算法进行数字化训练。当算法转移到芯片上时,一旦遇到模拟硬件上的不匹配,它们的性能就会崩溃。上个月发表在《美国国家科学院院刊》上的一篇论文提出了一种绕过这个问题的方法。由 Friedrich Miescher 生物医学研究所的 Friedemann Zenke 和海德堡大学的 Johannes Schemmel 领导的一组研究人员表明,一种被称为尖峰神经网络的人工智能算法——它使用被称为尖峰的大脑独特的通信信号——可以与芯片配合学习如何补偿设备不匹配。这篇论文是朝着模拟神经形态计算人工智能方向迈出的重要一步。
以大脑为向导,神经形态芯片有望能降低人工智能等数据密集型计算任务的能耗。不幸的是,人工智能算法在这些芯片的模拟版本上表现不佳,这是由于设备不匹配问题造成的:在芯片上,模拟神经元内的微小组件由于制造工艺而在尺寸上不匹配。由于单个芯片不够复杂,无法运行最新的训练程序,因此必须先在计算机上对算法进行数字化训练。当算法转移到芯片上时,一旦遇到模拟硬件上的不匹配,它们的性能就会崩溃。上个月发表在《美国国家科学院院刊》上的一篇论文提出了一种绕过这个问题的方法。由 Friedrich Miescher 生物医学研究所的 Friedemann Zenke 和海德堡大学的 Johannes Schemmel 领导的一组研究人员表明,一种被称为尖峰神经网络的人工智能算法——它使用被称为尖峰的大脑独特的通信信号——可以与芯片配合学习如何补偿设备不匹配。这篇论文是朝着模拟神经形态计算人工智能方向迈出的重要一步。
Alphabet 旗下的 AI 子公司 DeepMind 训练强化学习算法控制托卡马克装置内的炙热等离子体。托卡马克是设计用于容纳核聚变反应的环形容器,其内部呈现出一种特殊的混乱状态。氢原子在不可思议的高温下相撞,产生比太阳表面还热的旋转翻滚的等离子体。找到控制并限制等离子体的智能方法将是释放核聚变潜力的关键,核聚变数十年来一直被认为是未来的清洁能源。目前聚变背后的科学原理已经明朗,剩下的只是工程方面的挑战。这正是 DeepMind 的用武之地。该公司此前将业务转向游戏和蛋白质折叠,它一直在与瑞士等离子中心(Swiss Plasma Center)进行一项联合研究项目,目标是开发一种用于控制核聚变反应的人工智能。在同样由聚变驱动的恒星中,纯粹的引力质量足以将氢原子拉到一起并克服它们的互斥电荷。在地球上,科学家改为使用强大的磁线圈约束核聚变反应,将其推到所需的位置,并像陶工在转盘上塑造粘土一样塑造它。必须仔细控制线圈以防止等离子体接触容器的侧面:这会损坏容器壁并减慢聚变反应。爆炸的风险很小,因为没有磁约束,聚变反应无法存在。但每次研究人员想改变等离子体的配置,尝试不同的形状以产生更多的能量或更清洁的等离子体时,都需要进行大量的工程和设计工作。洛桑联邦理工学院瑞士等离子中心主任 Ambrogio Fasoli 表示,传统的系统由计算机控制,基于模型和仔细的模拟,但是它们“很复杂,且不一定经过了优化”。DeepMind 开发了一种可自主控制等离子体的人工智能。发表在《自然》期刊上的一篇论文描述了两个小组的研究人员如何教授一个深度强化学习系统来控制 TCV 内的 19 个磁线圈,TCV 是瑞士等离子中心的可变配置托卡马克装置,用于进行未来更大聚变反应堆的设计研究。
人类多亏有对生拇指。但就算演化给了我们更多的拇指,情况也不会有太大的改善。每只手有一个拇指就足够了。神经网络不是这样,神经网络是执行类人任务的先进人工智能系统。随着它们变得更大,它们就能掌握更多。这会让旁观者大吃一惊。基本的数学结果表明,网络应该只需要这么大,但是现代神经网络的规模通常会远超出预测的需求——这种情况被称为过度参数化。在 12 月会议 NeurIPS 上发布的一篇论文中,微软研究院的 Sébastien Bubeck 和斯坦福大学的 Mark Sellke 为规模放大成功背后的奥秘提出了一种新的解释。他们表明,神经网络必须比传统预期的大得多,才能避免某些基本问题。这一发现为一个持续了几十年的问题提供了一般性的见解。对神经网络规模的标准预期来自对它们如何记忆数据的分析。但要了解记忆,我们必须首先了解网络的作用。神经网络的一项常见任务是识别图像中的对象。研究人员首先为其提供许多图像和对象标签,训练它学习两者之间的相关性。之后网络将正确识别它看过的图像中的对象。换句话说,训练使网络记住数据。更值得注意的是,一旦网络记住了足够多的训练数据,它就能以不同程度的准确度预测它从未见过的物体的标签。后一个过程被称为泛化。
索尼 AI 部门的研究人员使用深度强化学习,训练 AI 玩 GT赛车游戏,在正面比赛中击败了世界最顶尖的玩家。研究报告发表在《自然》 期刊上。赛车并不简单,除了控制速度外,还涉及到战术、战略甚至某种不明确的礼仪概念。实时控制具有复杂非线性动力学的汽车同时在前后左右车辆的毫厘之间进行操作是一项巨大的挑战。目前赛车游戏中最先进的 AI 方法来自于微软的 Forza Motorsport 系列,它始于微软研究院的一项神经网络项目,使用了人类玩家的数据训练 AI 车手。