solidot新版网站常见问题,请点击这里查看。
人工智能
wanwan(42055)
发表于2022年01月25日 21时23分 星期二
来自帽子里的天空
众所周知,阿尔兹海默症很难诊断。医生通常会综合运用认知测试、脑成像和行为观察进行诊断,这种做法昂贵且耗时。但如果自己在家中轻松采集的快速语音样本就能帮助识别阿尔兹海默症患者呢?名为 Canary Speech 的公司正在创造此类技术。其算法使用深度学习分析短语音样本,寻找阿尔兹海默症和其他疾病的迹象。深度学习提供商 Syntiant 最近宣布与 Canary Speech 合作,这将使 Canary 能通过医疗设备将主要用于医生办公室和医院的技术带入家中。虽然一些研究发现,使用语音和其他类型数据的深度学习技术在实验室环境中对患有阿尔兹海默症和其他疾病的人进行的分类非常准确,但现实世界中的结果可能会有所不同。尽管如此,人工智能和深度学习技术可能成为困难诊断的有用工具。

大多数人认为阿尔兹海默症——这种最常见的痴呆症会影响记忆力。但是研究表明,阿尔兹海默症即使是在疾病的早期阶段也会影响说话和语言,那时候大多数症状都还难以察觉。虽然人们通常无法察觉这些微妙的影响,但是用成千上万患有/未患有这种疾病的人的语音训练出来的深度学习模型或许能分辨差异。Canary Speech 的首席执行官兼联合创始人 Henry O'Connell 表示:“你感兴趣的是,中枢神经系统在通过语言创造向你传达什么信息?”“这就是 Canary Speech 所做的——我们分析这些数据集。”

O’Connell 表示,到目前为止,该算法一直是基于云端,但是 Canary 与 Syntiant 的合作让应用程序可以基于芯片,速度会更快,内存和存储容量也更大。新技术旨在集成到可穿戴设备中,在不到一秒的时间里分析 20 或 30 秒的语音样本,以分析阿尔兹海默症,并评估焦虑、抑郁甚至是一般能量水平。O’Connell 表示,在正确区分患有和未患有阿尔兹海默症的人的语音方面,Canary 系统的准确率约为 92.5%。一些研究表明,抑郁和焦虑等症状也会影响语言,O’Connell 表示 Canary 正在努力测试并提高算法的准确性,以检测此类状况。
人工智能
wanwan(42055)
发表于2022年01月24日 19时22分 星期一
来自地下航线
自动驾驶汽车需要做到很多事情才算得上成功,感知和理解其周遭的环境是其中最重要的。自动驾驶汽车必须跟踪和识别许多对象和目标,无论它们清晰可见还是隐藏,也无论天气是好是坏。今天的雷达还远不足以独立做好所有的工作——还需要摄像头和激光雷达。但是如果能充分利用雷达特殊的优势,我们也许至少可以省掉部分辅助传感器。传统摄像头的立体模式确实可检测到物体,能测量距离并估计速度,但是不具备完全自动驾驶所需的精度。此外摄像头在夜间、浓雾或阳光直射的条件下都无法正常工作,系统很容易被视错觉欺骗。激光扫描系统或激光雷达确实可以自行照明,因此在恶劣天气条件下往往会优于摄像头。尽管如此,它们只能在视线清晰的条件下看到前方,因此在有建筑物或其他障碍物遮挡的情况下,无法检测到正在接近十字路口的汽车。雷达在距离准确度和角度分辨率方面比不上激光雷达,角度分辨率指的是能够分辨出远处两个不同目标之间的最小夹角。但是我们设计出了一种新颖的雷达结构,克服了这个缺陷,使其在增强激光雷达和摄像头方面更加有效。
人工智能
wanwan(42055)
发表于2022年01月21日 19时16分 星期五
来自空气的颜色
伦勃朗的《夜巡》的高分辨率图像现在已上网。容量为 7170 亿像素,分辨率为 0.0005 毫米。阿姆斯特丹国立博物馆发布了一张由人工智能构建的、伦勃朗《夜巡》的超高分辨率图像。原作长近 15 英尺,高超过 12 英尺,自 1900 年代初以来一直在密集地进行修复。新数字图像实际上已根据历史记录重建了多年来被破坏的部分。
人工智能
wanwan(42055)
发表于2022年01月21日 16时33分 星期五
来自墨水心
优秀的扑克玩家都知道,他们需要在虚张声势和低调之间保持平衡。现在他们可以做到完美了

扑克导师 Jason Koon 是最早也是最忠实采用“博弈优化”的扑克玩家。在为期三天的 Super High Roller 锦标赛第二天,我在 Koon 价值数百万美元的房子里拜访了他,他的家位于一个更大的封闭社区内的封闭社区里,毗邻 Jack Nicklaus 设计的高尔夫球场。锦标赛第一天,Koon 支付了 25 万美元参赛,然后在四个小时被淘汰后又花了 25 万美元,他再次输掉了所有筹码。后来他给我发短信:“欢迎来到流鼻血锦标赛的世界,发挥你的最好水平——它很公平。”对于 Koon 来说,公平的形式是赢得超过 3000 万美元现场锦标赛奖金(他说,这至少和拉斯维加斯以及亚洲赌博圣地澳门的高额现金赌博的金额一样多。)Koon 从 2006 年开始认真打扑克,他当时是西弗吉尼亚卫斯理学院田径队短跑运动员,正处于一次受伤后的康复阶段。

他靠着打牌过上了不错的生活,但很难在赌注最高的比赛中稳定获胜。他表示:“我算是个很平庸的欲求解玩家,但是有了求解器,我就埋头其中,然后开始快速、快速、快速、快速地提高。”在一个装饰着他赢得的扑克锦标赛奖杯的家庭办公室里,Koon 求助于电脑,开始尝试 PioSOLVER。在指定了玩家筹码的大小以及按照他们在牌桌上的位置可能拿到的牌的范围之后,他看到了随机的头三张公用牌,两位玩家都可以看见这些牌。一个 13×13 的网格显示了玩家所有可能持有的牌。Koon 将鼠标悬停在方格上,寻找不同花色的 A 和 Q。 软件表明 Koon 应该在 39% 的情况下选择不下注,静观其变;在 51% 的情况下,选择下注底池的 30%;其余时间下注底池的70%。这种冯诺依曼式的混合策略将同时最大化他的利润并掩饰他的牌力。多亏了 PioSOLVER 等工具,Koon 重新制定了游戏打法,明白在不同情况下哪种下注尺度最有效。有时小规模下注(底池的五分之一或者甚至是十分之一)是理想的;另一些时候,以底池两倍或三倍的巨额下注是正确的。虽然优秀的扑克玩家一直都知道他们需要在虚张声势和低调之间保持平衡,但软件定义了 Koon 应该采用一种或另一种策略的精确频率,根据打出的牌确定吓唬用的最好和最差的牌,给出的建议有时候令人惊讶。
人工智能
wanwan(42055)
发表于2022年01月20日 18时10分 星期四
来自火星众神
一百多年来,Polar Manufacturing 一直在芝加哥南部生产金属铰链、锁具和支架。公司的部分金属冲压机——让工人头疼的一种笨重、巨大的机器——可以追溯到 1950 年代。去年为在人工短缺的情况下满足不断增长的需求,Polar 雇佣了第一位机器人员工。机械臂执行一项简单的重复性工作:将一块金属放到冲压机里,后者随后将其弯曲成新的形状。和人一样,机器工人按照工作时间获得报酬。管理 Polar 生产线的 Jose Figueroa 表示,从名为 Formic 的公司租来的机器人的成本相当于每小时 8 美元,而人类员工的最低工资为每小时 15 美元。Figueroa 表示,部署机器人可以让人类工人去做不同的工作以增加产量。Figueroa 表示:“较小的公司有时候会因为无力为新技术投入资金而处境艰难。”“我们只是想努力地应对最低工资的提升。”
人工智能
1
WinterIsComing(31822)
发表于2022年01月20日 14时59分 星期四
来自荷鲁斯崛起
观看外国影视剧通常会用到字幕,一则可能是没有当地配音版本,或者配音版本没有达到原版的满意程度。要让原版的演员说不同地方的语言是不可能的事情。如今 AI 技术的进步有望让不可能变成现实:AI 通过训练能使用原版语音合成出逼真的新语音。新语音不再是另一个人的声音,而是演员本人比如汤姆克鲁斯说着另一种语言。这一技术也引发了音频深度伪造的担忧。AI 公司 Veritone 透露了它开发的名为 MARVEL.ai 的产品,允许内容制作者生成超现实的合成声音。
人工智能
wanwan(42055)
发表于2022年01月18日 17时55分 星期二
来自失忆者
一家人围在家中厨房的中岛周围,为刚买来的数字助理拆箱。MIT 媒体研究室的研究人员进行了一项研究,结果显示如果这种新的语音用户界面——可能是亚马逊的 Alexa 或者 Jibo 之类的社交机器人——表现出一些类似于人的社交行为,他们就更有可能信任它。研究人员发现,如果设备能表现出社交线索,例如将目光转向说话的人,家庭成员往往会认为设备更有能力并且更具情感吸引力。研究表明,品牌——特别是制造商的名称是否与设备相关——对家庭成员对不同的语音用户界面的感知并与之交互的方式具有重大影响。研究人员发现,当设备具有更高水平的社交体现时,例如通过动作或表情提供语言和非语言社交暗示的能力,家庭成员也会更频繁地在设备加入的群体中彼此互动。他们的结果可以帮助设计人员创建更具吸引力且更有可能被家庭成员使用的语音用户界面,同时还可以提高这些设备的透明度。研究人员还阐述了某些个性和体现设计可能带来的伦理问题。
人工智能
1
wanwan(42055)
发表于2022年01月07日 16时54分 星期五
来自通往宇宙之门
1970 年图灵奖(计算机界的诺贝尔奖)得主 Marvin Minsky 预测,“三到八年内我们将拥有具备相当于普通人类水平的通用智能机器。”52 年过去了,我们仍在等待着这种机器的出现。根本障碍在于,尽管计算机算法确实非常善于识别统计模式,但它们不知道这些模式意味着什么,因为它们局限于数学世界(MathWorld)中,从未体验过现实世界。Google 在西雅图的 AI 团队负责人 Blaise Aguera y Arcas 最近表示,大型语言模型(LLM)可能是由统计学驱动的,“统计等同于理解。”他提到了几个与 Google 最先进的聊天机器人 LaMDA 的对话片段作为证据。这些对话令人印象深刻,非常像人类的口吻,但是它们不过是 Gary Marcus 和 Ernest Davis 所说的 LLM 有能力成为“流利的废话喷井”,或者是 Timnit Gebru 和三位合著者所说的“随机鹦鹉”的例子。
人工智能
wanwan(42055)
发表于2022年01月05日 20时41分 星期三
来自雾影1:雾影边境
好莱坞刻画的人工智能(AI)噩梦就像一部科幻大片描绘的那样:机器人获得了类人的智能,获得了知觉,不可避免地成为企图毁灭人类的邪恶霸主。这种叙述利用了我们对技术与生俱来的恐惧,反映了通常伴随新技术发展的深刻变化。然而正如机器学习工程师、2019 年出版的小说《The Quantum Price》的作者 Malcolm Murdock 所说,“人工智能不必有知觉就能杀死我们所有人。在有知觉的 AI 成为问题之前,还有很多其他场景会消灭我们。”在对 AI 专家的采访中,IEEE Spectrum 列举了 AI 在现实世界中六种最坏的情况,它们比电影描述的要平凡得多。但是它们同样是反乌托邦的。而且大多数情况并不需要恶毒的独裁者。相反它们可能会自然而然地发生,有机地展开——也就是说,如果没有采取任何措施阻止它们的话。为了防止这些最坏的情况发生,我们必须放弃我们对 AI 的流行文化观念,认真对待它带来的意外后果。

1.当虚构定义了现实,深度伪造之类的技术会导致现实的后果。2.逐底竞争的危险性,AI 技术发展过程中需要注重安全而不是一味追求速度。3.隐私和自由意志的终结,乔治城大学的 Andrew Lohn 指出,“随着数据监视和跟踪的兴起,我们正在进入危险和未知的领域,我们对其潜在的影响几乎一无所知。” 4.人类身处算法创造的斯金纳箱(Skinner Box),社交媒体用户已经成为实验室里的小鼠。5.AI 设计的暴政,现有 AI 系统有着自身的局限性和偏见,它可能会限制人类而不是解放人类。6.过度监管 AI 会限制它给人类带来的好处。
人工智能
WinterIsComing(31822)
发表于2022年01月04日 17时58分 星期二
来自蒸汽歌剧
最新接受人工智能重建处理的画作是古斯塔夫.克里姆特(Gustav Klimt)在 1900 年创作的《哲学》。 几十年来,《哲学》都以黑白相片的形式存在。现在多亏了人工智能,我们可以看到这幅画作的彩色版本。但是重建的作品真的和原作一样吗?它看起来像 Klimt 的风格吗?如果你熟悉《》或者《阿德勒.布罗赫-鲍尔像一》等作品,会发现这幅由 Google Arts and Culture 用机器学习创建的新画作展现了非常不同的 Klimt。 纽约 St. Etienne 画廊曾为 Klimt 在美国首次举办画展,画廊主管 Jane Kallir 表示:“关于这些画作到底应该是什么样子,我不比Google 了解得更多,但是我不认为看起来是这样。”“看起来像卡通。不像 Klimt 的作品。” “就像有人试图克隆狗。你可以做到,但是它并不是同一条狗。”

这是最近一些用人工智能重建失传艺术品的尝试中的一个。阿姆斯特丹国立博物馆使用人工智能重建伦勃朗著名画作《夜巡》丢失的部分,在夏天将它们暂时安放在真实画作的旁边。英国的一对自称为 Oxia Palus 的研究人员表示,他们使用 3D 打印和人工智能重建毕加索隐藏在《盲人的晚餐》下面的裸体画像。10 月德国波恩的一个管弦乐队完整地“演奏”了贝多芬未完成的第十交响曲。这个版本是由算法完成的。Oxia Palus 的联合创始人 George Cann 认为,人工智能“可以提供一个从未真正拥有过的、替代艺术的平行世界。” 这是一个诱人的想法。窥看毕加索画作下方隐藏的早期画作就像是在窥看艺术家的思想,偷听一个世纪前的想法。看到因灾难失传的画作起死回生就像是穿越时光,逆转命运。但是如果在这个重新创建失传艺术品世界中的任何一件作品,例如《哲学》,是不准确的,那么 AI 创造者不是在复活历史,而是在无意中改写历史。Kallir 觉得,这幅她称之为“花里胡哨”的作品和 Klimt 几乎没有关系,她表示这些画作应该更加柔和,从一种颜色到另一种颜色的过渡也应该更平滑。她表示:“如果你眼光还不错的话,你看看黑白复制品,再将它们与大约同时期完成的其他画作进行比较,你可能更好地了解真实面貌。”
人工智能
wanwan(42055)
发表于2021年12月31日 17时35分 星期五
来自快乐基因
过去 20 年,深度学习透过一系列商业应用逐渐主导了人工智能研究和应用。但令人眼花缭乱的背后存在一些根深蒂固的问题,威胁着这种技术的腾飞。 举例来说,典型的深度学习程序在多任务上表现欠佳,该技术被限制在严格控制环境中的特定任务的应用。更严重的是,深度学习被认为是不可信的,因为它无法解释——而且不适用于某些应用,因为它会经历灾难性的遗忘。说得更通俗一点,如果算法有效,无法理解它为什么有效。当该工具慢慢学习新数据库时,其学习记忆的任意部分可能会突然崩塌。因此在任何攸关生死的应用(例如医疗应用)上使用深度学习都可能存在风险。

在一本新书中,IEEE 研究员 Stephen Grossberg 认为需要一种完全不同的方法。Grossberg根据自己几十年来对认知和神经的研究,在《Conscious Mind, Resonant Brain: How Each Brain Make a Mind》一书中描述了一种生物和人工智能的替代模型。他将模型称为自适应共振理论(ART)。 Grossberg 是波士顿大学认知和神经系统、数学和统计、心理和脑科学以及生物医学工程领域的讲席教授,他在其大脑如何处理信息的理论基础上构建了 ART。 他表示:“在充满了意外事件的、不断变化的世界中,我们的大脑学会了识别并预测对象和事件。” 对于这种不断的变化,ART 使用有监督和无监督的学习方法解决模式识别和预测问题。一些大规模的应用已在使用该理论的算法,例如对声纳和雷达信号进行分类、检测睡眠呼吸暂停、推荐电影以及基于计算机视觉的驾驶辅助软件等。Grossberg 表示,可以放心使用 ART,因为它是可解释的,并且不会经历灾难性的遗忘。他表示,ART 解决了他所谓的稳定性-可塑性悖论:大脑或其他学习系统如何才能在不经历灾难性遗忘(稳定性)的情况下快速自主学习(可塑性)。
人工智能
WinterIsComing(31822)
发表于2021年12月30日 15时31分 星期四
来自为了我们的家园
中国本月中旬向联合国递交了《关于规范人工智能军事应用的立场文件》,阐述了中国在 AI 武器应用方面的立场,呼吁“各国在发展人工智能武器系统方面应保持克制,人工智能的军事应用不应成为发动战争和谋求霸权的工具,反对利用人工智能技术谋求绝对军事优势”,“增强人工智能安全评估和管控能力,确保人工智能武器永远处于人类控制之下”,“对人工智能军事应用加强监管,降低扩散风险”等。
人工智能
wanwan(42055)
发表于2021年12月29日 18时19分 星期三
来自森林送信人
2020 年 6 月,旧金山独立人工智能研究实验室 OpenAI 发布了 GPT-3——第三代海量生成式预训练语言转换模型,它可写出从计算机代码到诗歌在内的一切内容。一年后清华大学北京智源人工智能研究院低调发布了一个更大的模型,即悟道2.0,参数数量增加 10 倍——参数是编码信息的神经网络值。GPT-3 号称拥有 1750 亿个参数,而悟道2.0 的创造者声称它拥有高达 1.75 万亿个参数。而且该模型不仅能像 GPT-3 那样生成文本,还能和 OpenAI 的 120 亿参数的 DALL-E模型一样根据文本描述生成图像,具有与 Google 的 1.6 万亿参数的 Switch Transformer 模型类似的缩放策略。

负责悟道项目的清华大学教授唐杰最近在接受采访时表示,该团队在 6 月份构建了一个更大的、100 万亿参数的模型,不过它还没被训练至“收敛”,即模型停止提升的点。唐教授表示:“我们只是想证明我们有能力做到这一点。”这不是简单的一较高下。一方面,这是研究进步的方式。但另一方面,它标志着两大科技超级大国之间的竞争日趋激烈。无论研究人员喜欢与否,他们的政府都渴望将人工智能的每一项进步应用到国家安全基础设施和军事能力之中。这很重要,因为技术的主导地位意味着在任何未来的战争中都有可能取得胜利。更重要的是,拥有这种优势的政府可能会在长期执政和全球影响力方面得到保障。具有讽刺意味的是,中国是美国自己培养出来的竞争对手。众所周知,美国的消费市场为中国的出口引擎提供了动力,中国配备了美国的机器,成为自 1980 年代以来世界上增长最快的经济体。
人工智能
wanwan(42055)
发表于2021年12月29日 15时52分 星期三
来自小无知游太阳城
亚马逊语音助手 Alexa 在“挑战”一名 10 岁女孩时,让她拿着硬币贴在通电的插脚上(插头的插脚一半插入插座,一半裸露在外),亚马逊随后更新了 Alexa 语音助手。 该建议是这名女孩在要求 Alexa 提出“挑战(challenge to do)”之后提出的。智能音箱说:“将手机充电器的插脚一半插入墙上的插座,拿着一分钱的硬币贴在另一半暴露出的插脚上。”亚马逊表示在发现错误之后,立即进行了修复。女孩的母亲 Kristin Livdahl 在 Twitter 上描述了这一事件。她说:“我们正在做一些身体上的挑战,例如躺下来,保持一只鞋在你的脚上,然后翻来翻去。之前我们是跟着 YouTube 上的一位(体育教学)老师做。外面的天气不好。她就想换一个老师。这时 Echo 音箱建议参与这个它‘在网上找到’的挑战。”这项被称为“便士挑战”的危险活动大约从一年前开始在 TikTok 和其他社交媒体网站上流行。
人工智能
1
WinterIsComing(31822)
发表于2021年12月27日 15时27分 星期一
来自寻衅滋事
中国研究人员开发出 AI 检察官,能根据对案件的口述以 97% 的准确率提出指控。上海浦东人民检察院构建和测试了 AI 检察官系统,它是全国最大最忙碌的地区检察院。中国科学院大数据挖掘与知识管理重点实验室主任石勇教授是该项目的首席科学家,他表示 AI 系统能减少检察官的日常工作量,让他们能专注于更困难的工作。在一定程度上系统可在决策中取代检察官。石勇和同事的论文发表在本月出版的《管理评论》期刊上(最新几期的论文尚未上线)。
人工智能
wanwan(42055)
发表于2021年12月21日 17时59分 星期二
来自龙岛
对大多数动物而言,生活就是决定去哪里。在世界中奔跑、游泳或飞翔,动物不断地做出行动的决定,选择去哪里进食、在哪里躲避以及和谁交往。神经生物学在过去几十年里的突破,包括获得 2014 年诺贝尔医学奖的突破已经拼凑出动物表示空间分布选择的图景。现在一个国际研究团队应用这些神经生物学知识了解动物如何从分散在空间中的选项中进行选择。从神经生物学、物理学和动物行为中汲取灵感,这个跨学科的团队构建了一个大脑决策的计算模型。该模型具有大脑表示“空间”选项的特征——在这种情况下是指向潜在目的地的方向——以了解如何在移动中做出决策。由此产生的模型预测,大脑会自发地将多个选项之间的决策分解为一系列二选一的决策,直到只剩下一个选项——也就是最终选择。这会导致动物表现出一系列突然的方向变化,每一次都与排除了一个剩余的选项有关。每一次的方向变化都是神经动力学突然变化的结果——科学家称之为“分叉”,动物和剩余选项之间存在非常特定的几何关系。这种算法被发现非常强大,以至于研究人员预测,这种“分叉”过程不仅会带来高度准确的决策,而且还可能是“通用的。”通过将很多动物模拟轨迹叠加在一起,他们发现了一个分支结构。他们预测,如果将真实动物空间决策留下的很多轨迹叠加在一起,这种结构也应该很明显。
人工智能
wanwan(42055)
发表于2021年12月17日 18时02分 星期五
来自暗影徘徊
想象一下你正在参加一场比赛。要完成它,你的身体要强壮,你的大脑要跟踪路线,控制你的步伐,防止你绊倒。对机器人也是如此。为了完成任务,它们需要精心设计的身体和“大脑”或控制器。工程师使用各种模拟改进机器人的控制并使其智能。但很少有方法可以同时优化机器人的设计。除非设计者是算法

由于计算技术的进步,终于可以编写出同时优化设计和控制的软件程序,这种方法被称为协同设计。尽管有优化控制或设计的平台,但大多数协同设计研究人员还是不得不设计自己的测试平台,这些平台通常计算量巨大且很耗时。

为了解决这个问题,MIT 研究员 Jagdeep Bhatia 等人创建了名为 Evolution Gym 的 2D 协同设计软机器人模拟系统。他们在今年的神经信息处理系统会议上展示了这个系统。他们还在一篇新论文中详细介绍了该系统。

在 Evolution Gym 中,用彩色细胞或体素组成 2D 软机器人。不同的颜色代表了不同类型的简单组件——软材料或刚性材料,以及水平或垂直致动器。由彩色方块拼凑而成的机器人在类似电子游戏的环境中移动。因为它是 2D 的,程序设计很简单,不需要太多计算能力。

顾名思义,研究人员构建了该系统以模拟生物的演化过程。它不生成单个机器人,而是生成在设计上略有差异的机器人群体。该系统具有双层优化系统——外环和内环。外环是设计优化:系统针对给定任务(例如步行、跳跃、攀爬或捕捉东西)生成许多不同的设计。内环是控制优化。
人工智能
wanwan(42055)
发表于2021年12月17日 17时54分 星期五
来自凡尔纳地球三部曲
人类非常擅长根据 2D 图像理解它描绘的 3D 场景。人工智能代理则不然。然而需要与物理物体进行交互的机器——比如收割庄稼或者协助手术的机器人——必须能从它对 2D 训练图像的观察中推断出 3D 场景的特性。虽然科学家成功使用神经网络根据图像推断出 3D 场景的模型,但这种机器学习方法速度不够快,无法适用于很多现实世界的应用。MIT 等机构的研究人员展示的一项新技术能以比某些现有模型快 15,000 倍的速度从图像中展现 3D 场景。该方法将场景表示为一个 360 度的光场,一个函数描述了 3D 空间中流经每个点和每个方向的所有光线。光场被编码到一个神经网络中,可更快地从图像中渲染底层 3D 场景。
人工智能
wanwan(42055)
发表于2021年12月17日 17时27分 星期五
来自为了我们的家园
梅赛德斯奔驰成为首家满足 UN-R157 对 L3 自动驾驶系统法律要求的汽车公司。德国联邦汽车运输管理局 (KBA) 已批准了梅赛德斯的系统,为其国际推广铺平了道路——如果国家法律允许的话。德国在 2017 年制定了针对 L3 系统的道路交通法(StVG),成为自动驾驶立法方面的先锋。客户到 2022 年上半年将可购买配备Mercedes Drive Pilot 的 S级轿车,在交通拥堵或拥塞的情况下,在德国的适用高速公路路段上,有条件地使用自动驾驶模式以最高 60 公里/小时的速度行驶。戴姆勒和梅赛德斯-奔驰理事会成员、负责开发和采购的首席技术官 Markus Schäfer 表示:“我们多年来一直在努力实现自动驾驶愿景。通过这个基于激光雷达的系统,我们为车辆开发了一项创新技术,为客户提供独特、豪华的驾驶体验,并为他们提供最重要的东西:时间。经过当局的批准,我们现在取得了突破:我们是德国第一家将有条件自动驾驶投入量产的制造商。”尽管 Elon Musk 不断声称“完全自动驾驶”,特斯拉的系统仍然是 SAE L2,需要驾驶员监督(尽管有许多记录在案的案例没有这样做)。SAE 级别和 UN-R157 规范之间存在着一些差异。
人工智能
1
wanwan(42055)
发表于2021年12月17日 15时52分 星期五
来自哈尔的移动城堡
还记得 IBM Watson,“危机边缘(Jeopardy)”节目的 AI 冠军? 2010 年的一项宣传活动称:“Watson 理解具有各种歧义和复杂性的自然语言。”然而正如我们在 Watson 随后在试图“用人工智能彻底改变医学”惨败时看到的,浮于表面的语言能力实际上并不同于真正理解人类语言。

自然语言理解一直是人工智能研究的主要目标。起初研究人员试图手工编程机器理解新闻故事、小说或人类可能写出的任何其他内容所需的一切。正如 Watson 所展示的,这种做法是徒劳的——不可能写下理解文本需要的所有不成文的事实、规则和假设。最近确立的一种新范式是:我们不建立显性知识,而是让机器简单地摄取大量书面文本并学习预测单词,自己学习理解语言。结果就是研究人员所说的语言模型。使用 OpenAI 的 GPT-3 之类的大型神经网络,这类模型可以生成非常像是出自人类之手的散文和诗歌,并且似乎可进行复杂的语言推理。

但是用来自数千个网站、书籍和百科全书的文本进行训练的 GPT-3 是否超越了 Watson 浮于表面的理解能力?它真的理解自己生成的语言并进行推理吗?AI 研究界在这个问题上分歧明显。此类讨论曾是哲学家的领地,但过去十年,人工智能已从学术泡沫中迸发进入现实世界,它对现实世界缺乏了解可能会产生真实的、有时甚至是毁灭性的后果。在一项研究中,研究人员发现 IBM Watson 提出了“多项不安全和不正确的治疗建议”。另一项研究表明,Google 的机器翻译系统在为非英语患者翻译医疗说明时出现了重大错误。

我们在实践中如何才能确定机器是否能理解?1950 年,计算机先驱图灵(Alan Turing)试图用他著名的“模仿游戏”回答这个问题,模仿游戏现在被称为图灵测试。一台机器和一个人都隐藏在视线之外,两者彼此竞争,努力仅仅通过对话让人类裁判相信他/它是人。如果裁判无法判断两者中哪个是人类,那么图灵断言,我们应该认为机器是在思考——实际上,是在理解。不幸的是,图灵低估了人类被机器愚弄的倾向。