solidot新版网站常见问题,请点击这里查看。
adv
人工智能
WinterIsComing(31822)
发表于2022年02月23日 14时16分 星期三
来自记忆残留
美国版权局拒绝了授予 AI 创作作品版权的请求。三人委员会审查了 2019 年对 Steven Thaler 的裁决,他试图为名为 Creativity Machine 的算法所创作的一幅作品申请版权。委员会指出 AI 创作的作品不包含人类著作权的元素——这是版权保护的必要标准。这幅 AI 创作的作品取名为 A Recent Entrance to Paradis,是模拟濒死体验系列作品的一部分。AI 对图像进行重新处理创造出幻觉图像和对来世的虚拟描述。人类思维和创意表达之间的联系是版权保护的重要因素,虽然版权法律没有直接涉及到非人类作品的规定,但过去几年法庭对动物作品或神灵作品的版权保护是持反对立场的。
人工智能
wanwan(42055)
发表于2022年02月21日 14时56分 星期一
来自挽救计划
发表在 PNAS 期刊上的一项研究调查了深度伪造(deep fakes)的有效性,发现人类真的很容易迷上机器生成的面孔——甚至会认为它们比真实的面孔更值得信赖。研究合作者、加州伯克利分校教授 Hany Farid 表示:“我们发现,合成面孔不仅高度逼真,而且显得比真实的面孔更值得信赖。”这一结果引发了担忧,“这些面孔在用于邪恶目的时候可能会非常有效。”第一组在区分真假人脸方面的表现不比抛硬币决定更好,平均准确率为 48.2%……该组给合成人脸的可信度评分平均为 4.82,略高于给真实人脸的可信度评分 4.48。研究参与者确实压倒性地识别出了一些假脸。研究合作者 Sophie Nightingale 表示:“我们并不是说每张生成的图像都和真的人脸没有区别,但是里面有不少图像确实如此。”研究作者强调,深度伪造的欺骗性应用将继续构成威胁,他们得出了一个明确的结论:“我们鼓励开发这些技术的人思考相关的风险是否大于收益。”“如果是这样,我们不鼓励开发此类技术。”
人工智能
wanwan(42055)
发表于2022年02月18日 15时57分 星期五
来自人猿泰山之绝地反击
今天最成功的 AI 算法——人工神经网络大致是基于大脑复杂的真实神经网络。但和我们高效的大脑不同,在计算机上运行 AI 算法消耗的能量惊人:最大的模型在其生命期中消耗的能量几乎相当于五辆汽车。 更接近大脑设计原理和物理特性的神经形态计算可能会是节能 AI 的未来。神经形态设计不让数据在中央处理单元和内存芯片之间长途跋涉,而是模仿人类大脑中的果冻状物质的结构,计算单元(神经)被安放在内存旁边(存储在连接神经元的突触中)。为了让它们更像大脑,研究人员将神经形态芯片与模拟计算相结合,模拟计算可以处理连续的信号,就像真正的神经元一样。由此产生的芯片与当前依赖于 0 和 1 二进制信号处理的纯数字计算机的架构和计算模式有很大不同。

以大脑为向导,神经形态芯片有望能降低人工智能等数据密集型计算任务的能耗。不幸的是,人工智能算法在这些芯片的模拟版本上表现不佳,这是由于设备不匹配问题造成的:在芯片上,模拟神经元内的微小组件由于制造工艺而在尺寸上不匹配。由于单个芯片不够复杂,无法运行最新的训练程序,因此必须先在计算机上对算法进行数字化训练。当算法转移到芯片上时,一旦遇到模拟硬件上的不匹配,它们的性能就会崩溃。上个月发表在《美国国家科学院院刊》上的一篇论文提出了一种绕过这个问题的方法。由 Friedrich Miescher 生物医学研究所的 Friedemann Zenke 和海德堡大学的 Johannes Schemmel 领导的一组研究人员表明,一种被称为尖峰神经网络的人工智能算法——它使用被称为尖峰的大脑独特的通信信号——可以与芯片配合学习如何补偿设备不匹配。这篇论文是朝着模拟神经形态计算人工智能方向迈出的重要一步
人工智能
wanwan(42055)
发表于2022年02月17日 16时02分 星期四
来自神秘博士:闪光的人
Alphabet 旗下的 AI 子公司 DeepMind 训练强化学习算法控制托卡马克装置内的炙热等离子体。托卡马克是设计用于容纳核聚变反应的环形容器,其内部呈现出一种特殊的混乱状态。氢原子在不可思议的高温下相撞,产生比太阳表面还热的旋转翻滚的等离子体。找到控制并限制等离子体的智能方法将是释放核聚变潜力的关键,核聚变数十年来一直被认为是未来的清洁能源。目前聚变背后的科学原理已经明朗,剩下的只是工程方面的挑战。这正是 DeepMind 的用武之地。该公司此前将业务转向游戏和蛋白质折叠,它一直在与瑞士等离子中心(Swiss Plasma Center)进行一项联合研究项目,目标是开发一种用于控制核聚变反应的人工智能。在同样由聚变驱动的恒星中,纯粹的引力质量足以将氢原子拉到一起并克服它们的互斥电荷。在地球上,科学家改为使用强大的磁线圈约束核聚变反应,将其推到所需的位置,并像陶工在转盘上塑造粘土一样塑造它。必须仔细控制线圈以防止等离子体接触容器的侧面:这会损坏容器壁并减慢聚变反应。爆炸的风险很小,因为没有磁约束,聚变反应无法存在。但每次研究人员想改变等离子体的配置,尝试不同的形状以产生更多的能量或更清洁的等离子体时,都需要进行大量的工程和设计工作。洛桑联邦理工学院瑞士等离子中心主任 Ambrogio Fasoli 表示,传统的系统由计算机控制,基于模型和仔细的模拟,但是它们“很复杂,且不一定经过了优化”。DeepMind 开发了一种可自主控制等离子体的人工智能。发表在《自然》期刊上的一篇论文描述了两个小组的研究人员如何教授一个深度强化学习系统来控制 TCV 内的 19 个磁线圈,TCV 是瑞士等离子中心的可变配置托卡马克装置,用于进行未来更大聚变反应堆的设计研究。
人工智能
wanwan(42055)
发表于2022年02月11日 17时35分 星期五
来自阿尔法计划
人类多亏有对生拇指。但就算演化给了我们更多的拇指,情况也不会有太大的改善。每只手有一个拇指就足够了。神经网络不是这样,神经网络是执行类人任务的先进人工智能系统。随着它们变得更大,它们就能掌握更多。这会让旁观者大吃一惊。基本的数学结果表明,网络应该只需要这么大,但是现代神经网络的规模通常会远超出预测的需求——这种情况被称为过度参数化。在 12 月会议 NeurIPS 上发布的一篇论文中,微软研究院的 Sébastien Bubeck 和斯坦福大学的 Mark Sellke 为规模放大成功背后的奥秘提出了一种新的解释。他们表明,神经网络必须比传统预期的大得多,才能避免某些基本问题。这一发现为一个持续了几十年的问题提供了一般性的见解。对神经网络规模的标准预期来自对它们如何记忆数据的分析。但要了解记忆,我们必须首先了解网络的作用。神经网络的一项常见任务是识别图像中的对象。研究人员首先为其提供许多图像和对象标签,训练它学习两者之间的相关性。之后网络将正确识别它看过的图像中的对象。换句话说,训练使网络记住数据。更值得注意的是,一旦网络记住了足够多的训练数据,它就能以不同程度的准确度预测它从未见过的物体的标签。后一个过程被称为泛化。
人工智能
WinterIsComing(31822)
发表于2022年02月10日 23时34分 星期四
来自泰坦棋手
索尼 AI 部门的研究人员使用深度强化学习,训练 AI 玩 GT赛车游戏,在正面比赛中击败了世界最顶尖的玩家研究报告发表在《自然》 期刊上。赛车并不简单,除了控制速度外,还涉及到战术、战略甚至某种不明确的礼仪概念。实时控制具有复杂非线性动力学的汽车同时在前后左右车辆的毫厘之间进行操作是一项巨大的挑战。目前赛车游戏中最先进的 AI 方法来自于微软的 Forza Motorsport 系列,它始于微软研究院的一项神经网络项目,使用了人类玩家的数据训练 AI 车手。
人工智能
wanwan(42055)
发表于2022年02月08日 17时59分 星期二
来自沙皇的邮件
2018 年美国主要超算集群运算周期的第三大用途是气候模拟。夸克等亚原子粒子的研究排在第二位。位居榜首的是物理学中被引用最多的理论——尽管很少有人听说过它。它就是密度泛函理论(DFT),是物理学家和化学家用以理解任何比氢原子更复杂的事物的主要方法。几十年来,研究人员使用 DFT 的能力预测各种事物——从咖啡的味道到木星核心的密实度。DFT 为科学家提供了一种强大的捷径,可以预测电子的去向,进而预测原子、分子和其他“披着”电子的物体将如何作用。长期以来,物理学家和化学家一直在用深厚的物理学专业知识让方程式能更好地反映所有电子共有的复杂舞蹈。但是最近,神经网络设计的新工具可以与手工制作的“前辈”相媲美,并且在某些方面青出于蓝。一些研究人员现在认为,机器学习可以帮助研究人员以更快、更大的步伐迈向主电子方程,从而解开新药、超导和奇异材料的奥秘。
人工智能
WinterIsComing(31822)
发表于2022年02月07日 21时09分 星期一
来自棕榈上的霜
至少在部分问题上 AI 程序员能与真正的程序员竞争了。Alphabet 旗下 AI 子公司 DeepMind 宣布了 AI 代码生成系统 AlphaCode(PDF),声称测试显示其水平在编程竞赛中已经具备了竞争力。计算机科学家 Scott Aaronson 也为 AI 在编程方面的进步惊叹不已。DeepMind 称,AlphaCode 使用了基于 transformer 的语言模型去生成代码,然后筛选出其中一部分有前景的程序。它使用了数万编程竞赛题和题目的数百万解进行训练,对每一项编程挑战它会生成一百万候选程序,通过检查示例数据丢弃掉大部分候选程序。编程竞赛平台 Codeforces 上的测试显示,AlphaCode 在三分之一的问题中达到了中等人类程序员的水平。标志着 AI 代码生成系统首次在编程竞赛中具有了竞争力。
人工智能
wanwan(42055)
发表于2022年01月26日 20时29分 星期三
来自你在天堂里遇见的下一个人
人工智能很大程度上是数字游戏。10 年前深度神经网络开始超越传统算法,这是因为我们终于拥有了足够的数据和处理能力。深度神经网络是一种学习识别数据模式的人工智能形式。今天的神经网络愈加渴望数据和算力。网络的参数有数百万甚至是数十亿个,参数代表了人工神经元之间连接的强度,训练神经网络需要对其仔细调整。目标是寻找到近于理想的值,该过程被称为优化,但是训练网络达到这一点并不容易。伦敦 DeepMind 的研究科学家 Petar Veličković 表示:“训练可能需要几天、几周甚至是几个月的时间。”

这种情况也许很快会改变。安大略省圭尔夫大学的 Boris Knyazev 和同事设计并训练了一个“超网络(hypernetwork)”——一种其他神经网络的霸主——可以加快训练的过程。对于一个为了某项任务设计的、未经训练的新神经网络,超网络可以在几分之一秒内预测出它的参数,从理论上让训练变得不再有必要。由于超网络学习了深度神经网络设计中极其复杂的模式,因此这项工作也可能具有更深层次的理论意义。

现阶段超网络在某些环境中的表现好得出人意料,但仍然有改善的空间——考虑到问题的量级,这是很自然的。Veličković 表示,如果他们能解决这个问题,“将对机器学习产生全方位的影响。”

目前训练和优化神经网络的最好方法是随机梯度下降法(SGD)技术的变体。训练涉及最小化网络在给定任务(例如图像识别)中所犯的错误。SGD 算法通过大量标记数据调整网络参数并减少错误或损失。梯度下降是从损失函数的高值下降到某个最小值的迭代过程,代表了足够好的(有时甚至是最好的)参数值。

但是这种技术只有在你有一个网络需要优化的时候才有效。为了构建最初的神经网络——通常由从输入到输出之间的多层人工神经元组成,工程师必须依靠直觉和经验法则。这些架构在神经元的层数,每层的神经元数量等方面会有所不同。
人工智能
wanwan(42055)
发表于2022年01月25日 21时23分 星期二
来自帽子里的天空
众所周知,阿尔兹海默症很难诊断。医生通常会综合运用认知测试、脑成像和行为观察进行诊断,这种做法昂贵且耗时。但如果自己在家中轻松采集的快速语音样本就能帮助识别阿尔兹海默症患者呢?名为 Canary Speech 的公司正在创造此类技术。其算法使用深度学习分析短语音样本,寻找阿尔兹海默症和其他疾病的迹象。深度学习提供商 Syntiant 最近宣布与 Canary Speech 合作,这将使 Canary 能通过医疗设备将主要用于医生办公室和医院的技术带入家中。虽然一些研究发现,使用语音和其他类型数据的深度学习技术在实验室环境中对患有阿尔兹海默症和其他疾病的人进行的分类非常准确,但现实世界中的结果可能会有所不同。尽管如此,人工智能和深度学习技术可能成为困难诊断的有用工具。

大多数人认为阿尔兹海默症——这种最常见的痴呆症会影响记忆力。但是研究表明,阿尔兹海默症即使是在疾病的早期阶段也会影响说话和语言,那时候大多数症状都还难以察觉。虽然人们通常无法察觉这些微妙的影响,但是用成千上万患有/未患有这种疾病的人的语音训练出来的深度学习模型或许能分辨差异。Canary Speech 的首席执行官兼联合创始人 Henry O'Connell 表示:“你感兴趣的是,中枢神经系统在通过语言创造向你传达什么信息?”“这就是 Canary Speech 所做的——我们分析这些数据集。”

O’Connell 表示,到目前为止,该算法一直是基于云端,但是 Canary 与 Syntiant 的合作让应用程序可以基于芯片,速度会更快,内存和存储容量也更大。新技术旨在集成到可穿戴设备中,在不到一秒的时间里分析 20 或 30 秒的语音样本,以分析阿尔兹海默症,并评估焦虑、抑郁甚至是一般能量水平。O’Connell 表示,在正确区分患有和未患有阿尔兹海默症的人的语音方面,Canary 系统的准确率约为 92.5%。一些研究表明,抑郁和焦虑等症状也会影响语言,O’Connell 表示 Canary 正在努力测试并提高算法的准确性,以检测此类状况。
人工智能
wanwan(42055)
发表于2022年01月24日 19时22分 星期一
来自地下航线
自动驾驶汽车需要做到很多事情才算得上成功,感知和理解其周遭的环境是其中最重要的。自动驾驶汽车必须跟踪和识别许多对象和目标,无论它们清晰可见还是隐藏,也无论天气是好是坏。今天的雷达还远不足以独立做好所有的工作——还需要摄像头和激光雷达。但是如果能充分利用雷达特殊的优势,我们也许至少可以省掉部分辅助传感器。传统摄像头的立体模式确实可检测到物体,能测量距离并估计速度,但是不具备完全自动驾驶所需的精度。此外摄像头在夜间、浓雾或阳光直射的条件下都无法正常工作,系统很容易被视错觉欺骗。激光扫描系统或激光雷达确实可以自行照明,因此在恶劣天气条件下往往会优于摄像头。尽管如此,它们只能在视线清晰的条件下看到前方,因此在有建筑物或其他障碍物遮挡的情况下,无法检测到正在接近十字路口的汽车。雷达在距离准确度和角度分辨率方面比不上激光雷达,角度分辨率指的是能够分辨出远处两个不同目标之间的最小夹角。但是我们设计出了一种新颖的雷达结构,克服了这个缺陷,使其在增强激光雷达和摄像头方面更加有效。
人工智能
wanwan(42055)
发表于2022年01月21日 19时16分 星期五
来自空气的颜色
伦勃朗的《夜巡》的高分辨率图像现在已上网。容量为 7170 亿像素,分辨率为 0.0005 毫米。阿姆斯特丹国立博物馆发布了一张由人工智能构建的、伦勃朗《夜巡》的超高分辨率图像。原作长近 15 英尺,高超过 12 英尺,自 1900 年代初以来一直在密集地进行修复。新数字图像实际上已根据历史记录重建了多年来被破坏的部分。
人工智能
wanwan(42055)
发表于2022年01月21日 16时33分 星期五
来自墨水心
优秀的扑克玩家都知道,他们需要在虚张声势和低调之间保持平衡。现在他们可以做到完美了

扑克导师 Jason Koon 是最早也是最忠实采用“博弈优化”的扑克玩家。在为期三天的 Super High Roller 锦标赛第二天,我在 Koon 价值数百万美元的房子里拜访了他,他的家位于一个更大的封闭社区内的封闭社区里,毗邻 Jack Nicklaus 设计的高尔夫球场。锦标赛第一天,Koon 支付了 25 万美元参赛,然后在四个小时被淘汰后又花了 25 万美元,他再次输掉了所有筹码。后来他给我发短信:“欢迎来到流鼻血锦标赛的世界,发挥你的最好水平——它很公平。”对于 Koon 来说,公平的形式是赢得超过 3000 万美元现场锦标赛奖金(他说,这至少和拉斯维加斯以及亚洲赌博圣地澳门的高额现金赌博的金额一样多。)Koon 从 2006 年开始认真打扑克,他当时是西弗吉尼亚卫斯理学院田径队短跑运动员,正处于一次受伤后的康复阶段。

他靠着打牌过上了不错的生活,但很难在赌注最高的比赛中稳定获胜。他表示:“我算是个很平庸的欲求解玩家,但是有了求解器,我就埋头其中,然后开始快速、快速、快速、快速地提高。”在一个装饰着他赢得的扑克锦标赛奖杯的家庭办公室里,Koon 求助于电脑,开始尝试 PioSOLVER。在指定了玩家筹码的大小以及按照他们在牌桌上的位置可能拿到的牌的范围之后,他看到了随机的头三张公用牌,两位玩家都可以看见这些牌。一个 13×13 的网格显示了玩家所有可能持有的牌。Koon 将鼠标悬停在方格上,寻找不同花色的 A 和 Q。 软件表明 Koon 应该在 39% 的情况下选择不下注,静观其变;在 51% 的情况下,选择下注底池的 30%;其余时间下注底池的70%。这种冯诺依曼式的混合策略将同时最大化他的利润并掩饰他的牌力。多亏了 PioSOLVER 等工具,Koon 重新制定了游戏打法,明白在不同情况下哪种下注尺度最有效。有时小规模下注(底池的五分之一或者甚至是十分之一)是理想的;另一些时候,以底池两倍或三倍的巨额下注是正确的。虽然优秀的扑克玩家一直都知道他们需要在虚张声势和低调之间保持平衡,但软件定义了 Koon 应该采用一种或另一种策略的精确频率,根据打出的牌确定吓唬用的最好和最差的牌,给出的建议有时候令人惊讶。
人工智能
wanwan(42055)
发表于2022年01月20日 18时10分 星期四
来自火星众神
一百多年来,Polar Manufacturing 一直在芝加哥南部生产金属铰链、锁具和支架。公司的部分金属冲压机——让工人头疼的一种笨重、巨大的机器——可以追溯到 1950 年代。去年为在人工短缺的情况下满足不断增长的需求,Polar 雇佣了第一位机器人员工。机械臂执行一项简单的重复性工作:将一块金属放到冲压机里,后者随后将其弯曲成新的形状。和人一样,机器工人按照工作时间获得报酬。管理 Polar 生产线的 Jose Figueroa 表示,从名为 Formic 的公司租来的机器人的成本相当于每小时 8 美元,而人类员工的最低工资为每小时 15 美元。Figueroa 表示,部署机器人可以让人类工人去做不同的工作以增加产量。Figueroa 表示:“较小的公司有时候会因为无力为新技术投入资金而处境艰难。”“我们只是想努力地应对最低工资的提升。”
人工智能
1
WinterIsComing(31822)
发表于2022年01月20日 14时59分 星期四
来自荷鲁斯崛起
观看外国影视剧通常会用到字幕,一则可能是没有当地配音版本,或者配音版本没有达到原版的满意程度。要让原版的演员说不同地方的语言是不可能的事情。如今 AI 技术的进步有望让不可能变成现实:AI 通过训练能使用原版语音合成出逼真的新语音。新语音不再是另一个人的声音,而是演员本人比如汤姆克鲁斯说着另一种语言。这一技术也引发了音频深度伪造的担忧。AI 公司 Veritone 透露了它开发的名为 MARVEL.ai 的产品,允许内容制作者生成超现实的合成声音。
人工智能
wanwan(42055)
发表于2022年01月18日 17时55分 星期二
来自失忆者
一家人围在家中厨房的中岛周围,为刚买来的数字助理拆箱。MIT 媒体研究室的研究人员进行了一项研究,结果显示如果这种新的语音用户界面——可能是亚马逊的 Alexa 或者 Jibo 之类的社交机器人——表现出一些类似于人的社交行为,他们就更有可能信任它。研究人员发现,如果设备能表现出社交线索,例如将目光转向说话的人,家庭成员往往会认为设备更有能力并且更具情感吸引力。研究表明,品牌——特别是制造商的名称是否与设备相关——对家庭成员对不同的语音用户界面的感知并与之交互的方式具有重大影响。研究人员发现,当设备具有更高水平的社交体现时,例如通过动作或表情提供语言和非语言社交暗示的能力,家庭成员也会更频繁地在设备加入的群体中彼此互动。他们的结果可以帮助设计人员创建更具吸引力且更有可能被家庭成员使用的语音用户界面,同时还可以提高这些设备的透明度。研究人员还阐述了某些个性和体现设计可能带来的伦理问题。
人工智能
1
wanwan(42055)
发表于2022年01月07日 16时54分 星期五
来自通往宇宙之门
1970 年图灵奖(计算机界的诺贝尔奖)得主 Marvin Minsky 预测,“三到八年内我们将拥有具备相当于普通人类水平的通用智能机器。”52 年过去了,我们仍在等待着这种机器的出现。根本障碍在于,尽管计算机算法确实非常善于识别统计模式,但它们不知道这些模式意味着什么,因为它们局限于数学世界(MathWorld)中,从未体验过现实世界。Google 在西雅图的 AI 团队负责人 Blaise Aguera y Arcas 最近表示,大型语言模型(LLM)可能是由统计学驱动的,“统计等同于理解。”他提到了几个与 Google 最先进的聊天机器人 LaMDA 的对话片段作为证据。这些对话令人印象深刻,非常像人类的口吻,但是它们不过是 Gary Marcus 和 Ernest Davis 所说的 LLM 有能力成为“流利的废话喷井”,或者是 Timnit Gebru 和三位合著者所说的“随机鹦鹉”的例子。
人工智能
wanwan(42055)
发表于2022年01月05日 20时41分 星期三
来自雾影1:雾影边境
好莱坞刻画的人工智能(AI)噩梦就像一部科幻大片描绘的那样:机器人获得了类人的智能,获得了知觉,不可避免地成为企图毁灭人类的邪恶霸主。这种叙述利用了我们对技术与生俱来的恐惧,反映了通常伴随新技术发展的深刻变化。然而正如机器学习工程师、2019 年出版的小说《The Quantum Price》的作者 Malcolm Murdock 所说,“人工智能不必有知觉就能杀死我们所有人。在有知觉的 AI 成为问题之前,还有很多其他场景会消灭我们。”在对 AI 专家的采访中,IEEE Spectrum 列举了 AI 在现实世界中六种最坏的情况,它们比电影描述的要平凡得多。但是它们同样是反乌托邦的。而且大多数情况并不需要恶毒的独裁者。相反它们可能会自然而然地发生,有机地展开——也就是说,如果没有采取任何措施阻止它们的话。为了防止这些最坏的情况发生,我们必须放弃我们对 AI 的流行文化观念,认真对待它带来的意外后果。

1.当虚构定义了现实,深度伪造之类的技术会导致现实的后果。2.逐底竞争的危险性,AI 技术发展过程中需要注重安全而不是一味追求速度。3.隐私和自由意志的终结,乔治城大学的 Andrew Lohn 指出,“随着数据监视和跟踪的兴起,我们正在进入危险和未知的领域,我们对其潜在的影响几乎一无所知。” 4.人类身处算法创造的斯金纳箱(Skinner Box),社交媒体用户已经成为实验室里的小鼠。5.AI 设计的暴政,现有 AI 系统有着自身的局限性和偏见,它可能会限制人类而不是解放人类。6.过度监管 AI 会限制它给人类带来的好处。
人工智能
WinterIsComing(31822)
发表于2022年01月04日 17时58分 星期二
来自蒸汽歌剧
最新接受人工智能重建处理的画作是古斯塔夫.克里姆特(Gustav Klimt)在 1900 年创作的《哲学》。 几十年来,《哲学》都以黑白相片的形式存在。现在多亏了人工智能,我们可以看到这幅画作的彩色版本。但是重建的作品真的和原作一样吗?它看起来像 Klimt 的风格吗?如果你熟悉《》或者《阿德勒.布罗赫-鲍尔像一》等作品,会发现这幅由 Google Arts and Culture 用机器学习创建的新画作展现了非常不同的 Klimt。 纽约 St. Etienne 画廊曾为 Klimt 在美国首次举办画展,画廊主管 Jane Kallir 表示:“关于这些画作到底应该是什么样子,我不比Google 了解得更多,但是我不认为看起来是这样。”“看起来像卡通。不像 Klimt 的作品。” “就像有人试图克隆狗。你可以做到,但是它并不是同一条狗。”

这是最近一些用人工智能重建失传艺术品的尝试中的一个。阿姆斯特丹国立博物馆使用人工智能重建伦勃朗著名画作《夜巡》丢失的部分,在夏天将它们暂时安放在真实画作的旁边。英国的一对自称为 Oxia Palus 的研究人员表示,他们使用 3D 打印和人工智能重建毕加索隐藏在《盲人的晚餐》下面的裸体画像。10 月德国波恩的一个管弦乐队完整地“演奏”了贝多芬未完成的第十交响曲。这个版本是由算法完成的。Oxia Palus 的联合创始人 George Cann 认为,人工智能“可以提供一个从未真正拥有过的、替代艺术的平行世界。” 这是一个诱人的想法。窥看毕加索画作下方隐藏的早期画作就像是在窥看艺术家的思想,偷听一个世纪前的想法。看到因灾难失传的画作起死回生就像是穿越时光,逆转命运。但是如果在这个重新创建失传艺术品世界中的任何一件作品,例如《哲学》,是不准确的,那么 AI 创造者不是在复活历史,而是在无意中改写历史。Kallir 觉得,这幅她称之为“花里胡哨”的作品和 Klimt 几乎没有关系,她表示这些画作应该更加柔和,从一种颜色到另一种颜色的过渡也应该更平滑。她表示:“如果你眼光还不错的话,你看看黑白复制品,再将它们与大约同时期完成的其他画作进行比较,你可能更好地了解真实面貌。”
人工智能
wanwan(42055)
发表于2021年12月31日 17时35分 星期五
来自快乐基因
过去 20 年,深度学习透过一系列商业应用逐渐主导了人工智能研究和应用。但令人眼花缭乱的背后存在一些根深蒂固的问题,威胁着这种技术的腾飞。 举例来说,典型的深度学习程序在多任务上表现欠佳,该技术被限制在严格控制环境中的特定任务的应用。更严重的是,深度学习被认为是不可信的,因为它无法解释——而且不适用于某些应用,因为它会经历灾难性的遗忘。说得更通俗一点,如果算法有效,无法理解它为什么有效。当该工具慢慢学习新数据库时,其学习记忆的任意部分可能会突然崩塌。因此在任何攸关生死的应用(例如医疗应用)上使用深度学习都可能存在风险。

在一本新书中,IEEE 研究员 Stephen Grossberg 认为需要一种完全不同的方法。Grossberg根据自己几十年来对认知和神经的研究,在《Conscious Mind, Resonant Brain: How Each Brain Make a Mind》一书中描述了一种生物和人工智能的替代模型。他将模型称为自适应共振理论(ART)。 Grossberg 是波士顿大学认知和神经系统、数学和统计、心理和脑科学以及生物医学工程领域的讲席教授,他在其大脑如何处理信息的理论基础上构建了 ART。 他表示:“在充满了意外事件的、不断变化的世界中,我们的大脑学会了识别并预测对象和事件。” 对于这种不断的变化,ART 使用有监督和无监督的学习方法解决模式识别和预测问题。一些大规模的应用已在使用该理论的算法,例如对声纳和雷达信号进行分类、检测睡眠呼吸暂停、推荐电影以及基于计算机视觉的驾驶辅助软件等。Grossberg 表示,可以放心使用 ART,因为它是可解释的,并且不会经历灾难性的遗忘。他表示,ART 解决了他所谓的稳定性-可塑性悖论:大脑或其他学习系统如何才能在不经历灾难性遗忘(稳定性)的情况下快速自主学习(可塑性)。