solidot新版网站常见问题,请点击这里查看。
adv
人工智能
wanwan(42055)
发表于2021年11月09日 19时48分 星期二
来自太空谜案3
司机管汽车,让它直行并远离麻烦,这是老派的想法。在智能汽车的新时代,汽车将管司机。我们谈论的不是大家现在熟悉的辅助驾驶技术,这些技术帮助保持车道内行驶或靠路边停车。我们谈论的是汽车通过识别司机的情绪和认知状态,防止他们做出任何危险的事情。

市场上有一些基本的司机监控工具。大部分系统都使用安装在方向盘上的摄像头,跟踪眼球运动和眨眼频率,以确定此人是否有障碍——可能是注意力不集中、昏昏欲睡或者是喝醉了。

但是汽车行业开始意识到,障碍测量并不仅仅是要确保司机的眼睛盯在路面上,它需要的不仅仅是盯住司机。监控系统需要深入了解整个车辆以及车里每一个人的状态,以全面了解是什么影响了司机的行为,以及该行为对安全的影响。

汽车制造商正朝着这个方向推动监管。欧洲安全评级系统“欧洲新车评估计划”(NCAP)于 2020 年更新了其协议,开始根据先进的乘员状态监控对汽车进行评级。为了获得令人梦寐以求的五星级评级,汽车制造商需要开发出能检测司机疲劳和分心的技术。从 2022 年开始,Euro NCAP 将为车内独自留守儿童检测技术授予评级积分,通过向车主或应急服务机构发出警报,这类技术可能会防止因中暑而导致的悲剧性死亡。

部分汽车制造商现在正在将摄像头移到后视镜上。借助新的视角,工程师可以开发出新的系统,不仅能检测到人的情绪和认知状态,还可以检测到他们的行为、活动,还有彼此之间以及与车内物体的交互。这样的车载“老大哥”听上去可能有些令人毛骨悚然,但它可以挽救无数人的生命。
人工智能
wanwan(42055)
发表于2021年11月08日 16时00分 星期一
来自布兰尼肯夫人
一只野熊闯入一辆停放的汽车寻找食物。AI 专家 Lance Eliot 由此提出了一个问题:自动驾驶汽车能应付熊吗

自动驾驶汽车的 AI 系统是完整的。一辆停着的自动驾驶汽车可以变成移动的汽车。如果自动驾驶汽车利用它的物体检测系统,即使是停放着,AI 驾驶能力也会在(假设的)碰撞即将发生时得到警报。AI 开发人员估计,AI 驾驶系统可能会激活自汽车,试图快速驶离,以躲开即将撞过来的人类驾驶汽车。

遭遇熊是一个边缘案例。想象一辆自动驾驶汽车停在森林旁边。人类徒步旅行者离开汽车徒步到了树林深处的某个地方。一只熊晃晃悠悠地进入停车场,寻找免费的吃食。如果 AI 驾驶系统正在使用物体检测功能,很可能会检测到这只熊。如果熊决定直接走向汽车,AI 系统可能会激活躲开这只熊。 目前还不清楚熊是否会以某种方式猜到汽车能自行移动。有理由认为熊会担心那些免费的餐盒(带轮子的)好像会在它接近时移开。这可能会让部分熊死心,它们会避开停放着的汽车。另一部分熊则可能会把这变成一场游戏。有点像捉迷藏的游戏。靠近一辆车,它开走了。好玩!走到车旁,看 看它接下来往哪个方向走。在停车场度过了一段美好的时光,这是肯定的。 如果我们讲的是毛茸茸的熊的故事的话。

自动驾驶汽车的内部设计很可能与传统的人类驾驶汽车不同。如它不需要方向盘,也不需要踏板。开阔的内部也许可以容纳旋转座椅,也可能是斜倚座椅,这样你就可以在自动驾驶汽车的长途旅行中睡觉。考虑到这种内部设计,熊肯定会在自动驾驶汽车上找到比传统人类驾驶汽车更舒服的东西。接下来熊会爱上自动驾驶汽车,因为它是一个安静、宽敞、安全的地方,可休息和放松。无需担心掠食者的攻击,还能享受豪华宽敞的内部空间。

第二个问题是熊是否会弄清楚如何与 AI 驾驶系统进行通信。你知道,熊是相当敏锐的。也许一只真正有进取心的熊可以说服 AI,让自动驾驶汽车载着它来一段舒舒服服的旅行。 如果你开始看到熊乘坐着自动驾驶汽车四处行驶,请不要感到特别惊讶。 请记住,你是首先在这里听说的。
人工智能
wanwan(42055)
发表于2021年11月02日 17时14分 星期二
来自探寻者
一组研究人员构建了一个机器学习系统扫描卫星图像,寻找大于 10 千瓦的太阳能发电设施,使用的计算量相当于人类寿命的好几倍。研究报告发表在《自然》期刊上。 团队成员、牛津大学气候变化/人工智能研究员 Lucas Kruitwagen 透露了他们的发现。“我们搜索了地球陆地表面大约一半的面积,过滤了人烟稀少的偏远地区。”

我们共检测到 68,661 个太阳能设施。根据这些设施的面积,控制了机器学习系统中的不确定性,我们估算出到 2018 年年底,全球总装机容量为 423 吉瓦。这与国际可再生能源机构(IRENA)同期 420 吉瓦的估计非常接近。研究表明,从 2016 年至 2018 年间,太阳能光伏发电能力大幅增长了 81%,我们为这段时期的图像添加了时间戳。这种增长尤其受到印度(184%)、土耳其(143%)、中国(120%)和日本(119%)的引领。设施的规模差异很大,从智利、南非、印度和中国西北部的吉瓦级沙漠设施到加利福尼亚和德国的商业和工业屋顶装置,还有北卡罗来纳州和英格兰的城市拼凑装置以及韩国和日本的农村拼凑装置。

使用卫星图像的旧目录,我们能估计出 30% 设施的安装日期。这样的数据让我们能够研究导致太阳能扩散的精确条件,并将帮助政府更好地设计补贴以鼓励更快的增长。了解设施的位置还让我们能够研究太阳能发电增长的意外后果。研究中我们发现太阳能发电厂最常见于农业地区,其次是草原和沙漠。 这凸显出需要仔细考虑未来几十年太阳能光伏发电能力扩大十倍将对粮食系统、生物多样性和弱势群体土地使用产生的影响。政策制定者可以提供激励措施,改为在屋顶安装太阳能发电装置,从而减少土地使用竞争,或考虑选择其他的可再生能源。
人工智能
wanwan(42055)
发表于2021年10月28日 17时41分 星期四
来自刀剑神域进击篇05
卡内基梅隆大学(CMU)的研究人员挑战一个长期以来的假设,即在使用机器学习做公共政策决策时,要在准确性和公平性之间进行权衡。 随着刑事司法、招聘、医疗保健服务和社会服务干预等领域对机器学习的使用不断增加,人们愈来愈担心此类应用会引入新的或者扩大现有的不平等,特别是针对少数族裔和经济劣势人群。为了防止此类偏见,机器学习系统的数据、标签、模型训练、评分系统等方面都进行了一些调整。基本的理论假设是这些调整让系统变得不太准确。

卡内基梅隆的一个团队希望通过一项新的研究消除这些假设,研究论文发表在《Nature Machine Intelligence》上。 研究人员发现,针对准确性进行优化的模型——机器学习的标准实践——可以有效地预测感兴趣的结果,但在干预建议方面表现出相当大的差异。当研究人员对旨在提高公平性的模型的输出进行调整时,他们发现基于种族、年龄或收入的差异(视情况而定)的不平等可以被消除,而且不会降低准确性。
人工智能
wanwan(42055)
发表于2021年10月27日 16时11分 星期三
来自星火
我们是如何说话和阅读的?看似简单的问题推动了 MIT 的一项研究,研究人员使用 AI 模型检查大脑如何以及为什么理解语言。大脑的工作方式可能类似于智能手机的自动更正功能研究论文发表在《National Academy of Sciences》期刊上,显示 AI 语言模型的功能类似于人脑中的语言处理方法,这表明人脑可能使用对下一个单词的预测处理语言。

在新研究中,MIT 的一组研究人员分析了 43 种不同的语言模型,许多模型都对下一个单词预测进行了优化。这些模型包括可以在得到提示时生成逼真文本的GPT-3(Generative Pre-trained Transformer 3),以及其他一些旨在提供填空功能的模型。研究人员给每个模型展示了一串单词,以测量其神经节点的活动。接着他们把这些模式同受试者在完成语言任务时候的人脑活动进行比较——受试者被要求完成听、阅读完整的句子,以及一次阅读一个单词等语言任务。研究表明,表现最好的下一个单词预测模型的活动模式与人类大脑的活动模式高度相似。此外这些模型中的活动也与人类行为指标相关,比如人们阅读文本的速度。

结果表明,下一个单词预测是语言处理中的一项关键功能,这一结论支持了之前提出但尚未得到证实的一项假设。科学家还没有发现任何进行此类处理的大脑回路或机制。研究者未来计划构建一些下一个单词预测模型的变体,以了解每个模型之间的微小变化会如何影响其处理能力。他们还计划将这些语言模型与为了完成其他类大脑任务(例如对物理世界的感知)而设计的模型结合起来。
人工智能
wanwan(42055)
发表于2021年10月27日 15时50分 星期三
来自智者之惧
在酒店和公寓大楼等垂直领域之后,亚马逊宣布了针对医疗保健服务商和老年生活中心推出新的解决方案。这些解决方案是 Alexa Smart Properties 的一部分,专为满足大规模部署 Alexa 设备的需求设计,允许设施管理员为其居民或者患者创建个性化的体验。在老年生活中心,居民将能使用 Alexa 设备给家人和其他亲人打电话,了解所在社区的动态和其他社区新闻。设备还可用于发布公告,允许居民直接通过音频消息相互交流,可进行音频和视频通话,它们还可以简化其他中心活动——例如登记、维护请求和各种管理任务。亚马逊认为这可以帮助提高设施的效率和生产力。它表示包括 Atria 和 Eskaton 在内的老年生活社区将采用新解决方案。

利用亚马逊为医院提供的新解决方案,患者将能使用 Alexa 与医护人员进行交流、控制房间内的设备,享受新闻和音乐带来的乐趣。医疗保健服务商还可以使用 Alexa 的呼叫和 Drop-In 等功能,无需进入病房就能同患者进行交流。亚马逊表示,这可以帮助医院提高生产力,节省医疗用品以及手套、口罩和防护服等防护用品。由于新冠疫情,部分地方的个人防护用品一直处于短缺状态。亚马逊一直在努力解决录音和转录相关的隐私问题,该公司解释称,医疗保健和老年生活中心解决方案都不会保存录音,用户也不需要与 Alexa 共享个人信息即可使用这些设备。用户可以随时按顶部的按钮让 Echo 的麦克风静音。亚马逊表示将保障受保护健康信息的安全,这些信息经由 Alexa 的技能交互收集,符合《健康保险流通与责任法案》(HIPAA)的要求。亚马逊透露,这两种新的 Alexa Smart Properties 解决方案下月将在美推出。
人工智能
wanwan(42055)
发表于2021年10月25日 14时43分 星期一
来自摩若博士岛
亿万富翁 Peter Thiel 相信,“相比于通用人工智能(AGI),人们应该更担心‘监视AI’。” 这位联合创办大数据公司 Palantir 的风险投资家在迈阿密的一个活动上表示,在通往 AGI 的路上,你会得到监视 AI,他将其描述为“共产主义的极权技术”。那些担心 AGI 的人实际上没有“抓住真正重要的事情,”Thiel 表示,政府将使用 AI 面部识别技术控制民众。

Thiel 的言论是在彭博社报道 “Palantir 知道你的一切”的三年之后做出的。Thiel 还投资了面部识别公司 Clearview AI 和监控初创公司 Anduril。市值 480 亿美元的 Palantir 开发了数据拖网技术,情报机构和政府用这种技术监视和发现公共和私有数据库中的可疑模式。该公司的客户包括 CIA、FBI 和美国陆军……

Thiel 是一位著名的自由意志主义者,是 PayPal 的联合创始人,在 Facebook 的董事会拥有一个席位。他表示,如今的硅谷并不像六七年前那样热衷谈论 AGI了……在演讲中,Thiel 还将 AI 和加密货币相提并论,表示他更愿意看到后者成功。“如果我们说加密货币是自由意志主义的,从根本上说它是一种去中心化的力量,那么我认为我们也应该愿意说,AI 特别是低技术监控形态的 AI,本质上是共产主义的。”

他表示:“如果你把它定义为一场技术竞赛……我希望加密货币的去中心化世界能赢。”
人工智能
WinterIsComing(31822)
发表于2021年10月21日 16时15分 星期四
来自奇岛
随着部分投资者开始用 AI 学习和分析其语言模式和语气,企业 CEO 和其他高管越来越多地处于显微镜之下,这一趋势开辟了充满机会的新领域。

语言模式软件专家 Evan Schnidman 表示,2020 年末,IT 行业的高管在讨论供应链中断问题时,刻意淡化半导体芯片短缺的可能性。他们说,一切都很好。然而一个旨在发现口语——最好是没有稿子的口语之中隐藏线索的算法经过分析发现,他们讲话的语气表现出高度的不确定性。Schnidman 表示:“我们发现 IT 部门高管讲话的语气和他们所说的积极言论并不一致。”

Schnidman 为两家金融科技公司提供了这项分析建议。在评论发表后的几个月内,大众汽车和福特汽车等公司警告称,严重的芯片短缺会影响产量。汽车和工业公司的股价随之下跌。IT 部门高管现在表示供应很紧张。Schnidman 认为,如果计算机驱动的量化基金将权重分配给这些高管说话的语气而不是他们所说的内容,原本可以在这场行业动荡之前,处以更有利的位置。对 11 位正在使用或者试用此类系统的基金经理的采访显示,部分投资者将这种被称为自然语言处理(NLP)的技术视为一种新的工具,认为它可以帮助他们获得压倒竞争对手的优势。他们表示,如今传统的财务数据和公司报表已经被挖掘得很透,几乎没什么价值了。
人工智能
wanwan(42055)
发表于2021年10月19日 18时01分 星期二
来自流星追逐记
每当人类或者机器学会更好地完成一项任务时,都会留下一系列证据。一系列物理变化——大脑中的细胞或算法中的数值——是提高表现的基础。但系统如何准确地确定要进行哪些调整可不是一件小事。它被称为可信度赋值问题(credit assignment problem),大脑或者人工智能系统必须找出管线中哪些部分应对错误负责,然后对其进行必要的修改。简单说:这是一个问责游戏,找出是谁的过错。

AI 工程师用被称为反向传播(backpropagation)的算法解决了机器的可信度赋值问题,该算法在 1986 年由 Geoffrey Hinton、David Rumelhart 和  Ronald Williams 的工作推广开来。现在它是最成功的人工智能系统——深度神经网络(在输入层和输出层之间隐藏若干人工神经元层)学习的主要驱动力。根据发表在《Nature Neuroscience》期刊上的一篇论文,科学家现在可能终于在活着的大脑中找到了与之对等可实时工作的模型

由渥太华大学 Richard Naud 与麦吉尔大学和 Mila AI 研究所 Blake Richards 领导的一组研究人员发现了一种大脑学习算法的新模型,该模型可以模拟反向传播过程。它看起来非常逼真,以至于引起了实验神经科学家们注意,科学家现在对研究真正的神经元非常有兴趣,希望了解大脑是否真的这样做。柏林洪堡大学的实验神经科学家 Matthew Larkum 表示:“理论性的想法可以推动我们进行困难的实验,在我看来这篇论文已经超越了这一标准……它具有生物学意义上的合理性,而且可能会产生很大的影响。”
人工智能
wanwan(42055)
发表于2021年10月18日 18时49分 星期一
来自墨水心
四足机器人是机器人技术最有意思的发展之一。它们小巧灵活,能穿越轮式机器无法穿越的环境。所以把武器安装在这些机器人上面只是一个时间问题。美国公司 Ghost Robotics 制造的四足机器人 Vision 60 配备了轻武器公司 Sword International 的定制枪。枪本身(被称为 SPUR 或者“专用无人步枪”)的设计是打算安装在各种机器人平台上。它具有 30 倍光学变焦、用于在黑暗中定位的热像仪,有效射程为 1200 米。尚不清楚 Sword International 或 Ghost Robotics 目前是否在销售这种配备了武器的机器人。如果还没有开始的话,应该很快了。正如 Sword 网站上的营销文案夸耀的那样:“SWORD Defense Systems SPUR 是无人武器系统的未来,而那个未来就是现在。”
人工智能
wanwan(42055)
发表于2021年10月15日 16时07分 星期五
来自终极失控
一个旧金山街区被突如其来爆发性增长的交通流量打破了宁静。居民表示,他们的里士满区(Richmond District)的一条死路突然挤满了无人驾驶汽车公司 Waymo 的汽车。“我睡觉时注意到了,”Jennifer King 表示,“我被一阵奇怪的嗡嗡声吵醒了,还以为窗户外有一艘宇宙飞船。”这些不速之客不只是晚上来。它们整天都来,就在 15 大道的尽头,这里什么都没有,车子只能在这里转弯,然后从进来的路出去。一辆车离开后不久,会有另一辆车出现,转弯然后离开,然后又来一辆车,重复同样的事情。虽然可能会有一些中断,但基本上没有真正停过。King 在谈到 WayMo 汽车数量时表示,“有时候可能会有 50 辆……实际上是每五分钟一次。我们都在家工作,所以都能听见。”有几次这些车一起来了。这些高科技汽车停成一排,似乎被这条死路完全搞糊涂了。有些居民觉得它们很讨厌,每个人都觉得情况有些奇怪。
人工智能
WinterIsComing(31822)
发表于2021年10月12日 21时07分 星期二
来自失眠
Google 研发主管 Peter Norvig 加盟了斯坦福研究所 Institute for Human-Centered AI 担任杰出教育专家(Distinguished Education Fellow),工作是开发工具和材料解释 AI 的关键概念。Peter Norvig 在 Google 工作了 20 年,他是在 2001 年加盟 Google,之前的工作是 NASA 的计算机科学家,帮助设计了火星漫游车使用的自治导航软件。在担任 Google 研发主管期间,他监督了搜索算法,建立了专注于机器翻译、语音识别和计算机视觉的团队。他还合作编写了广泛使用的 AI 入门教科书《Artificial Intelligence: A Modern Approach》。他解释为什么离开 Google 时称,他的职业生涯总是在教育、企业和政府部门之间来来回回,在一家公司待了 20 年和远程办公 18 个月后,他认为是时候尝试新事物,他现在专注于教育。
人工智能
wanwan(42055)
发表于2021年10月11日 18时19分 星期一
来自魔法集成
这听起来像是间谍惊悚片里的场景。黑客攻破了一家核电站的 IT 防御,注入虚假的现实数据,诱使计算机系统和人员认为这些操作是正常的。然后黑客会破坏核电站内关键机器的功能,导致其运行失常或者出现故障。当系统操作人员意识到自己被骗的时候,为时已晚,灾难性后果已发生了。

这个场景不是虚构的;它发生在 2010 年,当时黑客用 Stuxnet 毒破坏了伊朗的铀浓缩离心机。随着勒索软件和世界各地其他的网络攻击不断增多,系统运营商愈加担心“虚假数据注入”攻击。很多基于人工智能的计算机模型和数据分析确保了电网、制造设施和发电厂的平稳运行。如果落入歹人之手,这些模型和数据分析可能会反过来成为祸乱之源。

普渡大学的 Hany Abdel-Khalik 对此给出了强有力的回应:让运行这些网络物理系统的计算机模型具有自我意识和自我修复能力。利用这些系统数据流中的背景噪声,Abdel-Khalik 和他的学生嵌入了一些信号,这些信号不可见、不断变化,并且只用一次,将被动元件(passive component)变成了主动观察者(active watchers)。即使攻击者拥有系统模型的完美副本,无需人工响应,系统本身也会立刻检测出并拒绝任何注入伪造数据的尝试。
人工智能
1
WinterIsComing(31822)
发表于2021年10月08日 21时24分 星期五
来自莉莉丝的孩子1:破晓
苏黎世大学研究人员开发出一种方法,让四旋翼无人机利用自身的传感和计算高速穿越未知复杂环境。无人机在没有地图的情况下通常很难在未知复杂环境中找到自己的路。研究小组负责人 Davide Scaramuzza 称,要精通自主敏捷飞行,你需要在一瞬间理解环境,无论是机器人还是人类来说这都是一件困难的任务。人类的专家级飞行员需要在多年的训练后才能达到这个水平。Scaramuzza 和他的团队训练了一架无人机能保持 40 km/h 的速度飞越以前未见过的环境,如森林、建筑物、废墟和火车,而且不会撞上障碍物。无人机的神经网络通过观察模拟专家学习飞行。模拟专家是控制虚拟无人机在遍布复杂障碍的模拟环境中飞行的算法,有足够的时间和计算资源后它能找到最佳路径。此类模拟专家不能在模拟环境之外工作,但它的数据能用于训练神经网络如何根据自身的传感器数据预测最佳路线。
人工智能
1
WinterIsComing(31822)
发表于2021年10月01日 18时54分 星期五
来自总门谷
根据发表在《自然》期刊上的一项研究,AI 能预测未来两小时内是否会下雨。Google 旗下的 DeepMind 和 Exeter 大学与英国气象局合作构建了即时预报系统。传统方法使用复杂方程式预报天气通常只能预报六小时到两周内的天气,新的 AI 系统能做出更精确的短期预报,包括重要的风暴和洪水。系统首先学习如何识别常见降雨模式,使用 2016 到 2018 年的英国雷达地图训练,然后在 2019 年的雷达地图上进行测试,50 名英国气象局气象学家发现,测试结果的正确率能达到 89%。DeepMind 的高级科学家 Shakir Mohamed 表示现在就采用 AI 系统还为时过早,但实验表明 AI 确实是一种强有力的工具。
人工智能
wanwan(42055)
发表于2021年09月30日 18时08分 星期四
来自主宰世界的人
参孙和达丽拉(Samson and Delilah)》是十七世纪最具影响力的艺术家之一彼得·保罗·鲁本斯(Peter Paul Rubens)的一幅传世名作。这幅画描绘的是勇士参孙被自己的情人达丽拉出卖的旧约故事。在伦敦国家美术馆 1980 年买下这幅作品时,交易价格创下了当时拍卖史上的第三高位。但如今买家最好找找当时的收据了,因为根据一项最新 AI 分析,这幅画作几乎肯定是赝品。测试工作由 Art Recognition 完成,这是一家使用算法验证艺术品真伪的瑞士公司。该公司的工具基于深度卷积神经网络,系统在艺术家的真品图像之上进行算法训练,快速学会识别艺术家的特征。之后系统会将图像拆分成更多小块以扩充训练数据集,各图块会被放大以捕捉更多精细细节。训练完成之后,算法会输入一张新图像进行评估,分析图像特征并检测其属于真品的可能性。在将《参孙与达丽拉》与 148 幅鲁本斯真迹进行比较后,系统认为这幅作品有 91% 的几率为赝品。Art Recognition 联合创始人 Carina Popovici 对结果感到震惊:“为了防止错误,我们又重复进行了检测,而结果一直相同。每块都像是假的,几率超过 90%。”
人工智能
wanwan(42055)
发表于2021年09月30日 15时24分 星期四
来自智者之惧
在 Search On 活动中,Google 引入了几项新功能,综合看来这些新功能是该公司迄今为止最强有力的尝试,让用户不只是在搜索框里简单输入几个单词。通过在一些细节之处应用新的多任务统一模型(Multitask Unified Model,MUM)机器学习技术,该公司希望开启一个良性循环:它将提供更多的细节和语境更为丰富的答案,希望用户会因此询问更为详细、语境更为丰富的问题,最终结果是提供更丰富更深入的搜索体验。Google 负责搜索的高级副总裁 Prabhakar Raghavan 也负责 Assistan、广告和其他产品。他喜欢说——而且他在上周日的一次采访中也重申——“搜索可不是一个已经解决掉了的问题。”这可能是真的,但是他和他的团队现在试图解决的问题与网络上的争吵并没什么关系,而是更多地为了给找到的内容添加语境。

对 Google 而言,该公司将利用机器学习技术,发挥自身识别相关主题关联内容的能力,并且以一种有组织的方式将这些关联内容呈现给用户。即将重新设计的 Google 搜索将开始显示“该知道的事(Things to know)”框,将你送到不同的子主题。当视频中的某个部分与这个主题相关时——即使整个视频与此并无关联——它也会将你送到那里。购物结果将开始显示附近商店的库存,甚至还会显示与你的搜索相关的、不同款式的服装。对你而言,Google 正在提供一种超越文本框的、新的搜索方式。该公司正在积极推动旗下图像识别软件 Google Lens 进入更多地方。它将被内置于 iOS 上的 Google 应用程序以及桌面上的 Chrome 网络浏览器中。Google 希望,通过 MUM,能让用户不仅仅识别鲜花或者地标,而是能够直接使用 Lens 提问和购物。
人工智能
wanwan(42055)
发表于2021年09月29日 15时12分 星期三
来自电动新世纪
根据泄露的内部开发文件与 Astro 软件开发会议视频记录,亚马逊新推出的 Astro 机器人设计跟踪家庭之内每名成员的个人行为,借此执行监控与助手职责。根据参与 Astro 项目的两位消息人士介绍,该系统的人员识别系统存在严重缺陷。内部文件在提及 Astro 时使用的是其内部代号 Vesta,深入剖析了机器人设计思路、亚马逊的开发理念、设备如何跟踪客户行为、如何确定谁是“陌生人”以及该对“陌生人”采取何种“调查活动”的判断流程等。

会议文件以更直率的方式详细说明了机器人的工作流程。一份文件写道,“当周围有陌生人时,Vesta 会缓慢而智能地在家中巡逻,从一个扫描点移动到另一个扫描点(选择当前空间中最适合环顾四周的位置与姿态),搜索并倾听异常活动。Vesta 在移动到预定的扫描点后,摆出扫描当前所处房间的姿态,以它的方式越过障碍。在完成楼层平面图上的所有扫描点之后,Vesta 完成一轮巡逻。”

参与 Astro 项目的开发人员表示,他们当时正在工作的机器人版本表现不佳。消息人士坦言,“Astro 的表现相当糟糕,几乎一有机会就要一头摔下楼梯。人员检测效果往好听了说也是不太可靠,所以给出的家庭安全提议自然沦为笑柄。考虑到高昂的成本,这台设备太过脆弱。好几台设备上的伸展杆都坏了,没办法正常伸缩,用户无法在这种情况下把产品送回亚马逊返修。亚马逊还打算把 Astro 宣传成一款无障碍设备,但伸缩杆极易损坏加上随时可能摔下楼梯,产品总体上是荒谬的,甚至可能给使用它的群体带来意外风险。”
人工智能
1
wanwan(42055)
发表于2021年09月28日 20时43分 星期二
来自失眠
人工智能已经深入我们的生活,虽然你可能难以指出明显的例子。在无数服务的背后,有神经网络在为我们的虚拟助手提供支持、提出在线购物建议、识别出照片中的对象、审查我们的银行交易以避免欺诈活动、转录我们的语音信息,并清除社交媒体上的过激言论。但这些应用都有着共通的局限性,即只能在有限且明确可预测的环境当中学习和起效。

我们的工作与商业环境没这么单纯,所以让 AI 发挥作用自然困难重重。为了更上一层楼,研究人员正努力将 AI 与机器人技术融合起来,希望创造一种真正具备智能,可以在混合、无法预测且残酷无情的现实世界中做出决策、控制物理实体的完整解决方案。这无疑是个革命性的发展目标,也引起世界上众多强大技术研究组织的关注。

Google 位于伦敦的 AI 合作伙伴 DeepMind 机器人技术主管 Raia Hadsell 坦言,“我认为机器人技术领域的发展态势,可能要比计算机视觉技术的当前水平落后十年左右。” 即使对 Google 来说,这也是一项艰难的挑战。其中某些部分相对简单:在大多数机器人应用领域,我们很难收集到能够推动AI其他领域取得进展的庞大数据集。也有些问题深刻而复杂,涉及 AI 领域的老大难挑战:如何让 AI 在不忘记旧任务的前提下学习新任务?如何创建一种 AI,将它在新任务中学习到的技能融合进之前掌握的能力之内? 只要在这些方面取得突破,AI 的应用领域将大大拓宽。我们热切希望 AI 完成的各类目标——驾驶汽车和卡车、在疗养院工作、灾后清理、完成基本家务、建造房屋,播种、培育和收割庄稼等等——这一切超出现有 AI 处理范围的复杂、通用任务,都将可以由机器人独力完成。 除了打开巨大的潜在市场之外,这项工作还将带来直接且深远的社会影响。它不仅启发着我们对机器人技术乃至AI研究的思路,更会影响我们对于智能这一概念本身的理解。 我们不妨从最简单的问题起步。神经网络的水平取决于训练中所使用数据的质量与数量。海量数据集的出现,成为近年来AI技术迅猛发展的前提:图像识别软件需要数百万张经过标 记的图像训练而成;AlphaGo 之所以能在古老的围棋中击败世界第一人,靠的就是数十万轮棋谱数据训练与自我对弈的几百万次磨炼。 但是机器人的训练可没有这么庞大的数据集可供参考。

Hadsell 指出,“这是个非常关键的困境。我们可以在几分钟内通过数百个 CPU 并发运行,让 AI 模型快速模拟成千上万盘围棋对弈。但如果机器人拿起一个杯子需要 3 秒钟,那么每台机器人每分钟最多只能进行 20 次练习。更重要的是,如果图像识别系统在前 100 万张图像中总结出了错误结论,不会有什么大问题。但如果双足机器人在前 1000 次行走中不断跌倒……那没等它学会走路机器就差不多要报废了。” 真实数据的问题目前还没能得到解决,但 DeepMind 从未止住脚步,他们只是不断收集自己能够收集到的一切、机器人则在实验室里嗡嗡作响。而在整个行业内,研究人员则希望通过所谓“模拟到真实”的技术解决数据匮乏问题。 位于旧金山的 OpenAI 实验室最近正在利用这项策略训练机械手,尝试让它学会破解魔方。研究人员开发出一个包含魔方加机械手的虚拟环境,并在其中训练负责操纵机械手的 AI 模型。之后它们把 AI 模型安装在实体机械手上,尝试破解真正的魔方。从结果来看,模拟训练确实能教会物理机器人解决真实世界中的难题。

Hadsell 适时泼了点冷水,表示虽然取得了重大成功,但这项技术仍有很大的局限性。AI 研究员兼机器人专家 Rodney Brooks 有句名言,“模拟注定会成功”,因为模拟环境过于完美、与现实世界的复杂状态脱节。Hadsell 指出,“想象一下模拟环境中有两只机械手臂,不断尝试组装一部手机。”只要让它尝试几百上千万次,机械手最终能够在几秒钟之内以恰到好处的力度加毫厘不差的时机组装出一部手机——每个部件都在最正确的时间落在最正确的位置上。但这样的结果永远无法适用于复杂而且混乱的现实。目前研究人员还无法建立起包含不完美因素的模拟方案。Hadsell 解释道,“我们当然可以人为添加噪声和随机性,但还没有任何一种现代模拟方案能够可靠地重现哪怕一小部分现实条件。”
人工智能
wanwan(42055)
发表于2021年09月23日 16时00分 星期四
来自弗兰肯斯坦
一种相对较新、能够模拟人脑工作方式的计算类型,正在改变科学家解决某些高难度信息处理问题的方式。研究人员现在找到了一种方法,能将所谓储备池计算(Reservoir Computing )的工作速度提高 33 到 100 万倍,大幅削减所需的计算资源与数据输入量。在下一代储备池计算的测试中,研究人员不到一秒内就在台式机上解决了一个复杂计算问题。这项研究的主要作者、俄亥俄州立大学物理学教授 Daniel Gauthier 表示,即使使用目前最先进的技术,同样的问题也需要在超级计算机上耗费更长时间才能解决。研究报告发表在《自然通讯》杂志上。

Gauthier 解释道,储备池计算是一种出现于 2000 年代初的机器学习算法,用于解决“最困难的”计算问题,例如预测动力系统随时间推移产生的演变。Gauthier 表示,之前的研究表明,储备池计算非常适合学习动力系统、够准确预测它们的未来行为。储备池计算通过人工神经网络实现这一目标,整个处理过程与人脑类似。科学家将动态网络上的数据输入到网络内随机连接的人工神经元“储备池”中,再由科学家将该网络产生的有用输出馈送回网络,由此建立起一套越来越准确的系统发展预测模型。系统体量越大、复杂度也就越高,科学家要想得到更准确的预测结果,就必须使用更大的人工神经元网络——由此占用的计算资源与时间自然就更多。

在这项研究中,Gauthier 和他的同事发现可以对整个储备池计算系统进行大幅简化,从而显著削减对于计算资源的需求、缩短处理时长。他们选择在由 Edward Lorenz 开发的天气预测系统中测试了他们的概念,即尝试分析蝴蝶效应的发生过程。在这项预测任务中,他们的下一代储备池计算明显胜过当前最先进的技术。在台式机上完成的一项相对简单的模拟当中,新系统比现有模型快 33 至 163 倍。而在强调提高预测准确性后,下一代储备池计算的速度则快了约 100 万倍。Gauthier 表示,与上一代模型所需要的 4000 个神经元相比,新一代计算方法只需要 28 个神经元就能实现相同的精度。另一个实现良好加速效果的原因,在于下一代储备池计算背后的“大脑”对于预热及训练的依赖性较上代方案也有大幅降低。所谓预热,是指将训练数据输入添加到储备池计算机内,借此为实际任务做好准备。