文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
ken:feigaobox@gmail.com
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
Solidot 公告
投 票
热门评论
- 所以这家公司原本有 80 人? (1 points, 一般) by cupen 在 2023年01月13日00时09分 星期五 评论到 Parler 裁员四分之三仅剩 20 人
- 什么是真正的文明。唉。回不去了 (1 points, 一般) by devfsdvyui 在 2023年01月09日03时21分 星期一 评论到 只有最富有的古希腊人纳税,他们还为此炫耀
- Solidot什么时候有“基本原则”了? (1 points, 一般) by solids 在 2022年12月30日03时20分 星期五 评论到 为什么你应该接种有效疫苗而不只是靠感染?
- 同意~ (1 points, 一般) by devfsdvyui 在 2022年12月27日10时45分 星期二 评论到 为什么你应该接种有效疫苗而不只是靠感染?
- 这篇还是删了吧 (1 points, 一般) by 梦绕神州 在 2022年12月26日09时17分 星期一 评论到 为什么你应该接种有效疫苗而不只是靠感染?
- 那个不叫二进制 而是二叉树 (1 points, 一般) by solidot1544068314 在 2022年12月14日21时34分 星期三 评论到 内核补丁将 kallsyms_lookup_name()查找速度提高 715 倍
- 陈冠希说你们早干嘛去了? (1 points, 一般) by kokerkov 在 2022年11月28日17时04分 星期一 评论到 调查发现电脑维修店员工会访问客户个人数据
- 我不信 (1 points, 一般) by Craynic 在 2022年11月28日14时44分 星期一 评论到 Google 称互联网的六成是重复内容
- 支持 (1 points, 一般) by zagfai 在 2022年11月22日14时29分 星期二 评论到 Tumblr 将加入对 ActivityPub 协议的支持
- 权力 (1 points, 一般) by mep 在 2022年11月22日11时25分 星期二 评论到 记者想在 Mastodon 上重造 Twitter,但 Mastodon 不想参合
AI 创造的艺术打败了人类创造的艺术。在美国科罗拉多州的艺术竞赛中,名叫 Jason Allen 的艺术家递交的作品《Théåtre D'opéra Spatial》赢得了 Digital Arts/Digitally Manipulated Photography 类别的第一名。Allen 使用商业图像合成模型 Midjourney 生成了一系列图像,然后放大打印在画布上递交参与比赛。他的胜利引发了有关艺术的性质和何为艺术家的热烈讨论。有人认为 AI 的出现将会导致所有人类艺术家被机器所取代,其他人认为艺术会适应新的技术并演化发展,比如音乐合成器。
AI 技术发现逾 2 万个未申报游泳池给法国税务部门带来了一笔意外之财。因为建造水池能提高房价,意味着更高的财产税,根据法国法律业主需要申报。平均面积 30 平方米的游泳池每年的税收为 200 欧元。2020 年法国有逾 320 万个私人游泳池,新冠疫情期间愈来愈多的人在家办公,游泳池的安装量也进一步激增。法国税务部门使用的软件由 Google 和咨询公司 Capgemini 开发。除了寻找未申报游泳池,税务部门还计划用它发现未申报的房屋扩建、庭院或凉亭,这些扩建建筑都会提高房产税。
Google 研究院发布了 AI 图像降噪工具 MultiNerf。源代码托管在 GitHub 上,采用 Apache License 2.0 许可证。MultiNerf 的算法运行在原始图像数据上,利用 AI 计算出没有噪声的图像会怎么样。Google 研究人员在今年 5 月发布一则视频(YouTube)演示了其工作原理。
微软的代码建议完成工具 GitHub Copilot 可能是完美的编程考试作弊工具。马萨诸塞大学阿默斯特分校的 CS 教授 Emery Berger 对教师发出警告,认为 Copilot 就像是学生带着乌兹枪去参加刀战,让传统的编程考试变得毫无意义,因为 Copilot 知道所有答案。对使用 Copilot 的学生而言,教师的课程目标就像是敲一下 Tab 键去生成期望输出的代码。Berger 称,Copilot 不同于在编程问答社区 Stack Overflow 搜索答案,你能在网上找到示例代码,教师也能这么做,然后可以用剽窃检测工具对比下代码。Copilot 能生成网上没有的代码。他认为编程教学需要适应这一新情况。
Google 将虚拟聊天机器人的自然语言对话能力与实体机器人结合起来,演示了能在休息室里为其员工拿苏打和薯条的机器人服务员。该机器人尚未做好商用的准备,只能做少数简单的动作,甚至未整合 OK, Google 召唤功能。机器人能解释自然语言命令,权衡可能的行动,计划以较少的步骤实现要求。机器人使用了来自维基百科、社交媒体等来源的文字去训练其语言理解能力。它由子公司 Everyday Robots 设计,目前的功能是给员工拿零食。
过去十年的大部分 AI 系统都是基于监督学习,利用人工标注的数据集进行训练。它们取得了巨大的成功,但也存在明显的缺陷。此类的 AI 对于理解大脑如何工作没什么帮助,因为包括人类在内的动物是不依靠已标注数据集学习的。生物大脑通过探索环境获得对世界的深入理解。科学家们开始探索自我监督学习的机器学习算法,此类神经网络显示出了与大脑如何工作的相似性。当然大脑的工作不只是限于自我监督式学习,它充满了反馈连接,现有的自学式 AI 缺乏此类功能。AI 模型还有很长的路要走。
DeepMind 去年 7 月发布了预测蛋白质结构的 AI 系统 AlphaFold 的源代码,并创建了一个数据库 AlphaFold Protein Structure Database (AlphaFold DB) 。一年之后,AlphaFold 已被逾百万研究人员访问,被用于解决重要的真实世界问题,从塑料污染到抗生素抵抗。DeepMind 现在宣布与 EMBL European Bioinformatics Institute (EMBL-EBI)合作,发布所有已知蛋白质的预测结构,将 AlphaFold DB 规模扩大逾 200 倍——从接近一百万增加到逾两亿——有望提高我们对生物学的理解。所有结构将可通过 Google Cloud Public Datasets 批量下载。
前 Google CEO Eric Schmidt 将 AI 比作核武器,呼吁建立类似相互保证毁灭的威慑制度,防止世界最强大的国家率先发动攻击。Schmidt 称,在不遥远的未来中美可能需要围绕 AI 制定条约,在上个世纪的 50 年代和 60 年代,美国和苏联这两个超级大国最终达成了 《禁止在大气层、外层空间和水下进行核武器试验条约》,这是一个限制核武器试验的国际条约,旨在减缓军备竞赛和减少大气中过量的放射性尘埃。Schmidt 认为中国和美国可能需要在 AI 领域达成类似的条约。
在掌握海量数据,对用户进行几乎完美的跟踪之后,AI 是否就无所不能了?伊利诺伊大学和斯坦福大学的经济学家研究了机器学习在预测消费者选择上的能力,他们的结论是预测消费者选择非常困难,AI 并不特别擅长。他们发现,即时信息如用户评论、推荐和新选择对决策有愈来愈大的影响,这些信息不能事先测量和预期,大数据可用于改善预测,但程度甚微,预测仍然非常不精确。
根据发表在《Nature Machine Intelligence》期刊上的一项研究,德国马普智能系统研究所(MPI-IS)研究人员建造了一个四足机器狗“Morti”,它仅仅用了一小时就学会了走路。Morti 充分利用了复杂的腿部力学,通过贝叶斯优化算法指导学习:其足部传感器信息与机器狗中运行的建模虚拟脊髓的目标数据相匹配。机器狗通过不断比较发送的和预期的传感器信息、运行反射循环以及调整其电机控制模式来学习行走。在人类和动物中,中央模式发生器(CPG)是脊髓中的神经元网络,可在没有大脑输入的情况下产生周期性的肌肉收缩。其有助于生成有节奏的任务,例如步行、眨眼或消化。机器狗在大约一小时内比动物更快地优化其运动模式。
人工智能研究实验室OpenAI 在四月发布了 DALL-E 2,2021 年发布的 DALL-E 的继任者。两个人工智能系统都能根据自然语言文本描述生成令人惊叹的图像;它们能制作看起来像照片、插图、绘画、动画,以及基本上你可以用文字表达出来的任何艺术风格的图像。DALL-E 2 有诸多改善:更好的分辨率、更快的处理速度和一个编辑器功能,编辑器允许用户仅使用文本命令对生成的图像进行修改,例如“用植物替代花瓶”或“让狗的鼻子变大”。用户还可以上传自己的图像,然后告诉人工智能系统如何对其进行调整。世界对 DALL-E 2 的最初反应是惊叹和高兴。可以在几秒钟之内将任何物体和生物组合在一起;可以模仿任何艺术风格;可以描绘任何位置;并且可以描绘出任何照明条件。例如看到一副毕加索风格的鹦鹉翻煎饼图像,谁能不印象深刻呢?可当人们思考哪些行业容易被这种技术颠覆的时候,担忧出现了。
OpenAI 尚未向公众、商业实体甚至整个人工智能社区发布该技术。OpenAI 研究员 Mark Chen 对 IEEE Spectrum 表示:“我们也和人们一样对滥用感到担忧,这是我们非常重视的事情。”该公司邀请了一些人尝试 DALL-E 2,允许他们与全世界分享他们的成果。有限公开测试的政策与 Google 的政策形成鲜明对比,后者刚刚发布了自己的文本到图像生成器 Imagen。在发布该系统时,Google 宣布不会发布代码或公开演示,因为存在滥用和生成有害图像的风险。Google 发布了一些非常令人印象深刻的图片,但没有向世界展示任何它所暗示的、有问题的内容。
OpenAI 尚未向公众、商业实体甚至整个人工智能社区发布该技术。OpenAI 研究员 Mark Chen 对 IEEE Spectrum 表示:“我们也和人们一样对滥用感到担忧,这是我们非常重视的事情。”该公司邀请了一些人尝试 DALL-E 2,允许他们与全世界分享他们的成果。有限公开测试的政策与 Google 的政策形成鲜明对比,后者刚刚发布了自己的文本到图像生成器 Imagen。在发布该系统时,Google 宣布不会发布代码或公开演示,因为存在滥用和生成有害图像的风险。Google 发布了一些非常令人印象深刻的图片,但没有向世界展示任何它所暗示的、有问题的内容。
受婴儿学习方式的启发,Deep Mind 的计算机科学家开发出一种程序能学习物体行为的简单物理学规则。研究报告发表在《Nature Human Behaviour》期刊上。当婴儿看到违反物理规则的画面时他们会表现出惊讶,比如视频中的球突然消失了。但 AI 在理解此类行为上的能力欠缺。Luis Piloto 和同事开发出名叫 Physics Learning through Auto-encoding and Tracking Objects (PLATO) 的软件模型,像婴儿那样学习简单的物理学规则。研究团队通过给 PLATO 观看许多描绘简单场景的视频来训练它,比如球落到地上,球滚到其他物体后面又再次出现,很多球之间弹来弹去。训练之后,研究人员给 PLATO 观看了有时包含不可能场景的视频,以此作为测试。和年幼的小孩一样,PLATO 在看到“不可能场景”时表现出了“惊讶”,比如物体互相穿过却没有发生相互作用。PLATO 只观看了 28 小时的视频就获得了以上学习效果。这些结果对 AI 和人类认知研究皆有重大影响。研究团队表示,这一模型可以学习各种物理概念,且体现出与发展心理学的发现一致的特点,而 PLATO 可以作为研究人类如何学习直观物理的一个有力工具,同时也表明了物体表征对于人类理解周围世界具有重要作用。
AI 在许多承诺上都失败了。随之而来对人工智能的怀疑甚嚣尘上,我们面临一个选择:选择变得过于愤世嫉俗,在一旁观望等待赢家出现,或者找到一种方法过滤噪音,尽早发现商业突破,参与到这一历史性的经济机会之中。有一个简单的框架可以区分近期现实和科幻。我们使用对任何技术最重要的单一标准——成熟度进行衡量:它管理通常被称为边缘案例的不可预见事件的能力。随着技术的不断完善,它变得越来越擅长处理越来越少见的边缘案例,并且由此逐渐解锁新的应用。这是一个重要的观点:如果今天的人工智能专注于精确度或者检索,就可以实现非常高的性能。换句话说,它以牺牲一个代价优化另一个(即以更少的误报换取更多的漏报,反之亦然)。但是要同时在这两方面实现高性能,人工智能模型会遇到困难。解决该问题是人工智能的圣杯。
自动送货移动机器人(AMR)是城市自主商业化的首个应用,机器人出租车仍然在等待无法企及的高保真人工智能性能。行业的进步速度以及过去五年的经验强化了我们的观点,即人工智能商业化的最佳方式是专注于用低保真人工智能支持窄应用,在需要的时候通过人工干预实现高保真性能。在这个模型中,低保真人工智能带来早期商业化,之后的增量改进帮助推动业务 KPI。通过瞄准更宽容的用例,企业可以使用低保真人工智能及早实现商业成功,同时对于需要多年才能实现的高保真功能保持现实的看法。毕竟科幻在商业规划中没有立足之地。
自动送货移动机器人(AMR)是城市自主商业化的首个应用,机器人出租车仍然在等待无法企及的高保真人工智能性能。行业的进步速度以及过去五年的经验强化了我们的观点,即人工智能商业化的最佳方式是专注于用低保真人工智能支持窄应用,在需要的时候通过人工干预实现高保真性能。在这个模型中,低保真人工智能带来早期商业化,之后的增量改进帮助推动业务 KPI。通过瞄准更宽容的用例,企业可以使用低保真人工智能及早实现商业成功,同时对于需要多年才能实现的高保真功能保持现实的看法。毕竟科幻在商业规划中没有立足之地。
在微软/GitHub 商业化其 AI 编程助手 Copilot 的同时,亚马逊开始预览它的 AI 编程助手 CodeWhisperer。和 Copilot 类似,CodeWhisperer 使用开源代码库进行训练,根据上下文向开发者提供代码完成建议。Copilot 因为代码许可证方面的问题引发了争议,CodeWhisperer 存在类似的问题,但它的做法要好于微软/GitHub——在提供示例代码建议时它会给出代码的来源,开发者将能知道是来自于是可以自由使用的 MIT 授权代码,还是来自于对使用有所限制的 GPL 授权代码。
研究人员表示,可以通过监听鸡叫声改善养殖鸡福祉的人工智能可能会在五年内问世。新研究表明,这项新技术可以检测和量化大型室内棚屋中的鸡发出的求救信号,将其与其他谷仓噪声区分开,准确率达到 97%。类似的方法最终可被用于提高其他养殖动物的福祉标准。每年全世界大约要养殖 250 亿只鸡——许多鸡都生活在巨大的鸡舍中,每个鸡舍里都饲养着数千只鸡。监听它们发出的声音是评估此类生物福祉的一种方法。香港城市大学动物行为和福利学副教授 Alan McElligott 表示:“鸡的声音非常响亮,但是求救的声音往往比其他的声音更响亮,就是我们所说的纯音调的叫声。”“即使是未经训练的耳朵也不难将它们分辨出来。”理论上农民可以根据鸡的叫声衡量其痛苦程度,在必要时加以照料。然而在饲养了数千或数万只鸡的商业化鸡群中,安排人类观察员是不切实际的。McElligott 表示,一方面人类的存在可能会进一步给鸡群带来压力,而且鸡的数量这么大,客观量化求救信号的数量是不可能的。
芝加哥大学科学家开发出一种新算法,可提前一周预测未来的犯罪,准确率达到了 90%,预测范围约为 1000 英尺。它通过学习暴力和财产犯罪方面公共数据的模式进行预测。该工具使用了芝加哥市两类报告事件进行测试和验证:暴力犯罪(凶杀、袭击和殴打)和财产犯罪(入室盗窃、盗窃和机动车盗窃)。之所以使用这两类数据是因为在历来对执法部门缺乏信任和合作的城市地区,这两类案件是最有可能报警的。与毒品犯罪、交通拦截检查和其他的轻罪不同,这两类犯罪也不太容易出现执法偏见。 新模型通过检查离散案件的时间和空间坐标划分犯罪,检测模式以预测未来的犯罪。它将城市划分为大约 1000 英尺宽的“空间片”,然后预测区域内的犯罪情况。以前的模型更多地依赖传统邻里或者政治边界,这会受到偏见的影响。该模型在美国其他七个城市的数据上也表现得同样出色:亚特兰大、奥斯汀、底特律、洛杉矶、费城、波特兰和旧金山。主要作者 Ishanu Chattopadhyay 谨慎地指出,工具的准确性并不意味着它应该被用于指导执法政策; Chattopadhyay 表示,例如警察部门不应该使用它来主动在社区聚集以防止犯罪。相反它应该被添加到城市政策和治安策略的工具箱中应对犯罪。他表示:“我们创建了城市环境的数字孪生。如果向它提供过去发生过的数据,它会告诉你未来会发生什么。”Chattopadhyay 补充表示:“这并不神奇;也存在局限性,但我们对其进行了验证,效果非常好。”“现在你可以将它作为一个模拟工具,看看如果城市内一个地区的犯罪率上升是什么情况,或者另一个地区加强执法会发生什么。如果你应用所有这些不同的变量,你就会看到系统的回应是如何演变的。”研究论文发表在《Nature Human Behavior》期刊上。