solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年11月02日 15时40分 星期四
来自致命的发动机
英伟达的 GPU 被广泛用于训练大模型,它的价格昂贵加上供不应求导致许多 AI 公司难以获得。现在亚马逊 AWS 推出了 Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML,允许客户在定义好的时间内租用英伟达 GPU,可用于训练机器学习模型或用现有模型做试验。客户可访问 1-64 个 NVIDIA H100 Tensor Core GPU 实例,每个实例有 8 个 GPU,可以提前 8 周以一天为单位预留最长 14 天使用时间。保留的时间结束之后,实例将会自动关闭。

人工智能
Wilson(42865)
发表于2023年11月01日 14时42分 星期三
来自来自12个星球的敌人
美国新的出口管制可能迫使 AI 芯片巨头英伟达取消明年数十亿美元的对华订单。据知情人士透露,此前英伟达今年对中国的 AI 芯片订单已经完成交付,并且正争取在新规原定于 11 月中旬生效之前提前交付 2024 年的部分订单。但上周美国政府致信英伟达称,对包括中国在内的一些国家销售高端芯片的新出口限制立即生效。知情人士说,包括阿里巴巴、字节跳动和百度在内的中国头部 AI 和云计算公司都已下了明年交货的大规模订单,订单额超过 50 亿美元。根据 10 月 17 日公布的最新规定,任何公司的 AI 芯片如果超过一个性能基准,在出口到中国和其他受关注国家之前,必须获得美国商务部的许可。

人工智能
Wilson(42865)
发表于2023年10月29日 22时14分 星期日
来自惨败
通用汽车旗下的自动驾驶子公司 Cruise 暂停了全美的无人出租车运营。此前加州以其自动驾驶出租车对公共安全构成危险为由撤销了其无人运营许可证,该公司的出租车可以有司机监督的情况下继续运营。10 月 2 日一位行人被一辆汽车撞倒,正好倒在 Cruise 的无人出租车行进路线上,汽车碾过了行人,在停下来前将其拖了大约 6 米。Cruise 表示正在与监管机构合作调查这起事故,其工程师正在改善出租车对这种极端罕见事故的应对能力。美国国家公路交通安全管理局(NHTSA)已经宣布将对 Cruise 展开调查,它收到了两起 Cruise 无人出租车造成行人受伤的报告。Cruise 称它主动暂停全部无人出租车运营,检查其流程、系统和工具,反思如何重建公众信任。

人工智能
Wilson(42865)
发表于2023年10月29日 21时17分 星期日
来自勇者物语
波士顿动力的 YouTube 账号发布了一则新视频,演示了它的四足机器狗 Spot 在 ChatGPT 的帮助下用不同语音和口音流畅说话,它能用英国绅士或女孩的口音与人对话。这项成就是一次黑客马拉松的成果,工程师尝试将 ChatGPT、语音识别软件等 AI 技术与 Spot 结合,创造出某种令人毛骨悚然的结果。机器狗能扮演不同的角色,其中之一是导游机器人。在视频中 Spot 说,“欢迎来到波士顿动力,我是 Spot,你的导游机器人。” Spot 看起来对波士顿动力的建筑物布局相当了解,能根据与人的对话做出反应,比如对话者说口渴了,机器人能将人引导到有咖啡机的零食区。

人工智能
Wilson(42865)
发表于2023年10月26日 17时54分 星期四
来自十二魔
研究人员在 AI 领域取得了一项突破,他们开发出一种神经网络系统,具有类似人类的语言归纳能力。AI 系统能将新学到的单词应用于现有词汇和新的上下文背景中。这种能力被称为系统归纳,是人类认知的重要组成部分。研究人员测试了 ChatGPT 使用的模型,虽然 ChatGPT 具有令人称奇的自然语言对话能力,但在语言归纳上要远逊于新的神经网络或人类。这项研究发表在最新一期的《自然》期刊上。

Android
Wilson(42865)
发表于2023年10月26日 14时35分 星期四
来自影舞
随着生成式 AI 模型的日益普及,越来越多的应用集成了生成式 AI 功能。Google 更新了 Android 开发者政策,要求此类应用包含标记和举报功能。Google 称它想要确保 AI 生成的内容对用户是安全的,能纳入用户的反馈。从明年开始,相关应用需允许用户无需退出应用就能标记 AI 生成的冒犯性内容。应用开发者可以根据这些报告开发出更好的内容过滤和审核功能。

人工智能
Wilson(42865)
发表于2023年10月25日 23时59分 星期三
来自沙皇的邮件
在接连发生两起安全事故之后,加州机动车辆管理局 (DMV) 宣布暂停 Cruise 的无人驾驶出租车业务,撤销了无人驾驶的测试许可。今年 8 月一辆 Cruise 汽车撞上了消防车,导致一人受伤。本月早些时候,一辆汽车将一位行人撞倒在行驶中的 Cruise 汽车前面,汽车探测到了碰撞,停了下来,然后脱离公路,将行人拖曳了大约 20 英尺,当汽车最终停下来时其轮胎可能压在了行人的腿上,视频显示这位行人一直在尖叫求助。美国国家公路交通安全管理局(NHTSA)已对 Cruise 展开调查,调查该公司是否采取足够的预防措施保障行人的安全。加州 DMV 认为允许 Cruise 继续测试对公众不安全。Cruise 如果想要继续运营其出租车业务,汽车上将必须有一位司机。

人工智能
Wilson(42865)
发表于2023年10月25日 23时20分 星期三
来自失眠
芝加哥大学计算机科学教授 Ben Zhao 领导的一个团队开发了一种数据中毒工具 Nightshade,允许艺术家在将作品上传到网上前使用该工具在像素中添加不可见的改动,如果作品被抓取到 AI 训练数据集中,它会导致模型以混乱且不可预测的方式崩溃。该工具旨在反击 AI 公司未经作者许可使用其作品训练 AI 模型的行为。训练数据中毒可能会破坏图像生成模型如 DALL-E、Midjourney 和 Stable Diffusion 的未来迭代,它会导致部分输出无用——狗变成猫,汽车变成牛,诸如此类。相关论文已递交到 Usenix 计算机安全会议接受同行评审。Zhao 表示,他希望数据中毒工具有助于将权力平衡从 AI 公司转向艺术家。他的团队还开发了另一种工具 Glaze,帮助艺术家隐藏个人艺术风格,防止被 AI 公司抓取。它的工作方式与 Nightshade 类似。研究团队计划将 Nightshade 整合到 Glaze 中,并将其开源,让其他人能开发自己的版本。大型 AI 模型使用的训练集可能包含数十亿幅图像,其中的有毒图像越多,造成的破坏就会越大。数据集一旦中毒是很难清理的,它需要公司努力找出并删除每一个损坏的样本。

人工智能
Wilson(42865)
发表于2023年10月25日 15时49分 星期三
来自奇迹男孩与冰霜巨人
英伟达向 SEC 递交文件称,美国政府要求它立即停止向中国出口先进 AI 芯片,而不是原计划的 10 月 17 日起的 30 天后生效。立即限制出口的产品包括 A100、A800、H100、H800 和 L40S,此前列入限制出口的旗舰显卡 RTX 4090 仍然会是 30 天后生效。英伟达称,由于需求强劲,限制向华出口在短期内不会对公司业绩产生显著影响。

人工智能
Wilson(42865)
发表于2023年10月24日 13时02分 星期二
来自外交豁免权
斯坦福大学研究人员发表了《基础模型透明度指数(The Foundation Model Transparency Index)》报告,分析了 OpenAI、Google、Meta、Anthropic 等公司开发的 10 个流行基础模型,用 100 个指标进行了评估。这些指标包括训练数据、劳工实践以及使用的计算量等。结果显示,Meta 的开源模型 Llama 2 得分最高 54/100,OpenAI 的 GPT-4 为 48/100,亚马逊的 Titan 模型得分最低 12/100。研究人员指出,过去三年大模型的透明度在显著下降,原因从企业之间的竞争加剧到 AI 末日的恐慌。OpenAI 放弃了该公司早先对 AI 持有的开放立场,理由是 AI 技术的传播潜在有危险性。研究人员希望企业能增加大模型的透明度,为政府如何监管 AI 模型提供帮助。

人工智能
Wilson(42865)
发表于2023年10月23日 14时09分 星期一
来自苏珊娜之歌
苹果计划在 Siri、Xcode 等产品中整合 AI。苹果已建立了自己的大模型 Ajax,在此基础上还创建了一个聊天机器人服务, 部分工程师称之为“苹果GPT”。下一步的关键是确定该技术是否能应对竞争对手,以及苹果如何将其实际应用到产品中。负责 AI 的高级副总裁 John Giannandrea 的团队正在改进 Siri。这个更智能的 Siri 版本最早可能会在明年准备就绪,但这项技术仍然让人感到担忧,而且苹果的 AI 功能可能需要更长的时间才能在产品线中普及。苹果软件工程团队也在考虑将生成式 AI 集成到 Xcode 等开发工具中,这可以帮助开发人员更快地编写新应用,使其与微软的 GitHub Copilot 等服务保持一致。苹果公司内部正在争论如何部署生成式 AI:完全在设备上运行、基于云运行或介于两者之间。部署在设备上会运行得更快,并有助于保护隐私,但通过云部署大模型将允许更高级的操作。

人工智能
Wilson(42865)
发表于2023年10月20日 17时58分 星期五
来自人性分解
IBM 的研究人员在《科学》期刊上发表论文,提出了受脑启发的芯片架构 NorthPole,它能将计算与记忆相结合,并以低能耗高效地处理数据。自计算机诞生以来,计算过程一直以处理器为中心,记忆内存与计算是分离的。然而在记忆内存和计算之间穿梭传输大量数据会在能耗、处理带宽和速度方面付出高昂的代价。这在新兴的和先进的实时 AI 应用(如脸部识别、物体检测和行为监控等)中尤其明显,这些应用需要快速获取海量数据。因此,大多数现代计算机架构正在迅速达到物理和处理瓶颈,而且鉴于所涉及的能源成本不断增长,其在经济、技术和环境上都面临着无法持续的风险。NorthPole 是一种将计算与记忆内存交织于单个芯片上的神经推理架构,对 ResNet50 的测试显示,它能将每瓦每秒帧数 (FPS) 的能量指标提高 25 倍,每个晶体管的 FPS 的空间指标提高 5 倍,相对于同类技术延迟的时间指标降低 22 倍。

人工智能
Wilson(42865)
发表于2023年10月20日 15时15分 星期五
来自梦境救援
微软、Google、MIT 的研究人员与古腾堡项目合作制作了 5000 本开放授权的有声读物,音频总时长 3.5 万小时,包含了虚构和非虚构类作品,每个人都能找到适合自己的内容。研究人员的论文《Large-Scale Automatic Audiobook Creation》发表在预印本平台 arXiv.org,他们指出,对于视障人士、年轻儿童,甚至语言新手来说,有声读物能“显著提高文学作品的易读性”。这批有声读物 The Project Gutenberg Open Audiobook Collection 可以通过各大平台的播客应用获取。

人工智能
Wilson(42865)
发表于2023年10月18日 23时24分 星期三
来自血族3:永夜
科技领袖周二表示,AI 将对劳动力带来巨大变革,将会消除许多职业,要求社会重新思考人们如何度过时间。从医生到作家的各类专业人士已经在担心 A I会完全取代某些岗位。但 Adobe 的数字媒体业务总裁 David Wadhwani 称,尽管存在相关担忧,但他认为 AI 是一种能促进就业而不是让人失业的工具。他表示,Adobe 的Firefly等工具可以生成图像和标识,让更多人成为创意专业人士。风险资本家 Vinod Khosla 称,目前对 AI 的大多数风投都将赔钱。AI 投资已进入炒作阶段,只有高度自律的投资者才能通过押注这项变革性技术而获利。Khosla 还警告说不要将先进AI模型背后的代码公之于众。一些技术专家主张公开代码可以促进这项技术的发展。他说:“你不会将曼哈顿计划开源。”

人工智能
Wilson(42865)
发表于2023年10月17日 21时32分 星期二
来自奇迹之夏
李彦宏在百度世界 2023 大会上宣布了最新版本的文心大模型4.0,称综合能力“与GPT-4相比毫不逊色”。文心大模型4.0 目前处于邀请测试阶段。李彦宏演示了最新大模型的四大能力的特点与应用场景。在理解能力上,他通过询问公积金异地贷款政策的案例,展示了文心一言对前后乱序、模糊意图、潜台词等复杂提示词的理解力,例如“在北京工作”等同于“在北京缴纳公积金”等,“今天,你说的每一句话,它大概率都能听懂”。在生成能力上,李彦宏展示了文心一言如何在短短几分钟内,根据一张素材图片,迅速生成了一组广告海报、五条广告文案,以及一条营销视频。他还通过解数学题、总结知识点等场景,展示了大模型的逻辑能力;通过数千字的小说撰写和角色、情节设置,体现了大模型的记忆能力;以及数字人医生帮助患者解读药品说明书,来展现四大能力的综合应用。百度表示将基于最新模型更新搜索引擎、地图等应用。和其它提供大模型的国内企业类似,使用大模型都基于实名制。

人工智能
Wilson(42865)
发表于2023年10月16日 18时03分 星期一
来自消失吧!书本
一个国际科学家团队正利用 ChatGPT 背后的技术构建用于科学发现的 AI 工具。该项目被称为 Polymathic AI,研究人员已经在 arXiv 上发表了一系列论文预印本。ChatGPT 是利用从互联网上搜集的文本数据集进行训练,而 Polymathic AI 将从不同科学领域的数值数据和物理模拟进行训练,帮助科学家对从超巨星到地球气候的各种现象进行建模。从已有的预训练大模型开始,而不是从头构建科学模型,要更快更准确。研究人员表示,Polymathic AI 有望展示不同领域之间可能被忽视的共性和联系。

人工智能
Wilson(42865)
发表于2023年10月15日 22时30分 星期日
来自幻想曲
训练 AI 和运行 AI 都是能量密集过程。AI 公司 Hugging Face 报告称,其多语言文本生成 AI 工具在训练期间消耗了约 433 MWH 的电力,足以为 40 个普通美国家庭供电一年。荷兰阿姆斯特丹自由大学的 Alex de Vries 指出,每当 AI 工具生成文本或图像时,它也会使用大量的计算能力和能源。例如 ChatGPT 每天运行可能需要 564 MWH 的电力。虽然,世界各地的公司都在努力提高 AI 硬件和软件的效率,以降低这种工具消耗的能源,但机器效率的提高往往会增加需求。最终,技术进步将导致资源使用的净增加,这种现象被称为杰文斯悖论。De Vries 说:“提高这些工具的效率和易用性的结果可能是,我们允许更多的应用程序和更多的人使用它。”研究人员估计,如果每一次 Google 搜索都使用 AI,每年将需要大约 29.2 TWH 的电力,这相当于爱尔兰一年的用电量。到 2027年全球 AI 相关的用电量预计每年将增加 85~134 TWH。这相当于荷兰、阿根廷、瑞典等国家的年用电量。

人工智能
Wilson(42865)
发表于2023年10月14日 23时48分 星期六
来自其主之声
Herculaneum 纸草卷轴是庞贝附近一座私人别墅图书馆的藏品,因公元 79 年维苏威火山喷发而被掩埋,在高温下碳化。1752 年它们被挖掘出来。它们非常脆弱,处理不当就会变成灰烬。如何阅读无法打开的卷轴?这个问题持续了数百年。2019 年肯塔基大学 EduceLab 的 Brent Seales 教授使用粒子加速器对 Herculaneum 卷轴进行了成像,生成了分辨率达 4 µm 的 3D CT 扫描。他的团队还扫描拍摄了有可见墨水的卷轴碎片。企业家 Nat Friedman 和 Daniel Gross 对该项目产生了兴趣,他们在 2023 年 3 月发起挑战赛 Vesuvius Challenge,奖励能识别卷轴文字的人。8 月参赛者 Casey Handmer 报告在 CT 扫描中发现了看起来像是墨水的“裂纹图案”。SpaceX 暑期实习生 Luke Farritor 开始对裂纹图案训练一个机器学习模型,每一个新裂纹的发现都帮助改进了模型。模型很快揭露了人眼看不见的裂纹痕迹,他发现了卷轴的第一个文字——ΠΟΡΦΥΡΑϹ ——意思是紫色的。他赢得了 4 万美元的 First Letters Prize 奖。另一名参赛者 Youssef Nader 也在同一区域发现了相同文字,她作为第二名赢得了 1 万美元。Casey Handmer 作为墨水痕迹的首位发现者获得了 1 万美元的 First Ink Prize。

人工智能
Wilson(42865)
发表于2023年10月13日 16时19分 星期五
来自凡尔纳地球三部曲
微软本周向 Windows Insiders 测试者推送了新版的绘图应用(Paint app),其中包括了 Paint Cocreator,基于 DALL-E 的 AI 文本图像生成功能,用户可通过简短文字去描述想要生成的内容,选择不同的艺术风格,然后点击 Create。Paint Cocreator 将生成一组图像供用户选择。微软称 AI 图像生成功能内置有内容过滤器,防止生成有害的、冒犯性的或不合适的图像。

人工智能
Wilson(42865)
发表于2023年10月12日 20时11分 星期四
来自泰山和蚁人
Google 通过 Discord 邀请了部分 AI 聊天机器人 Bard 的重度使用用户,一起聊天讨论了 AI 工具的有效性和实用性,Google 的产品经理在讨论期间质疑了大模型的可用性。Bard 高级产品经理 Dominik Rabiej 在 7 月的 Discord 聊天中表示,他的经验法则是,除非能独立验证不要相信大模型的输出结果。负责 Bard 用户体验的 Cathy Pearl 说,他认为最大的挑战是,就有用性而言,大模型最擅长什么。Rabiej 则建议将 Bard 作为“创意/头脑风暴应用”使用,也可以将 Bard 用于辅助编程,因为编程的话用户肯定需要检查代码是否有效。