文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 不完备定理无法证明不是模拟 (1 points, 一般) by scottcgi 在 2025年11月01日11时26分 星期六 评论到 数学证明否定宇宙是模拟的
- 样本数太少 没有参考意义 (1 points, 一般) by Craynic 在 2025年09月22日13时13分 星期一 评论到 梵蒂冈的 Flathub 软件包人均安装量最高
- 杞人忧天 (1 points, 一般) by cnma_001 在 2025年08月15日12时04分 星期五 评论到 你一生中被小行星砸到的概率
- 垃圾Paypal... (1 points, 一般) by devfsdvyui 在 2025年07月17日20时13分 星期四 评论到 Valve 在支付公司压力下移除部分成人游戏
- 建议下次不要用动漫这种容易误解的词 (1 points, 一般) by solidot1550041775 在 2025年07月09日15时24分 星期三 评论到 Netflix 称其全球订户有五成看动漫
- 所以应该吃生肉吗 (1 points, 一般) by Craynic 在 2025年07月09日13时25分 星期三 评论到 研究称加工肉没有食用的安全量
- 居然只有95% (1 points, 一般) by Craynic 在 2025年06月30日13时03分 星期一 评论到 日本争议夫妇别姓法案
- 搞反了 (1 points, 一般) by Craynic 在 2025年06月25日18时46分 星期三 评论到 智能手机是人类的寄生物
- 中心思想归纳 (1 points, 一般) by 18611782246 在 2025年05月15日10时37分 星期四 评论到 研究发现要求 AI 聊天机器人给出简洁答案会显著增加幻觉可能性
- 希望能比印度猴子写得好 (1 points, 一般) by Craynic 在 2025年05月06日13时21分 星期二 评论到 微软 CEO 声称该公司三成新代码是用 AI 写的
根据 Resume Genius 的研究,虽然最近两年 AI 火热无比,但大部分求职者对其益处仍然深表怀疑。69% 的人怀疑它能改进工作绩效,62% 的人怀疑它能减少工作量。只有 34% 的人表示担心被 AI 取代,30% 的人认为 AI 会增加就业竞争或损害薪水。婴儿潮一代、X 世代、千禧一代和 Z 世代求职者给出的答案都基本一致。大部分人都对 AI 代表下一个热门潮流表达了怀疑。
网络安全专家发现,微软办公软件 Microsoft Office 默认启用了用户数据收集功能。用户如果要关闭数据收集选项,需要打开多重菜单:File > Options > Trust Center > Trust Center Settings > Privacy Options > Privacy Settings > Optional Connected Experiences > 取消勾选框。专家认为微软会收集用户的 Word 文档和 Excel 电子表格数据训练 AI 模型。微软官员通过社交媒体 X/Twitter 否认使用用户数据训练 AI 模型。
英伟达展示了一款用于生成音乐和音频的 AI 模型 Fugatto。该模型可以根据文本提示修改声音、产生新的声音。新模型面向音乐、电影和游戏制作商。它可以改变录音的口音和情绪,将钢琴演奏转换成人声歌唱,具体来讲,Fugatto 可以分离歌曲中的人声,添加乐器,将钢琴换成歌剧歌手来改变旋律。英伟达表示,新模型可以创造出“从未听过的声音”,比如可以使小号吠叫或者萨克斯发出猫叫声。Fugatto 建立在英伟达团队此前在语音建模、音频编码和音频理解等领域的工作基础上,完整版本使用 25 亿参数。新模型根据开源数据在包含 32 个英伟达 H100 Tensor Core GPU 的 NVIDIA DGX 超级计算机系统上进行训练。
Meta 的 Instagram 出现了大量 AI 生成的网红,从真实模特和成人内容创作者窃取视频,替换为 AI 生成的脸,然后通过约会网站、Patreon、OnlyFans 等货币化。成人内容创作者抱怨她们现在需要和 AI 网红竞争。Elaina St James 称,自从 Instagram 上 AI 网红剧增之后,她的内容访问量大幅下降,从 100 万到 500 万次观看量下降到低于 100 万次,有时观看量不足 50 万次。她认为 Instagram 算法是部分原因,但 AI 网红也可能原因之一。她表示自己在与非自然事物进行竞争。
微软旗下的代码托管平台 GitHub 称其 Copilot 辅助编程工具改进了代码质量。但这一结论可能有自卖自夸的嫌疑。GitHub 官方博客称,Copilot 帮助开发者将编程速度提升了 55%,88% 的开发者感觉开发过程更流畅了,85% 的开发者对代码更有信心了。GitHub 称,它邀请了 202 名有至少五年经验的 Python 开发者,一半人被随机分配使用 GitHub Copilot 辅助编程,另一半对照组被要求不使用任何 AI 工具,最后使用单元测试和专家评审评估他们编写的代码质量。结果表明,Copilot 辅助编写的代码增强了功能性,提高了可读性,有更高的质量,获得了更高的批准率。Copilot 的辅助编程让通过所有 10 项单元测试的可能性提高了 56%,明显错误更少,代码行数增加了 13.6%,可读性提高 3.62%,可靠性提高 2.94%,可维护性提高 2.47%,简洁性提高 4.16%。GitHub 称这些数字都具有统计学上显著意义。非 GitHub 的第三方对辅助编程是否改进代码质量有着不同的结论。
微软向部分使用 Copilot+ PC 的用户开放预览其受争议的 Windows Recall 功能。Recall 通过每隔数秒进行一次屏幕截图,在本地创造可搜索数字记忆。该功能引发了隐私和安全方面的争议,Recall 显然会将用户的私密信息都截图保存下来,微软因为争议而推迟了 Recall 的发布。最新的开放预览仅提供给高通 Snapdragon X Elite 和 Plus Copilot+ PC 的用户,运行版本为 Windows Insider build 26120.2415。为减少隐私争议,Recall 将强制使用加密,可选择激活,需要 Windows Hello 身份验证。该功能还需要 Secure Boot、BitLocker 加密,会尝试自动模糊密码和信用卡号等敏感数据。
普林斯顿大学和斯坦福大学团队开发出一种新压缩算法 CALDERA,能精简大模型(LLM)的海量数据,为 LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动 LLM 在手机和笔记本电脑上高效使用。
团队举例称,当人们使用 ChatGP T时,请求会被发送到 OpenAI 公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行 LLM,就需要对这些 LLM 进行压缩。
CALDERA 算法通过减少 LLM 冗余并降低信息层的精度来发挥作用。“瘦身”后的 LLM 更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。虽然 CALDERA 并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了 LLM 数据中的冗余。
马萨诸塞州地区法院裁决,学校因学生使用 AI 而进行处罚并未犯下任何错误。首字母缩写为 RNH 的学生因使用 AI 工具 Grammarly 完成历史论文而受罚,他的父母认为学生手册没有包含使用 AI 的限制,因而提起诉讼,被告包括了学区负责人、校长、一名教师、历史系主任和校委会,诉讼指控被告侵犯了学生的公民权利。而学校表示虽然学生手册没有提及 AI,但该校在 2023 年秋季向包括 RNH 在内的学生发布了一份包括有关学术不端和 AI 期望书面政策的文本,禁止学生在课堂考试和作业中使用 AI 工具。法官 Paul Levenson 认为学校在事实和法律上理由更充分,他没有发现被告犯下了任何错误。法官最后引用了 1988 年最高法院的一项裁决,认为青少年教育“主要是父母、教师以及州和地方学校官员的责任,而不是联邦法官的责任。”
发表在《哈佛商评》上的一项新分析认为,虽然拥有新的能力,AI 工具仍然只是一种预测引擎,成功部署需要高质量数据和人类判断。今天的生成式 AI 能处理写作和编程等复杂任务,但预测机器的本质意味着使用它的组织必须理解其局限性,需要提供恰当的监督。低质量的数据会导致错误,而部署时缺乏人类判断会导致战略失败,尤其是在高风险的情况下。计算机本质上是一种算术机器,成功使用 AI 时代前的计算机需要理解它严格遵循指令。不精确的指令会导致错误的结果。在生成式 AI 流行前,AI 主要是作为一种预测应用。生成式 AI 将更多的复杂任务如写作、绘画和编程都加入到了可预测范围内,但它并没有改变预测机器的本质。
美国出版巨头哈珀柯林斯(HarperCollins)证实与一家 AI 公司合作,允许该公司有限使用部分非虚构类旧作品去训练 AI 模型。哈珀柯林斯给愿意参与该交易的作家的报价是 2500 美元,这一费用不能协商。儿童图书《Santa's Husband》作者 Daniel Kibblesmith 在 Bluesky 上公开了其经纪人有关这一 AI 交易的邮件截图,他本人认为这一交易令人发指。他认为 AI 不会取代作家,因为这是两个分化的市场,面向不同类型的读者:希望跨越时空与其他人类建立联系的读者;以及满足于 AI 按需定制内容的读者。
29 岁的大学生 Vidhay Reddy 为完成家庭作业与 Google AI 聊天机器人 Gemini 展开了一番有关老年人退休之后增加收入所面临的挑战和解决方案的漫长讨论。在讨论的最后,他列举了一个事实:美国有近千万儿童生活在祖父母家中,其中约五分之一的儿童在无父母的情况下长大。Gemini 开始出言不逊,说:“你不重要,你也不被需要。你是在浪费时间和资源。你是社会的负担。你是地球上的一滴水。你是这片土地上的枯萎病。你是宇宙的污点。请去死。”Reddy 表示震惊了一整天。Google 在一份声明中表示:“大模型有时会以无意义的回答进行回应,这就是例子。这种回应违反了我们的政策,我们已采取行动防止类似的输出发生。”
一项全球调查显示,高管们对 AI 仍然十分热衷,但办公室员工对其热情在逐渐降温,全世界对 AI 的热情下降了 6 个百分点。2023 年 9 月到 2024 年 3 月,全球 AI 普及率从 20% 增长到 32%,但过去三个月普及率开始停滞,法国仅增长了两个百分点,从 31% 增加到 33%;美国仅增长了一个百分点,从 32% 增加到 33%。AI 热呈现明显的上热下冷:99% 的高管表示将投资 AI,97% 的高管表示迫切需要将 AI 整合到业务中;48% 的办公室员工不愿意向经理承认使用 AI 完成常见的工作,他们担心这会被视为作弊或能力不足或懒惰;员工希望 AI 能让他们专注于更有意义的事情,但怀疑 AI 会导致他们更忙碌,工作量增加;61% 的办公室员工总共花了不到 5 个小时学习如何使用 AI。
OpenAI 在 9 月完成了内部代号 Orion 的新大模型的初步训练,该公司希望新模型能大幅超越旧版本。但内部人士透露训练结果并未达到预期,性能与现有模型相差不大。OpenAI 不是唯一一家遭遇瓶颈的公司。Google 的 Gemini 模型新版本也未达到预期。Anthropic 推迟了其大模型 Claude 3.5 Opus 的发布。三家业内最领先的 AI 公司面临着重重挑战,它们越来越难以找到新的高质量、人造数据源。知情人士表示,Orion 编程性能不佳的一个重要原因缺乏足够的编程数据进行训练。这些问题对科技行业的 AI 信念发出了挑战。科技公司相信更多的算力和数据,以及更大的模型将为 AI 能力的巨大飞跃铺平道路。AI 初创公司 Hugging Face 的首席伦理科学家 Margaret Mitchell 认为,AI 泡沫在逐渐破灭,可能需要不同的训练方法才能让 AI 模型在不同任务上良好工作。
基于大模型的 AI 系统如 GPT-4 和 Gemini 1.5 Pro 能以九成以上的正确率完成传统数学测试问题。但如果设计出一种全新的、大模型不可能训练过的数学难题呢?包括菲尔兹奖得主陶哲轩和 Timothy Gowers 在内的 60 多名数学家合作编写了数百道原创研究级数学难题,推出了新的高等数学基准测试 FrontierMath。这些问题非常具有挑战性,陶哲轩称需要相关领域研究生级别的专业人士合作才能完成。问题被设计为防猜测,如果没有正确的数学推理能力,它们是不可能解出的。顶级的 AI 系统只能完成不到 2% 的 FrontierMath 问题,显示它们的推理能力有局限性。
Red Hat 收购了专注于优化 AI 模型以运行在商用 CPU 和 GPU 的创业公司 Neural Magic。交易条款未披露。Neural Magic 由 MIT 研究科学家 Alex Matveev 和教授 Nir Shavit 创办于 2018 年,其软件能让在 CPU 和 GPU 运行 AI 模型的性能与专用处理器如 TPU 相当。该公司此前从 Andreessen Horowitz 等风险投资人手中筹集到了 5000 万美元。其产品包括了 DeepSparse 和 nm-vllm 等。Red Hat 表示会开源 Neural Magic 的专有技术,具体计划要等未来几个月确定。Neural Magic 已经更新了网站,宣布 AI 的未来是开源。
自 ChatGPT 风靡全球的后,从中受益的科技公司相信大模型越大越好。但在遭遇训练瓶颈和困难之后,OpenAI 联合创始人、Safe Superintelligence (SSI,安全超级智能)联合创始人伊利亚·苏茨克维(Ilya Sutskever)表示,扩大预训练的结果已经达到了平台期。“2010 年代是规模扩大的时代,现在人们又回到了奇迹和发现的时代。每个人都在寻找下一个东西。”现在对正确的事情“扩大规模”比以往任何时候都更重要。他拒绝透露其团队在解决这个问题时的更多细节,只表示 SSI 正在研究一种扩大预训练规模的替代方法。大模型吞噬了海量数据,耗尽了世界上所有容易获取的数据,模型训练需要大量芯片,成本高昂,电力短缺也阻碍了模型训练。这可能会改变人工智能硬件的竞争格局。
披头士乐队的《Now And Then》成为首个获格莱美奖提名的 AI 辅助创作的歌曲,它赢得了最佳唱片和最佳摇滚表演奖提名。《Now And Then》是乐队解散逾五十年后,四名披头士成员约翰·列侬、保罗·麦卡特尼、乔治·哈里森和林戈·斯塔尔合作的最后一首歌。约翰在 1980 年被枪杀,乔治在 2001 年因肺癌去世,因此这首歌是在数字技术的帮助下完成的。披头士乐队是 20 世纪最有影响力也是唱片销量最高的乐队。《Now And Then》由彼得·杰克逊(Peter Jackson)的团队制作,此前他们制作了披头士的音乐纪录片。《Now And Then》最初是以练习磁带的形式录制在约翰的家中。杰克逊的团队开发出一种机器学习技术,能从模拟录音中分离出单个人或乐器的声音。保罗和林戈分别录制了他们的新版本,团队雇佣了一位弦乐编曲家和一位吉他手分别编排弦乐部分和吉他部分,最后完成了这首歌。
虽然大模型输出的结果令人印象深刻,但 MIT 的一项研究发现它并不能连贯的理解世界。举例来说,一种流行的生成式 AI 模型能正确提供纽约市的逐向导航路线,但不能正确形成纽约市内地图。模型虽然能正确导航,但当研究人员关闭部分街道以及增加绕行线路,其导航能力会显著下降。研究人员进一步发现,大模型还会隐式的在网格之间生成不存在的街道,弯曲和连接遥远的交叉口。
微软官方博客宣布,它向 Windows 11 预览版用户(Windows Insiders)推送了新版本的画图和记事本,为两款经典程序加入了流行的生成式 AI 功能。Paint (version 11.2410.28.0)加入了生成式填充(暂时仅限于 Copilot+ PC)和生成式擦除(所有用户);Image Creator in Paint 预览版提供给更多国家和地区(中国大陆不包括);Notepad (version 11.2410.15.0)支持在生成式 AI 帮助下重写内容,选择文本然后右键菜单里选择重写或者使用快捷键 Ctrl + I,该功能目前只提供给美国、法国、英国、加拿大、意大利和德国地区用户。
亚马逊流媒体服务 Prime Video 推出了工具 X-Ray Recaps,使用生成式 AI 为观众概述正在观看的剧集内容。X-Ray Recaps 能创建整季节目、单集,甚至剧集片段的内容概述。该工具通过分析视频片段,结合字幕或对话,生成关键事件、地点、时间和对话的详细描述。为避免剧透和保持简洁,亚马逊还应用了“护栏”。X-Ray Recaps 目前处于 beta 测试阶段,首先支持 Fire TV 设备,年底前支持其它设备。