solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2025年04月14日 14时58分 星期一
来自空中城堡
根据 OpenAI 支持页面“API Organization Verification”,OpenAI 可能很快要求组织完成身份验证才能访问某些先进 AI 模型。验证需要 OpenAI API 所支持的国家政府签发的身份证件。OpenAI 表示一个身份证件每 90 天只能验证一个组织,而且不是所有组织都有资格进行验证。OpenAI 声称此举是为了减少 AI 的不安全使用。它的一个目的可能是防止 IP 盗窃。DeepSeek 此前被指使用 OpenAI API 训练了它的模型,这违反了 OpenAI 的政策。

人工智能
Wilson(42865)
发表于2025年04月13日 22时27分 星期日
来自科玛
Google 在 AI 领域长期以来一直是领先者,今天流行的大模型就是基于 Google 研究员发表的 Transformers 论文。过去几年 OpenAI 等后起之秀的成就让 Google 相形见绌。但随着 Gemini 2.5 的发布,Google 如今再次超越了所有竞争对手。Gemini 2.5 Pro Experimental 在 LMArena、GPQA Diamond、Humanity's Last Exam 和 AIME (数学竞赛)等测试中都高居第一,它在创意写作中也表现出色。使用过多种 AI 工具用户也报告 Gemini 2.5 Pro 是目前最出色的大模型。Gemini 2.5 不仅反应迅速也非常便宜,其上下文窗口高达 100 万 tokens。Google 的开源模型 Gemma 3 也能媲美顶尖的开源模型如 Llama 4 和 DeepSeek-V3。

人工智能
Wilson(42865)
发表于2025年04月11日 23时01分 星期五
来自科玛
AI 购物应用 Nate 的创始人、前 CEO Albert Saniger 被控欺诈投资者。Nate 成立于 2018 年,从 Coatue 和 Forerunner Ventures 等投资者筹集了逾 5000 万美元,2021 年完成了由 Renegade Partners 领投的 3800 万美元 A 轮融资。Nate 声称,在 AI 的帮助下其应用的用户只需点击一下即可在任何电商网站上购物。但起诉书指出,Nate 实际上严重依赖菲律宾呼叫中心的数百名合同工手动完成购买操作。Saniger 声称 Nate 能“无需人工干预”进行在线交易,除非出现 AI 无法完成交易的极端情况。但美国司法部称,尽管 Nate 获得了一些 AI 技术并聘用了数据科学家,但其应用的真实自动化率实际上为 0%。

人工智能
Wilson(42865)
发表于2025年04月11日 22时30分 星期五
来自没有你的天堂
微软开始逐步向 Windows Insiders 推出 Recall 预览版,该功能会每隔数秒保存 Copilot Plus PC 上的屏幕截图,在本地创造可搜索数字记忆。此举可能表明微软真的准备向更多用户推出受争议的 Recall 功能了。微软原计划于去年 6 月与 Copilot Plus PC 一起推出 Recall,但由于隐私和安全方面的担忧,该功能推迟推出。微软之后计划于 10 月推出该功能,但为了提供“安全可靠的体验”,该计划也被推迟了。

人工智能
Wilson(42865)
发表于2025年04月10日 14时56分 星期四
来自水刀子
Google 宣布了第七代 TPU 处理器 Ironwood。TPU 代表 Tensor Processing Unit,是 Google 内部开发的专门用于加速机器学习的 ASIC 处理器。第一代 TPUv1 于 2016 年推出。TPU v7(Ironwood)据报道是专门为满足推理等大模型新兴需求而设计的。Google 最新的大模型 Gemini 2.5 运行在上一代的 TPU v6(Trillium)上,Google 表示 Ironwood 更高的推理速度和效率将为更多的突破奠定了基础。Ironwood 的峰值吞吐量为 4,614 TFLOPs。

人工智能
Wilson(42865)
发表于2025年04月08日 18时03分 星期二
来自追光的孩子
根据斯坦福最新的 2025 年 AI 指数报告,中美顶级 AI 模型的性能差距已缩小到了 0.3%,而在 2023 年差距是 20%,中国模型正在快速追赶美国的领先地位。从行业主导企业来看,美国仍然领先于中国。在 2024 年 90% 的知名 AI 模型来自企业,美国以 40 个模型领先,中国有 15 个。更明显的一个趋势是如今大模型的性能已经趋同。在 2024 年,TOP1 和 TOP10 的模型的差距能有 12%,如今差距已经越来越小,锐减至 5%。

人工智能
Wilson(42865)
发表于2025年04月07日 22时30分 星期一
来自平行恋人
多数美国普通民众不相信 AI 能改善他们的生活,AI 专家则乐观得多。皮尤研究中心调查了 5410 普通民众和 1013 名 AI 专家对 AI 的态度。结果显示,56% 的 AI 专家相信 AI 将在未来 20 年对美国产生非常或相当积极的影响,在普通民众中间这一比例仅为 17%;76% 的专家认为 AI 将让他们个人受益而不是伤害他们。只有 11% 的民众对 AI 在日常生活中使用增加感到兴奋多于担忧,51% 更感到担忧,只有 24% 的民众认为 AI 能让他们受益,近半数民众认为 AI 会伤害他们。

人工智能
Wilson(42865)
发表于2025年04月07日 11时31分 星期一
来自洛基启示录
Midjourney 在时隔一年多之后发布新模型 V7,目前以 alpha 形式提供给用户。V7 改进了图像生成,为手、手指、身体部位和“各种对象”提供了更高的连贯性和一致性,还能提供细节更丰富和逼真的纹理和材质。V7 还提供了新工具和工作流,其中之一是用于迭代和探索的 Draft Mode,费用只需一半但渲染速度提高十倍。V7 有两种模式——turbo 和 relax,其中 turbo 能更快生成最终图像,但费用提高了一倍;而 relax 生成图像的速度很慢,但费用也低。Midjourney 是最早广泛使用的 AI 图像生成工具之一。最初只通过 Discord 提供给用户,现在有了 Web 版本。

人工智能
Wilson(42865)
发表于2025年04月06日 23时11分 星期日
来自时间的地图
Meta 宣布了其最新的开放权重原生多模模型 Llama 4 Scout 和 Llama 4 Maverick。新模型使用了混合专家架构(mixture-of-experts)构建,每个有 170 亿活跃参数。Llama 4 Scout 有 16 个专家,适合单个 NVIDIA H100 GPU,提供了 1000 万上下文窗口,性能强于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。Llama 4 Maverick 有 128 个专家,在基准测试中超过 GPT-4o 和 Gemini 2.0 Flash,在 LMArena 的 ELO 得分为 1417,它适合单台 H100 主机。Meta 还训练了一个教师模型 Llama 4 Behemoth,它有 16 个专家和 2880 亿个活跃参数,在多项 STEM 测试中超过了 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro,该模型仍然在训练中。最新模型通过 llama.com 和 Hugging Face 提供下载。

人工智能
Wilson(42865)
发表于2025年04月03日 17时41分 星期四
来自星空暗流
微软 CTO Kevin Scott 预测五年内 95% 的代码将由 AI 生成。他表示,AI 不会取代软件工程师,但会改变他们的角色。“这并不意味着 AI 在做软件工程工作……作者仍然是人类。” Scott 称开发者的工作将从直接编写代码转变为通过提示和指令指导 AI,“我们从输入大师(编程语言)转变为提示大师(AI 协调者)。”

人工智能
Wilson(42865)
发表于2025年04月02日 15时42分 星期三
来自机械人生
AI Disclosures Project 发表的一篇论文认为,OpenAI 很可能未经授权使用 O'Reilly 书籍训练 GPT-4o 模型。AI Disclosures Project 由 O'Reilly Media CEO Tim O'Reilly 联合创办,它使用了名叫 DE-COP 的方法检测大语言模型训练数据中的版权内容。研究人员分析了 34 本 O'Reilly 书籍中的 13,962 个段落摘录,发现 GPT-4o “识别”的付费内容比 GPT-3.5 Turbo 等旧模型多得多。这项技术也被称为“成员推理攻击(membership inference attack)”,用于测试模型是否能可靠区分人类创作的文本和转述版本。

人工智能
Wilson(42865)
发表于2025年04月01日 23时59分 星期二
来自寻龙公主2:笼中王后
为了在竞争激烈的 AI 领域保持竞争优势,Google DeepMind 采取了推迟发表 AI 论文的策略。诺奖得主 Sir Demis Hassabis 领导的团队引入了更严格的审查程序和更多的官僚主义,增加了 AI 论文的发表难度。该团队最不愿意发表的是可能会被竞争对手利用的论文,或者凸显 Google Gemini AI 模型相比其它模型处于劣势的文章。Google 研究人员在 2017 年发表了 Transformers 论文,奠定了今天流行的大模型的基础,但它也将最初的领先优势让给了 OpenAI 等竞争对手。为了防止再次发生类似的事件,DeepMind 对具有战略意义的论文实施六个月的出版禁令。一位前研究员表示,如果不能发表论文,对研究员而言这是职业生涯的“杀手”。

人工智能
Wilson(42865)
发表于2025年04月01日 17时49分 星期二
来自特辖军的一天
Google 上周向付费用户提供了其最新最先进的模型 Gemini 2.5,本周它开始向免费用户(有地区限制)提供了 Gemini 2.5 Pro (Experimental)。当然免费用户的使用是受到限制的,可能输入几次提示词就达到了限额。Gemini 2.5 支持模拟推理,能避免大模型常见的错误,目前它在 LMSYS Chatbot 排行榜中位居第一,排名第二的是 OpenAI 的 ChatGPT-4o-latest (2025-03-26),之后是 Grok-3-Preview-02-24、GPT-4.5-Preview、Gemini-2.0-Flash-Thinking-Exp-01-21、Gemini-2.0-Pro-Exp-02-05、DeepSeek-V3-0324 和 DeepSeek-R1。

人工智能
Wilson(42865)
发表于2025年03月29日 20时48分 星期六
来自电动新世纪
1 月 19 日,旧金山发生了首起涉及完全自主驾驶汽车的致命车祸。涉及的无人驾驶汽车来自 Waymo,但车祸不是 Waymo 的错。是人类司机高速追尾导致六车连环相撞,造成一人死亡五人受伤,一条狗也在事故中死亡。这是典型的 Waymo 车祸。绝大多数车祸中它都严格遵守交通规则,但人类司机却违反规则、超速、闯红灯、偏离车道诸如此类。自 2020 年以来,Waymo 报告了约 60 起严重到触发安全气囊或造成伤害的事故,而 Waymo 的行驶里程至今超过了 5000 万英里。根据 Waymo 的估计,如果是人类司机,那么相似的里程人类的车祸频率要高得多严重得多。

人工智能
2
Wilson(42865)
发表于2025年03月28日 23时08分 星期五
来自心灵之眼
在 AI 热下,Xiao Li 在 2023 年从一名房地产承包商跨行转为数据中心项目经理。一年前,他从微信群里看到大量英伟达 GPU 的芯片交易。交易商吹嘘能通过走私搞到被限制出口的英伟达 GPU。当时一块英伟达 H100 能卖出 20 万元。如今他的微信群里开始讲述不同的故事。AI 芯片的交易更谨慎,价格也回落了。两个数据中心项目因难以从投资者手中获得更多资金而被迫抛售 GPU。根据实地采访,很多运营 AI 数据中心的企业正陷入困境。36 氪等媒体报道,新建计算资源中高达八成未被使用。向 AI 公司出租英伟达 GPU 去训练大模型本被视为是一笔包赚的生意。然而随着 DeepSeek 的崛起以及 AI 周边经济形势的突变,该行业处于衰退之中。因为缺乏经验以及过度炒作,数据中心变成了不良资产。市场研究公司 KZ Consulting 称,2023 年和 2024 年,从内蒙古到广东,各地宣布了 500 多个新数据中心项目。中国通信工业协会数据中心委员会称,到 2024 年底,至少有 150 个新建数据中心建成并投入运营。国有企业、上市公司和国有基金纷纷投资建造 AI 数据中心。在 2024 年初有超过 144 家公司在网信办注册开发大模型,但到了年底只剩下 10% 的公司还在继续投资。DeepSeek 的 R1 和 OpenAI 的 ChatGPT o1 和 o3 等推理模型的兴起改变了企业对数据中心的需求。推理性能对延迟有高要求,意味着数据中心需要建造在相关 AI 企业附近,这意味着很多建造在中西部和农村地区的数据中心对 AI 公司没有什么吸引力。此外大多数数据中心是为训练大模型而不是推理优化的。推理使用的硬件也与训练使用的硬件有很多不同。在此背景下,GPU 租赁价格降至历史最低水平。一台配置了 8 个 GPU 的英伟达 H100 服务器的月租金从 18 万元的高位降至 7.5 万元。由于高昂的电费和维护费用,一些数据中心宁愿空置。

人工智能
Wilson(42865)
发表于2025年03月28日 22时33分 星期五
来自洛基启示录
哥伦比亚大学对开发 AI 工具帮助面试者在编程问题中作弊的学生 Chungin“Roy”Lee 做出了停学的处罚。Lee 开发了 AI 工具 Interview Coder,帮助求职者在面试中完成编程相关的问题。该工具的月费为 60 美元。去年 12 月 Lee 发布了一则在亚马逊面试中使用 Interview Coder 的视频,之后被举报到学校,被纳入学校的纪律处分程序,出席了学校的听证会。在第一次听证会后,学校对他做出了留校察看的处罚。现在处罚加重。Lee 认为该工具能为他每年赚取约 200 万美元的收入。被停学后他准备直接去旧金山。

人工智能
Wilson(42865)
发表于2025年03月28日 15时34分 星期五
来自挽救计划
OpenAI ChatGPT 的新功能催生出一场吉卜力工作室动画风格图像的生成热潮。OpenAI CEO 奥尔特曼也将 X 平台(原推特)头像换成了吉卜力风格的图像,上传至社交平台(SNS)的此类生成图像层出不穷,但也有人担心这会引发著作权问题。部分美国媒体指出,新功能使得“复制著作权受保护作品的风格变得更加容易”。报道同时指出,知识产权专家认为在法律上这属于“灰色地带”,可能会引发著作权纠纷。

人工智能
Wilson(42865)
发表于2025年03月25日 23时37分 星期二
来自蓝火星
AI 创业公司零一万物 CEO 李开复表示,在 AI 的部分领域中美之间的差距仅为三个月。他说,“以前我认为差距是六到九个月,而且是全方面落后。现在我认为,在部分核心技术上可能落后三个月,在某些特定领域实际上处于领先位置。”李开复称 DeepSeek 的成功表明中国在基础设施软件工程等领域领先。李开复还认为,美国限制向中国出口先进 AI 芯片是一把双刃剑,促使中国公司进行创新。

人工智能
Wilson(42865)
发表于2025年03月25日 21时26分 星期二
来自羊皮纸迷踪
AI 技术对电力的狂热需求可以上溯到 2012 年的 AlexNet。当时多伦多大学的 AI 研究员 Alex Krizhevsky、 Ilya Sutskever 和 Geoffrey E. Hinton 正在为图像识别竞赛 ImageNet LSRVC 开发一种卷积神经网络。在当时图像识别是非常有挑战性的。研究人员认为他们需要一个庞大的神经网络,该网络以首席研究员的名字命名为 AlexNet,它有超过 6000 万参数和 65 万个神经元。但一大问题是如此大的神经网络如何进行训练?他们的实验室里有几张英伟达 GTX 580 显卡,每张配备了 3GB 显存,但 AlexNet 太大没办法加载到单张显卡上。研究人员设法将训练阶段划分到两张并行工作的 GPU 上——一半神经元在一张 GPU 上,另一半在另一张上运行。AlexNet 以压倒性优势赢得了 2012 年的比赛,从此 AI 模型的规模不再受限于单张显卡了,而妖精也从瓶子里释放了出来。在 AlexNet 之后,越来越强大的 AI 模型需要成千上万张 GPU。根据 Electric Power Research Institute (EPRI)的报告,2010 年到 2020 年间数据中心的功耗相对平稳,原因是英伟达数据中心 GPU 的功耗同期提升了大约 15 倍,因此能保持数据中心功耗的稳定。到了 2022 年基于 transformer 的大模型的出现推动了数据中心功耗的大幅提升。大模型需要处理数百亿甚至数千亿个神经元,训练之后的推理阶段还需要处理大量数据。Open AI 在训练新模型时使用了超过 25,000 张英伟达 Ampere 100 GPU,持续了 100 天,耗电量 50 GW 时,足以满足一个中型城镇一年的电力需求。根据 Google 的数据,训练占 AI 模型生命周期总耗电量的四成,剩下的六成是推理。功耗的飙升促使科学家思考如何在不牺牲性能的情况下减少内存和计算要求。研究人员尝试了模型剪枝、量化等优化方法。

人工智能
Wilson(42865)
发表于2025年03月25日 16时08分 星期二
来自冰上斯芬克斯
Google 和计算机历史博物馆联合公布了 AlexNet 的源代码,代码发布在博物馆的 GitHub 账户上,采用 BSD 2-Clause "Simplified" 许可证。AlexNet 是一种卷积神经网络 (CNN),它在 2012 年发布时被认为改变了 AI 领域,代表着深度学习能做到传统 AI 技术无法做到的事情,在 AI 发展中具有里程碑意义。AlexNet 能以接近人类的正确率准确识别照片中的物体。它源自多伦多大学研究生 Alex Krizhevsky、Ilya Sutskever 及其导师 Geoffrey Hinton 的工作,证明深度学习能胜过传统的计算机视觉方法。Google 在 2013 年收购了研究团队创办的 DNNresearch 公司,从而拥有了其知识产权。