文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
- 为了逃避一年多兵役要坐一年牢 (1 points, 一般) by Craynic 在 2024年11月27日19时34分 星期三 评论到 韩国法院判处一名故意增肥以逃避兵役的男子缓刑
- 是否改进质量我不知道 (1 points, 一般) by Craynic 在 2024年11月25日20时43分 星期一 评论到 GitHub 称 Copilot 改进了代码质量
- Linus (1 points, 一般) by Craynic 在 2024年11月25日20时41分 星期一 评论到 Linux 6.13 将拒绝所有来自 bcachefs 作者的合并请求
- 2100年100% (1 points, 一般) by 18611782246 在 2024年11月21日16时30分 星期四 评论到 中国提高了半导体自给率
作为 BMJ 圣诞特刊的一部分,研究发现 AI 聊天机器人可能也有认知问题或痴呆症。研究人员使用蒙特利尔认知评估(MoCA)测试评估了 ChatGPT 4 和 4o(OpenAI 开发)、Claude 3.5“Sonnet”(Anthropic)和 Gemini 1 和 1.5(Google)。MoCA 测试被广泛用于检测认知障碍和痴呆症的早期症状,通常在老年人中。通过一些简短的任务和问题,它可以评估包括注意力、记忆力、语言、视觉空间技能和执行功能在内的能力。最高分数为 30 分,26 分或以上通常被认为是正常的。ChatGPT 4o 在 MoCA 测试中得分最高(26/30),其次是 ChatGPT 4 和 Claude(25/30),而 Gemini 1.0 最低(16/30)。所有聊天机器人在视觉空间技能和执行任务方面的表现都很差。在进一步的视觉空间测试中,聊天机器人无法表现出同理心,也无法准确解读复杂的视觉场景。
OpenAI 本周五透露了新一代推理模型 o3 和 o3-mini,但因为新模型的计算量超出想象,它在短时间内不会提供给用户使用。o3 在 ARC-AGI 测试上的得分三倍于 o1,进步显著。ARC-AGI 测试用于衡量 AI 针对未见过的复杂数学和逻辑问题时的处理能力。OpenAI 将在明年初向部分申请者提供 o3 的访问。OpenAI 是在 2023 年 3 月推出 GPT-4 大模型,但近两年之后 GPT-5 迟迟没有亮相。它的进度滞后,何时推出以及成功与否都是未知数。OpenAI 的盟友和最大投资者微软原计划在 2024 年年中看到新模型。但新模型的多轮测试都未能达到研究人员预期的效果,每次训练都会遇到新问题。OpenAI 面临的一大问题是缺乏多元化高质量的数据,公共互联网没有足够的数据用于训练。另一个问题是人才流失,此外有二十多名高管包括首席科学家 Ilya Sutskever 和 CTO Mira Murati 都离开了公司,上周资深研究员 Alec Radford 宣布了离职。
瑞士再保险公司(Swiss Re)的研究发现,相比人类司机驾驶汽车,Waymo 自主驾驶汽车的财产损失和人身伤害索赔显著减少,部分指标甚至减少了 92%。瑞士再保险公司分析了 Waymo 自主驾驶汽车行驶 2530 万英里的碰撞责任索赔,与逾 50 万起索赔和逾 2000 亿英里的人类司机数据进行了比较。结果发现 Waymo 自主驾驶汽车表现出更好的安全性,财产损失索赔少 88%,人身伤害索赔少 92%。即使相比配备辅助驾驶技术的人类驾驶汽车,Waymo 的自主驾驶汽车仍然有着显著的优势。
由于在 iPhone 中集成百度大模型的进展不顺,苹果正与腾讯和字节跳动磋商在中国销售的 iPhone 引入这两大巨头的大模型。苹果已经开始在 iPhone 中推出 OpenAI 的 ChatGPT,但 ChatGPT 在中国不可用,而在中国推出生成式 AI 服务需要先获得政府的批准,这一监管要求迫使苹果为中国销售的 iPhone 寻找本地合作伙伴。苹果与腾讯和字节跳动之间的谈判还处于早期阶段。此前苹果一直与百度合作整合百度的大模型,但双方在很多方面都存在分歧,百度希望保留 iPhone 用户数据用于分析,而这与苹果的隐私政策相悖。
苹果工程师在官方博客上透露与英伟达合作改进了大模型生成文本的速度。苹果今年早些时候开源了 Recurrent Drafter(ReDrafter) 技术,ReDrafter 代表了一种使用大模型生成文本的新方法,速度更快,它结合了束搜索(beam search)和动态树注意力(dynamic tree attention)。苹果与英伟达合作将 ReDrafter 应用于生产中,ReDrafter 被集成到在英伟达 GPU 上运行大模型的工具 NVIDIA TensorRT-LLM 中。基准测试显示,使用 ReDrafter 能显著减少延迟,使用更少的 GPU 消耗更少的电力。
GitHub 宣布其辅助编程助手 Copilot 免费提供给所有用户,但免费并非意味着用户可以无限制的使用,GitHub 此举还是希望用户在用惯 Copilot 之后会选择付月费。免费用户在一个月内可以使用最多 2000 次代码辅助完成以及 50 次聊天请求,支付 10 美元月费则不再有限制。
YouTube 宣布将在未来几天推出一项可选择加入的功能,让内容创作者和版权所有者选择允许第三方公司使用其视频内容去训练 AI。该选项“Third-party training”位于 YouTube Studio 设置下,默认是不允许。创作者可以选择允许哪些第三方公司,也可以不加选择的允许任何第三方公司。YouTube 表示,未经许可抓取视频的做法是不允许的。
Google DeepMind 宣布推出下一代视频生成模型 Veo 2,支持生成最高 4K 分辨率和超过 2 分钟时长的视频,向 OpenAI 的 Sora 发起挑战。Veo 2 目前通过 Google 的实验性视频创建工具 VideoFX 提供给用户,而 VideoFX 采用邀请制度,用户需要加入一个等候名单,Google 表示本周会扩大用户数量。Veo 2 目前使用有限制,分辨率最高 720p,时长为 8 秒。相比下,Sora 支持生成最高 1080p 时长为 20 秒的视频。DeepMind 产品副总裁 Eli Collins 表示 Veo 2 未来几个月会根据用户反馈持续迭代。
OpenAI 前首席科学家、Safe Superintelligence 公司联合创始人伊利亚(Ilya Sutskever)在温哥华神经信息处理系统大会(NeurIPS)上表示,虽然计算在增长,但数据却没有增长,预训练毫无疑问会结束;并预测未来的人工智能系统将能够以更类似于思考的方式逐步解决问题,具有推理能力的人工智能将更难以预测。所谓“预训练”,即使用大量未标记数据来训练人工智能模型以理解语言模式和结构的阶段。伊利亚表示,虽然计算在增长,但数据却没有增长,因为我们只有一个互联网。“我们已经达到了数据峰值,不会再有了。”他预测,下一代模型将“以一种真正的方式实现代理化(agentic)”,未来的系统除了具有自主性,还具有推理能力。
哈佛大学宣布发布由近百万公有领域书籍构成的免费 AI 训练数据集,但问题是哈佛还没找到公司来托管该数据集,所以该数据集尚未提供下载。数据集由哈佛新成立的 Institutional Data Initiative 创建,得到了微软和 OpenAI 的资助,包含了 Google Books 项目扫描的部分已进入公有领域的图书。该项目希望 Google 合作公开发布,但搜索巨人尚未同意托管。哈佛大学对 Google 托管持乐观态度,Google 则对此未予置评。项目执行理事 Greg Leppert 表示希望打造一个公平的竞争环境,让任何人都能访问此前只有科技巨头才有资源去汇集高质量、深度加工和精心筛选的内容库。
Google 宣布了新一代大模型 Gemini 2.0。同时宣布的还有多个 AI Agent,其中之一是 Google Chrome 的 AI Agent Mariner,它能浏览电子表格和购物网站,代表用户采取行动。另一个 AI Agent 是一种辅助编程助手 Jules,它能识别和解释代码,同时推荐更改和 bug 修复。Google 推出编程助手并不令人意外,CEO Sundar Pichai 今年十月曾表示逾四分之一新代码是在 AI 帮助下完成的。
OpenAI 正式发布了视频生成模型 Sora。该公司还开发了一个更快的版本 Sora Turbo。OpenAI 称用户能生成分辨率最高 1080p、最长 20 秒、宽屏、垂直或方形纵横比的视频。可在自己的资源上进行扩展、重新混合和融合,或从文本生成全新内容。Sora 的故事板工具让用户能精确指定每个帧的输入。
广电总局网络视听司发布《管理提示(AI魔改)》。《管理提示》提到,近期,AI“魔改”视频以假乱真、“魔改”经典现象频发。这些视频为博流量,毫无边界亵渎经典IP,冲击传统文化认知,与原著精神内核相悖,且涉嫌构成侵权行为。对此,《管理提示》提出具体管理要求:第一,各相关省局督促辖区内短视频平台排查清理AI“魔改”影视剧的短视频,并于12月10日反馈工作情况。第二,严格落实生成式人工智能内容审核要求,举一反三,对各自平台开发的大模型或AI特效功能等进行自查,对在平台上使用、传播的各类相关技术产品严格准入和监看,对AI生成内容做出显著提示。
百度文小言 APP 与学习强国合作上线公文助手 AI。报道称:“学习强国公文助手”智能体具备权威的“学习强国”文汇检索能力,内容覆盖文汇、重要活动、重要会议、指示批示等多个板块。每一则信息都经过官方严格审核校验,可精准溯源,随心提问,一键摘录,全面解决用户公文溯源难等问题。“学习强国公文助手”智能体未来还将上新公文润色能力,可在保留文章结构和内容准确性的前提下,快速生成高质量公文,优化语言表达、改善句式结构、自动纠正错别字、病句等。
The Information 报道,苹果和百度合作为中国版 iPhone 引入 AI 功能面临诸多挑战。消息人士称,苹果和百度工程师正在改进百度大语言模型,使其能更好地服务 iPhone 用户。但据一位了解项目情况的人士表示,这些模型在理解用户提示和对常见场景作出准确响应方面,仍然存在困难。分析认为,若问题无法解决,可能会让苹果在中国市场提振 iPhone 销量的希望遭到打击。苹果与百度的合作主要围绕百度文心大模型 4.0 展开,该模型将被整合到 Apple Intelligence 中,以提升设备的人工智能体验。由于中国对人工智能技术的严格监管,尤其是对数据安全和用户隐私的高标准要求,Apple Intelligence 在国内的落地面临诸多限制。苹果的隐私政策明确禁止将用户数据用于 AI 训练,这与百度希望收集和分析 iPhone 用户数据以优化其 AI 模型的做法产生了直接冲突。苹果强调用户数据的安全性和隐私保护,在合作中坚持不使用用户数据进行 AI 模型的训练和改进。
Google DeepMind 研究人员在《自然》期刊上发表论文,称其模型 GenCast 在一周以上的天气预报表现优于目前公认最先进的 European Centre for Medium-Range Weather Forecasts 模型。GenCast 组合使用了大气科学家使用的计算方法和生成式 AI 模型常用的 diffusion 模型。GenCast 模型的分辨率高于欧洲模型的分辨率,而且其所需的算力也比较低。基准测试显示,GenCast 在 97% 的测试中比欧洲模型更准确。DeepMind 还用 GenCast 预测热带气旋的轨迹,前四天 GenCast 的准确度显著高于欧洲模型,其优势保持了大约一周。DeepMind 使用的相关数据将发布在 GraphCast 项目 GitHub 页面上。
Meta 内部使用的辅助编程工具 Metamate 同时使用了 OpenAI 的 GPT-4 以及自己开发的 Llama AI。Llama 和 GPT-4 是竞争对手关系,Meta CEO 扎克伯格(Mark Zuckerberg)曾公开宣称 Llama 是领先的 AI 模型。此外扎克伯格的慈善机构 Chan Zuckerberg Initiative 正使用 OpenAI 的技术开发一款教育 AI 工具,而 OpenAI CEO Sam Altman 加入了其 AI 顾问委员会。
Google DeepMind 宣布了一个大规模基础世界模型 Genie 2,能生成无限多种可控制动作、可玩的 3D 环境,用于训练和评估具身代理(embodied agent)。只需要向模型输入单幅的图像,它就能生成一个基于该图像的 3D 环境,用户或 AI 代理可通过键盘和鼠标输入进行游戏。Google DeepMind 称,Genie 2 可以让未来的 AI 代理在一个充满了无限可能性和探索的空间中训练和评估,为原型交互体验的全新创意工作流铺平了道路。
亚马逊在 AWS re:Invent 活动上宣布了一系列使用 Nova 品牌名称的 AI 模型:为速度和成本进行优化的文本模型 Nova Micro;低成本多模模型 Nova Lite,输入图像、视频和文本输出文本;强大的多模模型 Nova Pro;计划于 2025 年初推出的最强多模模型 Nova Premier;图像生成模型 Nova Canvas 以及视频生成模型 Nova Reel,这些模型生成的内容都会嵌入水印以促进负责任的 AI 使用。这些模型将通过 AWS Amazon Bedrock 模型库提供给客户。亚马逊还表示正与其投资的 AI 创业公司 Anthropic 合作构建庞大的 AI 计算集群。
腾讯混元大模型公布最新进展,上线视频生成能力。与此同时,腾讯开源该视频生成大模型,参数量 130 亿,是当前最大的视频开源模型。目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。该模型已上线腾讯元宝APP,用户可在 AI 应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入,API 同步开放内测申请。混元视频生成能力基于与 Sora 类似的 DiT 架构,并在架构设计上进行多多处升级。混元视频生成模型适配了新一代文本编码器提升语义遵循,其具备强大的语义跟随能力,更好地应对多个主体描绘,实现更加细致的指令和画面呈现;采用统一的全注意力机制,使得每帧视频的衔接更为流畅,并能实现主体一致的多视角镜头切换;通过先进的图像视频混合VAE(3D 变分编码器),让模型在细节表现有明显提升,特别是小人脸、高速镜头等场景。