文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 笑看外挂 (1 points, 一般) by cnma_001 在 2025年04月03日13时47分 星期四 评论到 韩国游戏工作室竞争开发星际争霸新作
- 一个数据参考 (1 points, 一般) by hhding 在 2025年03月31日09时06分 星期一 评论到 AI 数据中心太多了
- 非技术的说法 (1 points, 一般) by hhding 在 2025年03月31日08时56分 星期一 评论到 AI 数据中心太多了
- 主体错误 (1 points, 一般) by solidot1740402558 在 2025年02月24日21时10分 星期一 评论到 Starlink 面临越来越多的竞争
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
DeepSeek 的研究人员在《自然》期刊上发表了 R1 模型论文《DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning》。研究人员披露 R1 的训练成本仅 29.4 万美元,但其基础模型花了约 600 万美元;R1 主要使用英伟达的 H800 AI 芯片训练,该芯片自 2023 年起被禁止出口到中国。DeepSeek 的主要创新是使用名叫纯强化学习(pure reinforcement learning)的方法自动化试错,对模型得出正确答案进行奖励,而不是教它遵循人类选择的推理示例。模型还使用名叫 group relative policy optimization 的方法给自己打分。对于今年早些使用 OpenAI 指责 DeepSeek 使用其模型的输出进行训练,研究人员予以否认。DeepSeek-R1 是 Hugging Face 上最受欢迎的模型之一,下载量达到 1090 万次,2025 年使用强化学习的大模型几乎都受到了 R1 的启发。
在发生多起与 ChatGPT 相关的青少年自杀案件之后,OpenAI 正引入更严格的安全措施。ChatGPT 将估计用户的年龄,如果认为用户未满 18 岁它可能会要求用户出示身份证件确认是否成年。本月初 OpenAI 已经为 ChatGPT 引入了家长控制功能。除了尝试估计或验证用户年龄,ChatGPT 还将接受训练,对青少年用户应用不同的规则,比如不会进行自杀或自残相关的讨论。如果未成年用户有自杀念头,OpenAI 将会尝试联系其父母或相关部门。
Disney(包括漫威、卢卡斯影业和 20 世纪福克斯)、Warner Bros. Discovery(包括 DC 漫画) 和 NBCUniversal (包括梦工厂)起诉中国 AI 公司上海稀宇科技有限公司(MiniMax)蓄意且肆无忌惮的侵犯版权。在递交到加州中区联邦地区法院的诉状中,好莱坞巨头指控 MiniMax 无视美国版权法,将它们的版权角色作为自己的角色使用。MiniMax 运营着名为海螺(Hailuo)的图像和视频生成服务,大规模盗版和掠夺原告们的版权作品。MiniMax 宣传海螺服务是口袋里的好莱坞工作室,但其业务是建立在窃取好莱坞工作室知识产权的基础之上。起诉书列举了侵权案例——使用迪士尼的版权角色达斯维达生成图像和视频。好莱坞工作室寻求赔偿以及禁止 MiniMax 继续侵犯其版权作品。
OpenAI 与哈佛大学经济学家 David Denning 合作发表论文,首次使用内部数据披露用户是如何使用 ChatGPT 的。论文显示:ChatGPT 用户数从 2024 年初的 1 亿增长到 2025 年的逾 7 亿,全球约十分之一成年人人口使用它,每天发送 26 亿条消息,日流量为 Google 的五分之一;长期用户的日活跃度自 2025 年 6 月以来趋稳,近期的新增长来自于新注册用户;46% 的用户年龄在 18-25 岁之间;2022 年推出时八成用户为男性,如今女性用户占 52.4%;2025 年中期 72% 的使用与工作无关,用户更多将 ChatGPT 用于个人、创意和休闲需求而非生产力;28% 的对话涉及写作辅助(电子邮件、编辑、翻译),工作相关查询中写作辅助的比例提高到 42%,商业/管理职位中这一比例达到了 52%;14.9% 的工作相关使用与“做出决策和解决问题”相关。。
微软宣布从 10 月份起,在欧盟经济区(EEA)外的 Microsoft 365 应用将强制安装 Copilot Chat。Word、 Excel、PowerPoint、Outlook 和 OneNote 都将更新包含 Copilot Chat 侧边栏。用户利用 Copilot Chat 可以起草文档、分析电子表格和制作幻灯片。该功能可以免费使用,Copilot 的付费用户则可以访问更高级的功能如对工作数据进行推理、支持上传文件和生成图像,以及使用最新模型如 GPT-5。如果企业不想要该功能,IT 管理员可以在 Apps Admin Center 中修改设置退出 Copilot Chat,方法是 Customization > Device Configuration > Modern App Settings,选择 Microsoft 365 Copilot app,移除 Enable 的勾选框。
新闻评级公司 NewsGuard 调查了 10 款领先的生成式 AI 工具,分析了它们在回复中生成虚假新闻信息的比例。结果显示,2025 年 8 月,10 款 AI 工具在新闻主题上重复虚假信息的比例超过三分之一(35%),高于 2024 年 8 月的 18%。AI 公司并未兑现让 AI 更安全更可靠的承诺。生成虚假信息比例翻一倍的一大原因是今天的 AI 工具都支持联网查询,不再拒绝回答提问,它们不回复比例从 2024 年 8 月的 31% 下降到 2025 年 8 月的 0%,结果就是更多虚假信息。NewsGuard 认为攻击者正利用 AI 这一特点用各种方法洗白虚假信息,让 AI 模型无法区分内容农场和可信新闻渠道。
阿联酋 AI 实验室 Institute of Foundation Models (IFM) 发布了能与 OpenAI 的 ChatGPT 和 DeepSeek 竞争的开源模型 K2 Think。研究人员称,K2 Think 只有 320 亿个参数,但其表现超过了参数规模比它大 20 倍的推理模型。DeepSeek 的 R1 模型有 6710 亿个参数,但只激活 370 亿个参数;Meta 的 Llama 4 模型活跃参数从
170 亿到 2880 亿;OpenAI 没有披露其模型的参数规模。研究人员还表示,K2 Think 的数学表现超越了所有开源模型。该模型更专注于数学、编程和科学研究。IFM 此前表示它会向研究人员开放训练代码、数据集等与模型相关的材料。
Perplexity AI 成为最新一家被版权所有者起诉的 AI 公司。Perplexity 的“答案引擎(answer engine)”通过搜索互联网并总结其发现的内容,为传统搜索引擎提供了一种基于 AI 的替代。大英百科全书(Encyclopedia Britannica)和韦氏词典(Merriam-Webster)指控 Perplexity 未经许可抓取了其网站内容,复制并转载其内容,侵犯了版权。Perplexity 生成的 AI 答案不可避免的会带有幻觉——即捏造的错误信息。大英百科和韦氏词典指控 Perplexity 将 AI 的幻觉归因于它们,侵犯了其商标权。它们要求赔偿并禁止 Perplexity 滥用其内容。
古墓丽影系列的法语配音演员 Françoise Cadol 向《古墓丽影 4-6 重制版(Tomb Raider 4-6 Remastered)》开发商 Aspyr 发出停止通知函(cease and desist),指控 Aspyr 使用 AI 拷贝其声音但没有通知她或告诉游戏玩家。她形容此举是一种背叛,一种彻底的不尊重。除了法语,巴西和西班牙等地区的玩家也认为其语种的配音是由 AI 生成的,AI 合成了原配音演员的声音。巴西配音演员 Lene Bastos 收到了 Aspyr 的一封回信,它的调查显示外部开发合作伙伴在其不知情下使用生成式 AI 编辑原始声音,它表示自己没有授权这么做,对未能在审核中注意到该问题表示歉意。
清华、蚂蚁和新加坡南洋理工的研究人员在预印本平台 arxiv 上发表了一篇论文《Speculating LLMs’ Chinese Training Data Pollution from Their Tokens》,指出 OpenAI 的 GPT 系列模型使用的中文语料被成人和网络赌博内容污染。大模型使用从互联网上爬取的内容进行预训练,而爬取的内容不可避免会混入成人色情或网络赌博等污染内容。如果不仔细清理数据,那么在构建词汇表和执行分词(Performing tokenization)时可能会生成污染词元(polluted tokens),GPT 系列模型使用的中文词汇表就存在大量污染的中文词元。GPT-o1/o3/4.5/4.1/o4-mini 等模型都使用污染的中文语料库进行了训练。研究人员发现,在 GPT 模型语料库中,超过 23% 的长中文词元或者是成人内容或者是网络赌博,以 GPT-4o 为例,与日本 AV 女星波多野结衣相关的网页比例占到了训练语料库的 0.5%。
英国政府试用 M365 Copilot 后未发现明显的生产力提升。英国商务部获得了 1000 份许可证,可在 2024 年 10 月至 12 月期间使用。大部分许可证分配给志愿者,有 30% 分配给随机选择的参与者,其中 300 人同意对其数据进行分析。结果显示,每位用户平均执行了 72 次 M365 Copilot 操作,根据试用期间 63 个工作日计算,每位用户每天执行 1.14 项操作。Word、Teams 和 Outlook 是使用率最高的应用,而 Loop 和 OneNote 使用率非常低。最常见的三项任务是记录或总结会议记录、撰写电子邮件以及书面意见,而此类任务的用户满意度最高。但用户报告使用 M365 Copilot 完成 Excel 分析等更复杂的任务时速度比非 AI 用户更慢,质量和准确性也更差。总体而言,M365 Copilot 未发现能明显提升生产力。
Anthropic 宣布,立即停止 Claude 提供给多数股权由中国资本持有的集团或其子公司使用。 这一举措意味着,凡是直接或间接由中国实体控制(占股比例超过 50%)的企业,不再被允许使用 Anthropic 的服务。该政策不仅适用于中国大陆公司,也包括那些在境外设立的子公司、云服务中转实体或具有中国背景投资主体的组织。Anthropic 在其官网公告中表示,此举为应对法律、监管与国家安全风险。Anthropic 一位高管对《金融时报》的简要说明,此举还意在遏制中国公司通过在海外(如新加坡)注册子公司或使用第三方云服务,规避出口管制以获取先进 AI 技术的可能性。这是首个美国 AI 公司公开宣布此类限制的案例,标志着在美国科技公司 AI 出口与服务限制方面,可能更加主动采取防范措施。
瑞士发布了完整开源的大模型 Apertus——即不仅公开模型权重,还公开了训练数据集和文档等资料。Apertus 的源代码和训练集都允许商业使用。它的数据集包含了 15 万亿 tokens,涵盖了逾千种语言。Apertus 的开发明确遵守瑞士数据保护和版权法,纳入了可追溯的退出机制以尊重数据源的偏好。用户可通过瑞士官网访问大模型,也可以通过 Hugging Face 和 Public AI Inference Utility 访问。
腾讯发布了混元世界模型-Voyager(HunyuanWorld-Voyager),能基于单张输入图像生成具有世界一致性的3D点云,并支持用户按照自定义的相机路径进行沉浸式世界探索。HunyuanWorld-Voyager 使用了一个包含超过 10 万个视频片段的数据集进行训练,它包含两个关键组件:世界一致的视频扩散 和 长距离世界探索。腾讯发布了该模型的推理代码和模型权重。
Fastly 对 791 名程序员的调查发现,资深程序员和初级程序员在使用 AI 生成代码上存在显著差异。三分之一有 10 年以上开发经验的资深程序员表示他们交付的代码逾半数由 AI 生成,相比下开发经验不到两年的初级程序员中这一比例只有 13%,前者是后者的两倍半。一名资深程序员称,AI 比人类更快对代码进行组件测试并发现错误,然后无缝修复。但一位初级程序员表示对 AI 生成的代码并不那么信任,称自己需要经常重写代码。近三成的资深程序员表示编辑 AI 生成代码的时间足以抵消大部分节省的时间,而初级程序员中这一比例仅为 17%。尽管如此,59% 的资深开程序员表示 AI 工具帮助他们加快交付速度,而初级程序员中这一比例为 49%。略超过半数的初级程序员表示,AI 略微提升了开发速度。相比之下资深程序员中这一比例仅为 39%。但资深程序员更可能报告开发速度显著提升:26% 的资深程序员表示 AI 让开发速度大幅提升,是初级程序员(13%)的两倍。
Vivaldi CEO 谭咏文(Jon von Tetzchner)再次强调了不会在浏览器中集成生成式 AI 的立场。他的理由是相比生成式 AI,人类的 Web 更具有多元化。他说,浏览器嵌入生成式 AI 会让 Web 丧失人性,导致内容发行商的流量减少,且其主要用途是收集用户数据。他说,每一个初创公司都在搞 AI,每一家公司都试图在其产品和服务中集成 AI,但这些公司都没有关注用户的真正需求。他说,Vivaldi 选择站在人类这边,而不是选择站在炒作 AI 那边,不会将探索的乐趣变成不活跃的旁观。如果没有探索,Web 会索然无味。人类的好奇心会失去动力,Web 的多元性也会跟着消亡。他表示,生成式 AI 与社媒推荐算法面临的问题相同,它们都根据收集的数据决定用户看到的内容。但 Vivaldi 希望用户能掌控自己的数据,自主决定看到的内容,希望用户能掌控一切。如果用户想使用生成式 AI,他们可以很容易访问,并不需要浏览器去集成 AI。
在 ChatGPT 发布近三年之后,大模型特有的词语在人们的日常对话中也日益流行。佛罗里达州立大学研究人员的论文预印本《Model Misalignment and Language Change: Traces of AI-Associated Language in Unscripted Spoken English》已发布在 arxiv 上。通过分析 2210 万口语单词,其中包括来自科技相关播客的对话,在 ChatGPT 发布之后,大模型的常用词在日常对话中出现的频率也越来越高。如 AI 常用词 underscore 使用量显著增加,但其同义词 accentuate 并没有增加。其它 AI 常用词如 delve、intricate、surpass、boast、meticulous、strategically 和 garner 等的情况类似。研究人员称,我们不仅仅在使用 AI;AI 时髦词正日益融入日常对话中,引发了对“渗透效应(seep-in effect)”的担忧。研究人员表示,语言是人类最强大的沟通媒介,了解 AI 如何影响这种媒介具有重要意义。
16 岁的 Adam Raine 自杀前曾花了几个月时间与 OpenAI 的聊天机器人 ChatGPT 讨论其自杀计划。他的父母 Matt 和 Maria Raine 本周提起诉讼,指控 ChatGPT 杀死了他们的孩子。这是首例与 AI 机器人相关的过失致死(wrongful death)案。AI 聊天机器人通常都设有安全保护功能,如果用户表达出自残或伤害他人的意图,安全功能会启用。然而 AI 聊天机器人的安全功能也很容易绕过,一种众所周知的方法是要求聊天机器人从创作或世界构建等的角度谈论了一个角色。在本案中,Adam Raine 就使用该方法一步步制定了自己的自杀计划。OpenAI 通过官方博客证实 ChatGPT 的安全保障措施存在局限性。
英伟达已通知半导体后工序大企业美国 Amkor Technology 和韩国三星电子停止涉及 H20 的相关业务。英伟达也向台湾鸿海精密工业提出了类似请求。英伟达之所以对 H20 的生产持犹豫态度,是因为中国市场的需求预期正在迅速恶化。中国相关部门于 7 月对 H20 存在安全方面的漏洞提出了担忧。对于英伟达来说,H20 本应是开拓中国市场的王牌产品。在困境之下,英伟达正在摸索的方案是投放新型芯片。H20 基于上一代 Hopper 架构,英伟达据报道正基于最新一代的 Blackwell 架构开发面向中国市场的半导体。
OpenAI 正致力于取代 Google,而它依赖的搜索数据却来自搜索巨人。Theinformation 报道,OpenAI 通过使用从 Web 抓取的 Google 搜索数据去增强聊天机器人 ChatGPT 的响应能力。当用户通过 ChatGPT 查询时事如新闻、体育和股市时,Google 搜索数据能提供巨大的帮助。OpenAI 使用的数据来自 Web 抓取公司 SerpApi。去年 SerpApi 还在网站上列出 OpenAI 是其客户,但后来将其删除了。