奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: 使用 AI 聊天机器人可能加剧精神病

Edwards(42866)

发表于2025年09月24日 15时37分星期三
来自科玛

英国伦敦国王学院 Hamilton Morrin 团队在一篇预印本中指出，像 ChatGPT 之类的 AI 聊天机器人可能会诱发或加剧精神病，他们将这一现象称为“AI精神病”。研究认为，AI 在对话中倾向于奉承和迎合用户，这种回应方式可能强化用户的妄想思维，模糊现实与虚构之间的界限，从而加剧心理健康问题。Morrin 团队发现，用户与 AI 对话时会形成一种“反馈循环”：AI 会不断强化用户表达的偏执或妄想，而被加强的信念又进一步影响 AI 的回应。通过模拟不同偏执程度的对话场景，研究显示 AI 与用户之间存在相互加剧妄想信念的现象。研究人员分析了 2023 年 5 月至 2024 年 8 月期间公开的 9.6 万条 ChatGPT 对话记录，发现其中有数十例用户呈现明显妄想倾向，例如通过长时间对话验证伪科学理论或神秘信仰等。在一段长达数百轮的交谈中，ChatGPT 甚至声称自己正在与外星生命建立联系，并将用户描述为来自“天琴座”的“星际种子”。丹麦奥胡斯大学精神病学家 Søren Østergaard 表示，AI 引发精神病目前仍属于假设性观点。Østergaard 强调，曾有心理问题史的人群在与AI对话后风险最高。而且聊天机器人可能通过强化用户的情绪高涨状态，诱发或加剧躁狂发作。

科技: 教宗拒绝授权创建一个 AI 教宗

Edwards(42866)

发表于2025年09月22日 11时03分星期一
来自飞行村

教宗良十四世（Pope Leo XIV）拒绝创建一个 AI 教宗（AI Pope），他在接受传记作家 Eloise Allen 采访时表示：“如果要说谁不应该被虚拟化身所代表，我认为教宗绝对位居前列。” 教宗说：“最近有人请求授权打造一个我的 AI 版本，任何人都可以登录网站与教宗进行私人对话。AI 教宗会回答他们的问题，而我说‘我不会授权’。”良十四世此前曾表示，他选择“良”名号部分是为了致敬 19 世纪的教宗良十三世（Pope Leo XIII）。良十三世以其论述工业革命期间工人阶级受剥削问题的《新事通谕》（Rerum novarum）闻名。良十四世对枢机主教们的首次讲话便称 AI 是“另一场工业革命”。教宗说：“如果整个世界自动化，只有少数人有能力不仅生存下去还能过上富足有意义的生活，那么未来将会出现一个大问题，一个严重的问题。”他担心投资 AI 的超级富豪完全忽视了人类和人性的价值，如果教会不为此发声，或者无人为此发声，那么危险就在于数字世界将自行其是，人类沦为棋子，被置之一旁。教宗表示不反对进步或新技术，但他不喜欢目前事情的发展方向。他此前曾表示，尽管 AI 能够“模拟人类推理的某些方面”，并以惊人的效率完成任务，但它仍然无法替代真正的道德分辨和建立“真正的人际关系”。这些科技的发展，必须与人类和社会的价值观，能做出合乎良知判断的能力以及日益增长的人类责任感并行。

科技: OpenAI 研究人员称 AI 幻觉在数学上是不可避免的

Wilson(42865)

发表于2025年09月21日 22时41分星期日
来自彩虹尽头

OpenAI 研究人员在预印本平台 arxiv 上发表了一篇论文，指出由于大模型使用的统计学特性以及计算限制，即使有完美的数据，AI 仍然会产生貌似可信但实际上错误的输出。研究人员承认，AI 幻觉在数学上是不可避免的，无法通过更先进的工程技术解决。研究人员在论文中称，类似面对考试难题的学生，大模型会在不确定的情况下猜测，产生貌似可信但实际错误的表述，而不是承认不确定性。即使是最先进的 AI 系统，幻觉仍然存在，会破坏信任。研究人员证明，幻觉源于训练大模型使用的统计学特性，而非实现缺陷。研究人员测试了竞争对手 DeepSeek-V3 模型、Meta AI 和 Claude 3.7 Sonnet，以及 OpenAI 自己的 GPT 系列模型。研究人员称，ChatGPT 也会产生幻觉，GPT-5 有更少的幻觉，但幻觉仍然会发生，且更先进的推理模型比简单的系统更容易产生幻觉：o1 推理模型 16% 的时间会产生幻觉，而较新的 o3 和 o4-mini 分别有 33% 和 48% 的时间会产生幻觉。OpenAI 的研究识别了三个导致幻觉不可避免的数学因素：当训练数据集中信息过少时的认知不确定性，模型局限性和计算难解性。

科技: DeepSeek 发表 R1 模型论文，称训练成本仅 29.4 万美元

Edwards(42866)

发表于2025年09月18日 22时54分星期四
来自星际归途

DeepSeek 的研究人员在《自然》期刊上发表了 R1 模型论文《DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning》。研究人员披露 R1 的训练成本仅 29.4 万美元，但其基础模型花了约 600 万美元；R1 主要使用英伟达的 H800 AI 芯片训练，该芯片自 2023 年起被禁止出口到中国。DeepSeek 的主要创新是使用名叫纯强化学习（pure reinforcement learning）的方法自动化试错，对模型得出正确答案进行奖励，而不是教它遵循人类选择的推理示例。模型还使用名叫 group relative policy optimization 的方法给自己打分。对于今年早些使用 OpenAI 指责 DeepSeek 使用其模型的输出进行训练，研究人员予以否认。DeepSeek-R1 是 Hugging Face 上最受欢迎的模型之一，下载量达到 1090 万次，2025 年使用强化学习的大模型几乎都受到了 R1 的启发。

科技: ChatGPT 将估计用户年龄，可能要求验证年龄

Edwards(42866)

发表于2025年09月17日 23时35分星期三
来自外交豁免权

在发生多起与 ChatGPT 相关的青少年自杀案件之后，OpenAI 正引入更严格的安全措施。ChatGPT 将估计用户的年龄，如果认为用户未满 18 岁它可能会要求用户出示身份证件确认是否成年。本月初 OpenAI 已经为 ChatGPT 引入了家长控制功能。除了尝试估计或验证用户年龄，ChatGPT 还将接受训练，对青少年用户应用不同的规则，比如不会进行自杀或自残相关的讨论。如果未成年用户有自杀念头，OpenAI 将会尝试联系其父母或相关部门。

科技: 迪士尼华纳等起诉中国 AI 公司侵犯版权

Edwards(42866)

发表于2025年09月17日 22时56分星期三
来自薄红天女

Disney（包括漫威、卢卡斯影业和 20 世纪福克斯）、Warner Bros. Discovery（包括 DC 漫画）和 NBCUniversal （包括梦工厂）起诉中国 AI 公司上海稀宇科技有限公司（MiniMax）蓄意且肆无忌惮的侵犯版权。在递交到加州中区联邦地区法院的诉状中，好莱坞巨头指控 MiniMax 无视美国版权法，将它们的版权角色作为自己的角色使用。MiniMax 运营着名为海螺（Hailuo）的图像和视频生成服务，大规模盗版和掠夺原告们的版权作品。MiniMax 宣传海螺服务是口袋里的好莱坞工作室，但其业务是建立在窃取好莱坞工作室知识产权的基础之上。起诉书列举了侵权案例——使用迪士尼的版权角色达斯维达生成图像和视频。好莱坞工作室寻求赔偿以及禁止 MiniMax 继续侵犯其版权作品。

科技: 用户如何使用 ChatGPT？

Edwards(42866)

发表于2025年09月17日 00时21分星期三
来自奇岛

OpenAI 与哈佛大学经济学家 David Denning 合作发表论文，首次使用内部数据披露用户是如何使用 ChatGPT 的。论文显示：ChatGPT 用户数从 2024 年初的 1 亿增长到 2025 年的逾 7 亿，全球约十分之一成年人人口使用它，每天发送 26 亿条消息，日流量为 Google 的五分之一；长期用户的日活跃度自 2025 年 6 月以来趋稳，近期的新增长来自于新注册用户；46% 的用户年龄在 18-25 岁之间；2022 年推出时八成用户为男性，如今女性用户占 52.4%；2025 年中期 72% 的使用与工作无关，用户更多将 ChatGPT 用于个人、创意和休闲需求而非生产力；28% 的对话涉及写作辅助（电子邮件、编辑、翻译），工作相关查询中写作辅助的比例提高到 42%，商业/管理职位中这一比例达到了 52%；14.9% 的工作相关使用与“做出决策和解决问题”相关。。

科技: Microsoft 365 应用将从下个月起强制安装 Copilot Chat

Edwards(42866)

发表于2025年09月16日 17时01分星期二
来自去月球

微软宣布从 10 月份起，在欧盟经济区（EEA）外的 Microsoft 365 应用将强制安装 Copilot Chat。Word、 Excel、PowerPoint、Outlook 和 OneNote 都将更新包含 Copilot Chat 侧边栏。用户利用 Copilot Chat 可以起草文档、分析电子表格和制作幻灯片。该功能可以免费使用，Copilot 的付费用户则可以访问更高级的功能如对工作数据进行推理、支持上传文件和生成图像，以及使用最新模型如 GPT-5。如果企业不想要该功能，IT 管理员可以在 Apps Admin Center 中修改设置退出 Copilot Chat，方法是 Customization > Device Configuration > Modern App Settings，选择 Microsoft 365 Copilot app，移除 Enable 的勾选框。

科技: NewsGuard 的调查显示 AI 生成虚假信息的比例一年内翻了一倍

Edwards(42866)

发表于2025年09月15日 13时33分星期一
来自气球上的五星期

新闻评级公司 NewsGuard 调查了 10 款领先的生成式 AI 工具，分析了它们在回复中生成虚假新闻信息的比例。结果显示，2025 年 8 月，10 款 AI 工具在新闻主题上重复虚假信息的比例超过三分之一（35%），高于 2024 年 8 月的 18%。AI 公司并未兑现让 AI 更安全更可靠的承诺。生成虚假信息比例翻一倍的一大原因是今天的 AI 工具都支持联网查询，不再拒绝回答提问，它们不回复比例从 2024 年 8 月的 31% 下降到 2025 年 8 月的 0%，结果就是更多虚假信息。NewsGuard 认为攻击者正利用 AI 这一特点用各种方法洗白虚假信息，让 AI 模型无法区分内容农场和可信新闻渠道。

科技: 阿联酋发布能与 DeepSeek 竞争的开源模型

Edwards(42866)

发表于2025年09月14日 22时37分星期日
来自龙岛

阿联酋 AI 实验室 Institute of Foundation Models (IFM) 发布了能与 OpenAI 的 ChatGPT 和 DeepSeek 竞争的开源模型 K2 Think。研究人员称，K2 Think 只有 320 亿个参数，但其表现超过了参数规模比它大 20 倍的推理模型。DeepSeek 的 R1 模型有 6710 亿个参数，但只激活 370 亿个参数；Meta 的 Llama 4 模型活跃参数从 170 亿到 2880 亿；OpenAI 没有披露其模型的参数规模。研究人员还表示，K2 Think 的数学表现超越了所有开源模型。该模型更专注于数学、编程和科学研究。IFM 此前表示它会向研究人员开放训练代码、数据集等与模型相关的材料。

科技: 大英百科和韦氏词典指控 Perplexity 侵犯版权和商标权

Edwards(42866)

发表于2025年09月12日 22时57分星期五
来自惊涛怪浪

Perplexity AI 成为最新一家被版权所有者起诉的 AI 公司。Perplexity 的“答案引擎（answer engine）”通过搜索互联网并总结其发现的内容，为传统搜索引擎提供了一种基于 AI 的替代。大英百科全书（Encyclopedia Britannica）和韦氏词典（Merriam-Webster）指控 Perplexity 未经许可抓取了其网站内容，复制并转载其内容，侵犯了版权。Perplexity 生成的 AI 答案不可避免的会带有幻觉——即捏造的错误信息。大英百科和韦氏词典指控 Perplexity 将 AI 的幻觉归因于它们，侵犯了其商标权。它们要求赔偿并禁止 Perplexity 滥用其内容。

科技: 法国配音演员指控《古墓丽影 4-6 重制版》使用 AI 合成其声音

Edwards(42866)

发表于2025年09月11日 17时33分星期四
来自树上银花

古墓丽影系列的法语配音演员 Françoise Cadol 向《古墓丽影 4-6 重制版(Tomb Raider 4-6 Remastered)》开发商 Aspyr 发出停止通知函（cease and desist），指控 Aspyr 使用 AI 拷贝其声音但没有通知她或告诉游戏玩家。她形容此举是一种背叛，一种彻底的不尊重。除了法语，巴西和西班牙等地区的玩家也认为其语种的配音是由 AI 生成的，AI 合成了原配音演员的声音。巴西配音演员 Lene Bastos 收到了 Aspyr 的一封回信，它的调查显示外部开发合作伙伴在其不知情下使用生成式 AI 编辑原始声音，它表示自己没有授权这么做，对未能在审核中注意到该问题表示歉意。

科技: GPT 使用的中文语料被成人赌博内容污染

Edwards(42866)

发表于2025年09月08日 13时21分星期一
来自歌剧院魅影

清华、蚂蚁和新加坡南洋理工的研究人员在预印本平台 arxiv 上发表了一篇论文《Speculating LLMs’ Chinese Training Data Pollution from Their Tokens》，指出 OpenAI 的 GPT 系列模型使用的中文语料被成人和网络赌博内容污染。大模型使用从互联网上爬取的内容进行预训练，而爬取的内容不可避免会混入成人色情或网络赌博等污染内容。如果不仔细清理数据，那么在构建词汇表和执行分词（Performing tokenization）时可能会生成污染词元（polluted tokens），GPT 系列模型使用的中文词汇表就存在大量污染的中文词元。GPT-o1/o3/4.5/4.1/o4-mini 等模型都使用污染的中文语料库进行了训练。研究人员发现，在 GPT 模型语料库中，超过 23% 的长中文词元或者是成人内容或者是网络赌博，以 GPT-4o 为例，与日本 AV 女星波多野结衣相关的网页比例占到了训练语料库的 0.5%。

科技: 英国政府试用 M365 Copilot 后未发现明显的生产力提升

Edwards(42866)

发表于2025年09月06日 00时20分星期六
来自美丽新世界

英国政府试用 M365 Copilot 后未发现明显的生产力提升。英国商务部获得了 1000 份许可证，可在 2024 年 10 月至 12 月期间使用。大部分许可证分配给志愿者，有 30% 分配给随机选择的参与者，其中 300 人同意对其数据进行分析。结果显示，每位用户平均执行了 72 次 M365 Copilot 操作，根据试用期间 63 个工作日计算，每位用户每天执行 1.14 项操作。Word、Teams 和 Outlook 是使用率最高的应用，而 Loop 和 OneNote 使用率非常低。最常见的三项任务是记录或总结会议记录、撰写电子邮件以及书面意见，而此类任务的用户满意度最高。但用户报告使用 M365 Copilot 完成 Excel 分析等更复杂的任务时速度比非 AI 用户更慢，质量和准确性也更差。总体而言，M365 Copilot 未发现能明显提升生产力。

科技: Anthropic 禁止中国控股公司使用 Claude

Edwards(42866)

发表于2025年09月05日 15时36分星期五
来自风神秘抄

Anthropic 宣布，立即停止 Claude 提供给多数股权由中国资本持有的集团或其子公司使用。这一举措意味着，凡是直接或间接由中国实体控制（占股比例超过 50%）的企业，不再被允许使用 Anthropic 的服务。该政策不仅适用于中国大陆公司，也包括那些在境外设立的子公司、云服务中转实体或具有中国背景投资主体的组织。Anthropic 在其官网公告中表示，此举为应对法律、监管与国家安全风险。Anthropic 一位高管对《金融时报》的简要说明，此举还意在遏制中国公司通过在海外（如新加坡）注册子公司或使用第三方云服务，规避出口管制以获取先进 AI 技术的可能性。这是首个美国 AI 公司公开宣布此类限制的案例，标志着在美国科技公司 AI 出口与服务限制方面，可能更加主动采取防范措施。

科技: 瑞士发布了完整开源的大模型 Apertus

Edwards(42866)

发表于2025年09月04日 18时01分星期四
来自羚羊与秧鸡

瑞士发布了完整开源的大模型 Apertus——即不仅公开模型权重，还公开了训练数据集和文档等资料。Apertus 的源代码和训练集都允许商业使用。它的数据集包含了 15 万亿 tokens，涵盖了逾千种语言。Apertus 的开发明确遵守瑞士数据保护和版权法，纳入了可追溯的退出机制以尊重数据源的偏好。用户可通过瑞士官网访问大模型，也可以通过 Hugging Face 和 Public AI Inference Utility 访问。

科技: 腾讯发布能从单张图像生成 3D 世界的模型 Voyager

Edwards(42866)

发表于2025年09月04日 00时42分星期四
来自星尘

腾讯发布了混元世界模型-Voyager（HunyuanWorld-Voyager），能基于单张输入图像生成具有世界一致性的3D点云，并支持用户按照自定义的相机路径进行沉浸式世界探索。HunyuanWorld-Voyager 使用了一个包含超过 10 万个视频片段的数据集进行训练，它包含两个关键组件：世界一致的视频扩散和长距离世界探索。腾讯发布了该模型的推理代码和模型权重。

科技: 资深程序员比初级程序员更可能使用 AI 生成代码

Edwards(42866)

发表于2025年09月02日 17时46分星期二
来自神秘博士：阿波罗23号

Fastly 对 791 名程序员的调查发现，资深程序员和初级程序员在使用 AI 生成代码上存在显著差异。三分之一有 10 年以上开发经验的资深程序员表示他们交付的代码逾半数由 AI 生成，相比下开发经验不到两年的初级程序员中这一比例只有 13%，前者是后者的两倍半。一名资深程序员称，AI 比人类更快对代码进行组件测试并发现错误，然后无缝修复。但一位初级程序员表示对 AI 生成的代码并不那么信任，称自己需要经常重写代码。近三成的资深程序员表示编辑 AI 生成代码的时间足以抵消大部分节省的时间，而初级程序员中这一比例仅为 17%。尽管如此，59% 的资深开程序员表示 AI 工具帮助他们加快交付速度，而初级程序员中这一比例为 49%。略超过半数的初级程序员表示，AI 略微提升了开发速度。相比之下资深程序员中这一比例仅为 39%。但资深程序员更可能报告开发速度显著提升：26% 的资深程序员表示 AI 让开发速度大幅提升，是初级程序员（13%）的两倍。

科技: Vivaldi 再次强调不会集成生成式 AI

Edwards(42866)

发表于2025年08月30日 23时46分星期六
来自尘埃记

Vivaldi CEO 谭咏文(Jon von Tetzchner)再次强调了不会在浏览器中集成生成式 AI 的立场。他的理由是相比生成式 AI，人类的 Web 更具有多元化。他说，浏览器嵌入生成式 AI 会让 Web 丧失人性，导致内容发行商的流量减少，且其主要用途是收集用户数据。他说，每一个初创公司都在搞 AI，每一家公司都试图在其产品和服务中集成 AI，但这些公司都没有关注用户的真正需求。他说，Vivaldi 选择站在人类这边，而不是选择站在炒作 AI 那边，不会将探索的乐趣变成不活跃的旁观。如果没有探索，Web 会索然无味。人类的好奇心会失去动力，Web 的多元性也会跟着消亡。他表示，生成式 AI 与社媒推荐算法面临的问题相同，它们都根据收集的数据决定用户看到的内容。但 Vivaldi 希望用户能掌控自己的数据，自主决定看到的内容，希望用户能掌控一切。如果用户想使用生成式 AI，他们可以很容易访问，并不需要浏览器去集成 AI。

科技: 源自 ChatGPT 的常用词在人们的日常对话中也日益流行

Edwards(42866)

发表于2025年08月28日 17时06分星期四
来自假如我有完美妈妈

在 ChatGPT 发布近三年之后，大模型特有的词语在人们的日常对话中也日益流行。佛罗里达州立大学研究人员的论文预印本《Model Misalignment and Language Change: Traces of AI-Associated Language in Unscripted Spoken English》已发布在 arxiv 上。通过分析 2210 万口语单词，其中包括来自科技相关播客的对话，在 ChatGPT 发布之后，大模型的常用词在日常对话中出现的频率也越来越高。如 AI 常用词 underscore 使用量显著增加，但其同义词 accentuate 并没有增加。其它 AI 常用词如 delve、intricate、surpass、boast、meticulous、strategically 和 garner 等的情况类似。研究人员称，我们不仅仅在使用 AI；AI 时髦词正日益融入日常对话中，引发了对“渗透效应（seep-in effect）”的担忧。研究人员表示，语言是人类最强大的沟通媒介，了解 AI 如何影响这种媒介具有重要意义。