solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2025年05月14日 15时09分 星期三
来自完美女孩
法国 AI 测试公司 Giskard 发现,要求 AI 聊天机器人给出简洁答案会显著增加幻觉的可能性。研究显示,包括 OpenAI 的 GPT-4o(ChatGPT 默认模型)、Mistral Large 和 Anthropic 的 Claude 3.7 Sonnet 在内的先进模型,在被要求给出简短答案时,其事实准确性都会下降。研究人员猜测,在要求简洁答案时,AI 模型会优先选择简洁而不是准确性。简洁之类看似无害的提示词会削弱模型发现错误信息的能力。

人工智能
Wilson(42865)
发表于2025年05月12日 15时16分 星期一
来自棕榈上的霜
美国版权局上周五发表了一份有关使用版权材料训练 AI 模型是否是合理使用的报告,次日特朗普下令解雇了该局局长 Shira Perlmutter。科技巨头和 AI 公司是特朗普的支持者,其中马斯克(Elon Musk)旗下的 AI 公司是众多希望使用版权材料训练 AI 模型的公司之一。美国版权局的报告区分了研究用的 AI 模型和商业性 AI 模型,认为研究用的 AI 模型能带来变革,但商业性模型生成的是与训练使用的版权作品相似的输出,不太可能被视为带来变革性。商业用的 AI 训练类似人类学习。版权局更多是站在了版权所有者而不是 AI 公司这一边。

人工智能
Wilson(42865)
发表于2025年05月11日 23时47分 星期日
来自猛兽的财富
Chungin Lee 曾在 ChatGPT 帮助下写作文,最终成功入学哥伦比亚大学,之后他几乎每一份作业都使用生成式 AI 作弊。他就读的是计算机科学专业,他说自己的入门编程作业是扔进 ChatGPT 然后直接将结果上交。他估算自己递交的每一篇作文有八成是 AI 写的。他会对作文进行润色,让它看起来是自己人工写的。那么他为什么要如此费劲考入常春藤盟校,然后将所有学习都交给机器人?他说常春藤盟校是找到合伙人和妻子的最佳场所。他找到了自己的合伙人,在开发了三款不怎么成功的 APP 之后,他们创造的远程编程面试作弊工具引发了广泛关注。他和合伙人从投资者手中筹集到了 530 万美元,用于开发另外一款 AI 应用。Lee 表示,他们将目标瞄准研究生入学标准化考试,以及所有校园作业、测验和考试,让学生可以在几乎所有地方都能作弊。哥伦比亚大学对他进行了纪律处分,不是因为他在作业中作弊,而是因为他开发了作弊用的 AI 工具。Lee 表示,他学校里认识的学生几乎没有一个不在用 AI 作弊。他并不认为这是一件坏事,认为我们距离一个没有人认为使用 AI 做作业是作弊的世界只剩下几年,或者可能是几个月时间。其他学生也认为没有人能抗拒一个能让所有作业都变得更容易,而且目前看起来没有任何后果的工具。

人工智能
Wilson(42865)
发表于2025年05月10日 21时21分 星期六
来自人猿泰山之结缘蚁人
根据杜克大学研究人员在 PNAS 期刊上发表的一项研究,使用 AI 是一把双刃剑——生成式 AI 可能会提高部分人的生产力,但也可能会损害他们的职业声誉。研究发现,在工作中使用 ChatGPT、Claude 和 Gemini 等 AI 工具的员工会面临同事和上司对其能力和积极性的负面评价。研究团队对逾 4400 名参与者展开了四项实验,调查对使用 AI 工具的用户的预期和实际评价。研究揭示了人们对使用 AI 帮助完成工作的人存在一致的偏见。针对 AI 用户的社会污名并不局限于特定人群。

人工智能
Wilson(42865)
发表于2025年05月08日 13时45分 星期四
来自银色金属恋人
curl 项目正与大量由 AI 生成的虚假漏洞报告作斗争,curl 作者 Daniel Stenberg 认为这是针对该项目的 DDoS 攻击。Stenberg 称至今没有看到一份 AI 帮助下完成的漏洞报告是有效的。5 月 4 日的一份安全报告令 Stenberg 倍感崩溃,因为报告引用了不存在的函数,而且不适用于当前版本。甚至还有安全报告包含了 AI 提示命令。Stenberg 希望管理漏洞报告的平台 HackerOne 能使用更多工具打击 AI 生成的漏洞报告,他计划封禁递交此类报告的用户。

USA
Wilson(42865)
发表于2025年05月08日 13时21分 星期四
来自银色金属恋人
特朗普政府计划修改拜登任期结束前公布的 AI 芯片出口限制政策,该政策原计划于 5 月 15 日生效。拜登政府最后公布的 AI 出口政策将各个国家划分为 3 个梯队。第一梯队(Tier-1)为美国的同盟国日本、韩国、英法德等 18 个国家和地区。这些地区在先进半导体及 AI 基础模型的技术转让方面不受限制。第二梯队(Tier-2)国家共有大约 120 个。面向第二梯队国家的大多数出口都需要获得美国政府的批准。第三梯队(Tier-3)则包括中俄等 22 个国家,除了此前的出口限制,还禁止了 AI 技术转让。包括英伟达和 AMD 在内的芯片制造商反对最新的出口政策。AMD CEO 苏姿丰周三表示,美国应在出于国家安全理由限制芯片准入和提供准入之间取得平衡,以促进美国芯片产业的发展。英伟达 CEO 黄仁勋本周早些时候表示,被中国 AI 市场拒之门外将是“巨大的损失”。

人工智能
Wilson(42865)
发表于2025年05月06日 23时37分 星期二
来自空中城堡
最受欢迎的深度伪造色情平台 Mr. Deepfakes 永久关闭。该平台一度吸引了大量用户,他们愿意支付多达 1500 美元,让创作者使用 AI 换脸技术,将名人或目标对象出现在色情视频中。在高峰期,该平台的 4.3 万则视频观看量逾 15 亿次。这些视频目前已无法观看,相关论坛也已关闭。Mr. Deepfakes 声明称一家关键的服务提供商终止了服务。Mr. Deepfakes 的关闭并不能解决深度伪造问题,最流行的 DeepFaceLab 开源软件虽然已经存档停止开发,但任何人都可以使用。

人工智能
Wilson(42865)
发表于2025年05月06日 17时29分 星期二
来自超能第七感·碰撞
OpenAI 去年底公布了转变为营利性公司的计划,以方便筹集资金。根据拟议中的计划,OpenAI 的营利性公司总部位于特拉华州,将是一家公益公司(PBC)——即除了股东价值外还会考虑社会利益。OpenAI 的原非营利组织将会在新公司持有股份。现在 OpenAI 改变了计划,宣布原非营利组织将会持有营利性实体的控股权。OpenAI 表示它倾听了外界的意见,在与特拉华州和加州总检察长办公室进行建设性对话之后做出了这一决定。未来它将继续由非营利实体监督和控制。

人工智能
Wilson(42865)
发表于2025年05月01日 23时54分 星期四
来自女神觉醒
微软 CEO Satya Nadella 出席了 Meta 的 LlamaCon 大会,与 Meta CEO Mark Zuckerberg 交谈时称该公司三成新代码是用 AI 写的。此前 Google CEO Sundar Pichai 也曾给出了类似的数据。在 LlamaCon 大会上,Zuckerberg 询问微软有多少代码是 AI 生成的,Nadella 给出了这一数字,他表示不同编程语言中 AI 生成代码的结果参差不齐,Python 中进步更快,而 C++ 进步较慢。

人工智能
Wilson(42865)
发表于2025年05月01日 22时51分 星期四
来自全面启动
多邻国声称使用生成式 AI,共享内容系统和内部工具将课程数量翻了一番。多邻国新增了 148 门新语言课程,这标志着该平台七种最受欢迎​​的非英语语言——西班牙语、法语、德语、意大利语、日语、韩语和中文普通话——将提供给所有 28 种支持的用户界面 (UI) 语言,极大地扩展了全球逾 10 亿潜在学习者的学习选择。

人工智能
Wilson(42865)
发表于2025年04月29日 22时13分 星期二
来自基因突变
研究发现,生成式 AI 如 ChatGPT、Claude 和 Gemini 并没有取代人类工作或者降低人类员工的薪水。这一发现质疑了构建和运营生成式 AI 的高昂资本支出。经济学家 Anders Humlum 和 Emilie Vestergaard 研究了 AI 聊天机器人对丹麦 11 个职业的影响。会计师、客户支持专家、财务顾问、人力资源、IT 支持专家、记者、法务、市场营销、办公室文员、程序员和教师等职业被认为易受 AI 影响。但研究结果显示, AI 聊天机器人对劳动力市场和薪水的影响微乎其微,没有观察到存在显著影响。科技行业一直宣称 AI 的经济潜力,企业投入了数十亿美元建设支持 AI 的基础设施。问题不在于员工们回避生成式 AI 聊天机器人,而是它们尚未转化为实际的经济效益。

人工智能
Wilson(42865)
发表于2025年04月29日 15时24分 星期二
来自再会,谢谢所有的鱼
阿里巴巴宣布了 Qwen 系列最新模型 Qwen3。阿里称 Qwen3 是其首个具备快思考与慢思考能力的混合推理大模型,采用混合专家(MoE)架构,能模仿人类思考问题的方式,对复杂问题可多步骤“深度思考”,对简单需求可低算力“秒回”答案,极大节省算力消耗。阿里称,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。阿里巴巴开源了两个 MoE 模型的权重:Qwen3-235B-A22B,一个拥有 2350 多亿总参数和 220 多亿激活参数的大模型,以及Qwen3-30B-A3B,一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。此外,六个 Dense 模型也已开源,包括 Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B,均在 Apache 2.0 许可下开源。

人工智能
Wilson(42865)
发表于2025年04月28日 17时26分 星期一
来自图书馆员与遗失的神灯
DeepSeek 更新了韩文版《个人信息处理方针》,在韩国应用商店重新上架。新的条款表示将在韩国《个人信息保护法》下处理个人信息,标明公司将用户个人信息转移至3家在华企业和 1 家在美企业,用户有权拒绝转移个人信息。上周韩国监管机构个人信息保护委员会发布了调查报告,称 DeepSeek未经同意将用户个人信息转移至境外,也未公开相关处理方针,并将用户在聊天框中输入的提示信息擅自传输至 TikTok 母公司字节跳动旗下云服务平台火山引擎。DeepSeek 是在 2 月中旬从韩国应用商店下架。

人工智能
Wilson(42865)
发表于2025年04月26日 23时35分 星期六
来自黄泉归来
在宣布近一年之后,微软通过 Windows Experience Blog 宣布开始向 Copilot+ PC 用户推送受争议的 AI 功能 Windows Recall。Recall 会每隔数秒截取屏幕截图,将其与提取的文本一起储存在本地的可搜索数据库内。该功能因安全隐私方面的争议而多次推迟推出。微软通过修改解决了大部分问题,改进了安全保护措施,优化了敏感信息的内容过滤,最重要的是该功能是 opt-in 而不是 opt-out——即用户选择加入而不是默认启用选择退出。

人工智能
Wilson(42865)
发表于2025年04月25日 14时56分 星期五
来自羊毛战记
DeepMind 宣布发布 Lyria 2 音乐生成模型。第一代的音乐生成模型 Lyria 是在 2023 年发布的。Lyria 2 能提供高保真音乐和专业级音频输出,能捕捉不同音乐类型和复杂乐曲中的细微差别。Google 还同时开发了 Lyria RealTime,允许用户实时交互式地创作、演奏和控制音乐,混合不同音乐类型、融合不同风格,随时塑造音频。

人工智能
Wilson(42865)
发表于2025年04月24日 18时29分 星期四
来自发条女孩
根据数据分析师 Marc Zao-Sanders 的分析,在 2024-2025 年 AI 使用场景前 30 名榜单中,“获取专业或个人支持”已成为 2025 年 AI 应用的最常见场景,“疗愈和陪伴”超越 2024 年排名第 1 的“创意生成”功能,首次进入榜单的新需求“整理生活”与“寻找人生方向”紧随其后。传统热门用途“具体搜索”和“创意生成”等需求的热度有所下降。其中 2024 年排名第 3 的“具体搜索”则在今年跌出前 10。分析指出,这可能与生成式AI被集成至主流搜索引擎(如 Gemini 被整合进 Google)有关,用户已不再单纯依赖 AI 进行查询,而更多将其作为认知辅助工具使用。

人工智能
Wilson(42865)
发表于2025年04月24日 15时59分 星期四
来自图书馆员与追寻鹅妈妈
根据正在进行中的 Google 反垄断诉讼披露的内部数据,截至今年 3 月 Google 的 AI 聊天机器人 Gemini 全球有 3.5 亿月活跃用户。Gemini 去年 10 月的日活用户仅为 900 万,但今年 3 月已经增加到了 3500 万。根据法庭文件,Google 估计 ChatGPT 的月活用户为 6 亿。ChatGPT 是目前最受欢迎的 AI 聊天机器人。

USA
Wilson(42865)
发表于2025年04月19日 23时32分 星期六
来自一九八四
Software AG 的一项研究发现有多达五成员工使用未批准的 AI 工具。今天的 AI 工具非常容易获得,而企业也日益鼓励员工使用 AI 工具提高工作效率。无论是总结会议记录、起草客户邮件、探索代码还是创建内容,企业员工正在快速普及 AI。即使企业出于安全担忧内部限制员工使用 AI 工具,他们也可以通过浏览器访问 AI 工具的 Web 版本。分析显示最流行的 AI 工具是 ChatGPT,还有部分员工会使用中国公司开发的 AI 工具如 DeepSeek、Baidu Chat 和 Qwen。

人工智能
Wilson(42865)
发表于2025年04月19日 23时08分 星期六
来自无敌号
根据内外部测试,OpenAI 最新推理模型 o3 和 o4-mini 比该公司之前的模型出现幻觉的概率更高。在 OpenAI 的 PersonQA 测试中,o3 出现幻觉的概率高达 33%,两倍于旧模型 o1(16%)和 o3-mini(14.8%)。o4-mini 更糟糕出现幻觉的概率高达 48%。斯坦福大学兼职教授 Kian Katanforoosh 指出他的团队发现 o3 常生成无效网址。OpenAI 表示需要更多研究去理解为什么随着推理模型规模的扩大,幻觉现象会加剧。

人工智能
Wilson(42865)
发表于2025年04月17日 18时05分 星期四
来自森林送信人
微软研究人员声称,他们开发出迄今为止规模最大的 1 位 AI 模型 bitnet。该模型命名为 BitNet b1.58 2B4T,采用 MIT 许可证发布,能在包括苹果 M2 处理器在内的各种 CPU 上运行。大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。压缩能让模型在低端硬件上运行。bitnet 将权重量化为三个值:-1、0 和 1,其内存和计算效率远高于大多数模型。BitNet b1.58 2B4T 是首个拥有 20 亿个参数的 bitnet,测试中该模型在包括 GSM8K(小学水平数学题库)和 PIQA(测试物理常识推理能力)的测试中超过了 Meta 的 Llama 3.2 1B、Google 的 Gemma 3 1B 和阿里巴巴的 Qwen 2.5 1.5B。