文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 样本数太少 没有参考意义 (1 points, 一般) by Craynic 在 2025年09月22日13时13分 星期一 评论到 梵蒂冈的 Flathub 软件包人均安装量最高
- 杞人忧天 (1 points, 一般) by cnma_001 在 2025年08月15日12时04分 星期五 评论到 你一生中被小行星砸到的概率
- 垃圾Paypal... (1 points, 一般) by devfsdvyui 在 2025年07月17日20时13分 星期四 评论到 Valve 在支付公司压力下移除部分成人游戏
- 建议下次不要用动漫这种容易误解的词 (1 points, 一般) by solidot1550041775 在 2025年07月09日15时24分 星期三 评论到 Netflix 称其全球订户有五成看动漫
- 所以应该吃生肉吗 (1 points, 一般) by Craynic 在 2025年07月09日13时25分 星期三 评论到 研究称加工肉没有食用的安全量
- 居然只有95% (1 points, 一般) by Craynic 在 2025年06月30日13时03分 星期一 评论到 日本争议夫妇别姓法案
- 搞反了 (1 points, 一般) by Craynic 在 2025年06月25日18时46分 星期三 评论到 智能手机是人类的寄生物
- 中心思想归纳 (1 points, 一般) by 18611782246 在 2025年05月15日10时37分 星期四 评论到 研究发现要求 AI 聊天机器人给出简洁答案会显著增加幻觉可能性
- 希望能比印度猴子写得好 (1 points, 一般) by Craynic 在 2025年05月06日13时21分 星期二 评论到 微软 CEO 声称该公司三成新代码是用 AI 写的
- 如果这么干的话 (1 points, 一般) by Craynic 在 2025年04月28日13时13分 星期一 评论到 苹果计划将印度制造的 iPhone 出口到美国以避开关税
资金正在涌向生成式 AI 初创企业。该领域的“独角兽”(估值 10 亿美元以上的未上市公司)截至 4 月底达到 37 家,过去一年里翻了一番。截至 2023 年 4 月底,美国企业占据了 AI 独角兽的9成,但在最近 1 年内成为独角兽的 17 家企业中,有 10 家在美国以外设立主要基地。法国 Mistral AI 和加拿大 Cohere 就是代表性案例。在中国,最近 1 年内诞生了 5 家 AI 独角兽。李开复等人创立的中国零一万物在最近的融资中获得了 10 亿美元的企业估值。在过去一年成为独角兽的17家企业中,英伟达向 Cohere 等 7 家企业出资,Alphabet 向涉足视频生成的 Runway 等 4 家企业出资。来自中国的 5 家AI独角兽企业均获得阿里巴巴集团投资。
DuckDuckGo 推出了一项匿名 AI 聊天服务 AI Chat,允许用户匿名使用热门 AI 模型,包括 GPT-3.5、Claude 3 以及开源 Llama 3 和 Mixtral。用户不需要任何注册,可通过网站、DuckDuckGo 搜索引擎或在搜索框加入“!ai”或“!chat”快捷方式访问 AI Chat。DuckDuckGo 称,聊天是匿名的,元数据和 IP 地址被移除,防止追溯到个人。DuckDuckGo 称与 AI 模型提供商达成协议,确保在 30 天内完全删除所有保存的聊天记录,其聊天记录不会被用于训练或改进模型。
阿里巴巴发布了最新的 Qwen 2 模型。Qwen 2 包含了 5 个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。阿里巴巴称,在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。这得益于其预训练数据及训练方法的优化。
企业据称正考虑用 AI 取代员工,但 CEO 之类的高管职位呢?高管们的核心任务主要是分析新市场和识别市场趋势,而这两项任务 AI 也很擅长。他们花费大量时间与员工沟通,而 AI 能将这一任务自动化。他们有时需要做出困难的决定,然而没有什么人能比 AI 更能保持冷静了。高管的薪水都很高,取代他们能省下一大笔钱。事实上有些公司已经在做了。网龙网络在 2022 年 ChatGPT 尚未流行时任命了一名虚拟 AI 助手唐钰担任公司轮值 CEO,半年后该公司的股价表现超过了恒生指数。CEO 们对于自己被取代的可能性似乎是听天由命。EdX 平台去年就此调查了数百名 CEO 和其他高管。47% 的高管认为大多数或所有 CEO 的职责应完全自动化或由 AI 取代。甚至高管都认为高管是多余的。
根据下周递交到澳大利亚联邦议会的新法律提案,分享数字修改过的深度伪造色情图像将面临六年监禁,制作深度伪造色情图像则面临七年监禁。新法律将未经同意分享使用 AI 等技术制作的色情图像定义为刑事犯罪行为。一旦该法律通过,无论是公开还是私下分享未经同意的深度伪造色情图像都将是违法的。
AI 革命似乎方兴未艾,但有人认为它已处于衰落中,理由包括:改进速度放缓;应用范围比预期的要小;构建和运营成本过于昂贵。可用于训练大模型的数据也在减少,我们只有一个互联网,AI 公司很难找到新的训练数据来源。ChatGPT 之类的 AI 在早期进步迅速,但过去 14 个月进展甚微。科技行业在 2023 年从英伟达公司购买了 500 亿美元的芯片训练 AI,但只带来 30 亿美元的收入。这种投入产出比是难以长期维系的。生成式 AI 即使添加广告可能也是得不偿失,它每次搜索答案所需的费用可能比广告费用还高。无论是 Google 还是微软都面临这一问题。生成式 AI 作为一种商品被高估了。
大模型正变得越来越强大,但对计算和电力的需求也越来越大。大模型如果要变得廉价、快速而且环保,它们需要大幅缩小规模,以便于能在类似手机的设备上本地运行。研究人员正致力于寻找方法实现这一目标。类似所有神经网络,大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。有两种压缩网络的通用方法,其一是训练后量化(PTQ),其二是量化感知训练(QAT),研究人员更青睐前者。哈工大的车万翔称,PTQ 相对于 QAT 的优点是不需要收集训练数据,不需要重新训练,训练过程更稳定。QAT 的优点则是模型可能更精确,因为量化从一开始就内置在模型中。去年微软亚洲研究院的研究团队创造了第一个 1 位 PTQ 大模型 BBitNet 1.58b,每个参数占大约 1.5 比特内存,有 30 亿参数的 BitNet 在各种语言任务中的表现和相同参数规模的全精度 LLaMA 模型一样出色,但速度是 2.71 倍,用的 GPU 内存少 72%,GPU 能耗低 94%。
路透研究院和牛津大学的研究人员调查了阿根廷、丹麦、法国、日本、英国和美国六国的 12,000 人,发现普通大众并不常用 ChatGPT 等热门 AI 产品,18-24 岁的年轻人是例外。研究旨在衡量普通大众对过去两年火热无比的生成式 AI 的看法,结果显示:多数人预测生成式 AI 未来五年会对社会产生重大影响,新闻、媒体和科学领域受影响最大;多数人认为生成式 AI 将改善自己的生活;关于生成式 AI 对社会的影响多数人普遍悲观。虽然多数人都听说过生成式 AI,但有 20%-30% 的人对此一无所知;ChatGPT 是使用率最高的生成式 AI 产品,比 Google Gemini 和 Microsoft Copilot 高出 2-3 倍;18-24 岁人群中有 56% 至少用过 ChatGPT 一次,55 岁及以上人群中这一比例为 16%;大部分人将生成式 AI 用于获取信息、创建媒体如文本、图像、音频和视频,有 5% 的人将其用于获取最新信息。
法国 AI 创业公司 Mistra 发布了它的代码生成 AI 模型 Codestral。Codestral 使用了逾 80 种语言的数据集训练,其中包括了流行语言如 Python、Java、C、C++、JavaScript 和 Bash。Codestral 有 220 亿参数,上下文长度 32K,能完成代码函数、写测试和补完代码,用写英文回答代码库问题。Mistra 称 Codestral 是开放权重模型,代码可以在 Hugging Face 上下载,使用的是非商业许可证,许可证明确禁止在业务活动中使用,原因可能是使用了不同许可证授权的代码训练。
华盛顿大学团队开发出一种 AI 系统,让佩戴耳机的用户盯着说话的人三到五秒进行“锁定”。被称为“Target Speech Hearing”的系统随后会消除环境中的所有其它声音,只实时传送标记的说话者的声音,即使用户在嘈杂的地方走动且不再面对说话者。该系统可以在现有耳机上使用,概念验证代码发布在 GitHub 上,使用了非商业使用许可证,系统本身尚未发售。系统使用了机器学习软件学习选定的说话者的声音模式,然后锁定说话者的声音。
前 OpenAI 董事 Helen Toner 接受采访时表示,公司董事也是通过 Twitter 才知道 ChatGPT 的。她表示董事会没有提前收到通知。这一信息突出了董事会与公司日常运营之间的脱节。去年 11 月 17 日公司董事会突然解雇 CEO Sam Altman 时给出的一条理由是他在不沟通时不坦诚。Toner 称 Sam Altman 没有告知董事会他拥有 OpenAI 创业基金,他多次声称作为独董与公司没有经济利益。他还向董事会提供了不准确的安全流程信息。两位高管向董事会报告受到了他的“心理虐待”,他的领导风格被指在公司内部催生了“有毒气氛”。对于 Sam Altman 在被解雇五天之后再次重新控制公司,Toner 说员工们认为没有他公司会崩溃,而如果不支持他可能会遭到报复。
为改进 Windows 11 在 Arm 设备上的游戏性能,微软宣布了 AI 驱动的图像超分辨率技术 Auto SR。其工作方式类似现有的超分辨率技术如 DLSS 和 FSR。Auto SR 存在很多限制,目前只支持高通的 Snapdragon X SoC 和 Windows 11 v24H2 或更高版本,以及原生 ARM 游戏和特定的 DirectX11 和 DirectX12 游戏。10 位格式的 DX11 和 DX12 游戏以及 OpenGL、Vulkan 和 DirectX 9 或 8 游戏都不支持。Auto SR 和 HDR 不能同时启用,不支持 1080p 以下的显示分辨率,等等。
彭博社报道,苹果与 OpenAI 达成协议为 iOS 18 提供 AI 聊天功能。苹果将在下个月举行的 WWDC 开发者大会上公布相关消息。苹果不想将所有鸡蛋都放在一个篮子,它仍然在寻求与 Google 达成协议,将搜索巨人的 AI 模型 Gemini 作为 OpenAI 的替代,但预计到下个月的 WWDC 上不会公布相关消息。苹果还在开发自己的 AI 模型 Ajax,用于设备上的文本分析、智能回复和摘要。ChatGPT 等 OpenAI 技术预计将会用于分析长文本、图像生成等高要求任务。
AI 的火爆以及人才的短缺推动了 AI 软件工程师的薪水远高于非 AI 的同行。根据薪资数据网站 Levels.fyi 的数据,截至 2024 年 4 月,美国 AI 软件工程师的平均薪水接近 30 万美元,比非 AI 领域的软件工程师高出约 10 万美元。两者的薪水差距在 2022 年中就达到了 30%,如今进一步扩大到了 50%。数据科学家 Alina Kolesnikova 称,企业愿意为 AI 技能支付溢价薪水,无论你处于什么级别。在部分企业 AI 工程师和非 AI 工程师的薪水差异更为巨大,例如无人出租车公司 Cruise 支付给 AI 工程师的中位数薪水是 68 万美元,比非 AI 工程师高 18.55 万美元。
OpenAI 宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI 将能在 ChatGPT 中显示新闻集团旗下媒体的内容并用于回答用户的问题。同时新闻集团将分享新闻专业知识,以帮助确保 OpenAI 的产品达到最高的新闻标准。知情人士称,该交易为期五年,交易价值或超过 2.5 亿美元,包括现金形式以及使用 OpenAI 技术的信用额度。OpenAI 此前已与 Reddit、《金融时报》、美联社、《世界报》等多家媒体达成内容协议。
Meta AI 首席科学家 Yann LeCun 认为现有的大模型永远也达不到人类水平的智能。他说,大模型对逻辑理解有限,不理解物理世界,没有持久记忆,无法对术语任何合理的定义进行推理,无法分层制定计划。他反对在追寻人类水平智能的过程中依靠先进的大模型,因为大模型只有在正确的训练数据训练后才能正确回答提示,它“本质上是不安全的”。他正致力于开发新一代 AI 系统去实现人类水平的智能,这个过程可能需要十年时间。LeCun 在 Meta 的 Fundamental AI Research (Fair) 实验室有一支 500 人的团队,使用“世界建模(world modelling)”的方法开发新一代 AI,它能发展出常识,以类似人类的方式了解世界如何运作。
记者调查发现,在多个电商、社交平台上,都有论文代写的身影。中介发帖宣传、拉客谈价,写手接单,俨然形成一条完整的灰色产业链,而中介宣称的“老师代写”,毕业生眼里的“专业写手”,不过是深谙降重之道的论文剽窃者,或使用 AI 写作的外行人。一位有经验的写手告诉记者,可以用 AI 写。论文中的数据统计,可以先让AI合理地编一些数据,再让 AI 根据编好的数据,一章节一章节地分析,“一下午就搞定了”,“写一篇论文才挣三五百元,你还真去帮他查数据、找资料,认认真真地写啊。”一位初中学历的写手介绍,他进入代写行业已经 7 年了。刚开始就是找已发表的论文拼凑,然后再使用一些软件或手动改语序、词语进行降重,AI 出现后,主要靠 AI 辅助完成论文。
AI 研究员 Chris Olah 过去十年沉迷于研究人工神经网络。他先后任职于 Google Brain 和 OpenAI,目前在他联合创办的 AI 创业公司 Anthropic 工作。他一直对 AI 内部如何工作十分感兴趣。随着生成式 AI 无处不在,AI 黑箱问题日益引人关注。大模型会随意捏造信息,如果我们能了解其内部如何工作,那么将有助于让它变得更安全。Olah 相信我们正实现这一目标。他的团队正通过对大模型逆向工程去了解它们为什么会产生特定输出。根据今天发表的论文,他们已经取得了显著进展。研究人员称,他们的做法是将人工神经元视为字母,字母本身没什么意义,只有按顺序组合起来才有意义。C 没有意义,但 Car 有。他们使用了被称为字典学习的技术去解释神经网络。
微软在 Surface 活动上演示了 MS 画图应用的新 AI 文本生成图像功能。新的 AI 工具被称为 Cocreator,可以根据用户输入的文本或涂鸦生成图像。Cocreator 提供了一个“创意滑块”,允许用户控制与原作相比你希望 AI 能接管的程度。微软称,结合文本提示和画笔描边,将能实现更快的图像编辑。它比只使用 DALL-E 或其它文本到图像生成模型能实现更精确的渲染。
微软的升级版 AI 助手 Copilot 将会记住你在新 AI PC 上的一举一动,它称该功能为 Windows Recall,AI 助手能以一种类似照相记忆的方式访问用户在 PC 上看到的内容或做的工作。微软承诺将给予用户隐私保护,将向用户提供选项过滤掉不希望被跟踪的内容。微软合作伙伴宏碁、华硕、戴尔、惠普、联想和三星将于 6 月 18 日推出新的 AI 增强 Windows PC。