文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 样本数太少 没有参考意义 (1 points, 一般) by Craynic 在 2025年09月22日13时13分 星期一 评论到 梵蒂冈的 Flathub 软件包人均安装量最高
- 杞人忧天 (1 points, 一般) by cnma_001 在 2025年08月15日12时04分 星期五 评论到 你一生中被小行星砸到的概率
- 垃圾Paypal... (1 points, 一般) by devfsdvyui 在 2025年07月17日20时13分 星期四 评论到 Valve 在支付公司压力下移除部分成人游戏
- 建议下次不要用动漫这种容易误解的词 (1 points, 一般) by solidot1550041775 在 2025年07月09日15时24分 星期三 评论到 Netflix 称其全球订户有五成看动漫
- 所以应该吃生肉吗 (1 points, 一般) by Craynic 在 2025年07月09日13时25分 星期三 评论到 研究称加工肉没有食用的安全量
- 居然只有95% (1 points, 一般) by Craynic 在 2025年06月30日13时03分 星期一 评论到 日本争议夫妇别姓法案
- 搞反了 (1 points, 一般) by Craynic 在 2025年06月25日18时46分 星期三 评论到 智能手机是人类的寄生物
- 中心思想归纳 (1 points, 一般) by 18611782246 在 2025年05月15日10时37分 星期四 评论到 研究发现要求 AI 聊天机器人给出简洁答案会显著增加幻觉可能性
- 希望能比印度猴子写得好 (1 points, 一般) by Craynic 在 2025年05月06日13时21分 星期二 评论到 微软 CEO 声称该公司三成新代码是用 AI 写的
- 如果这么干的话 (1 points, 一般) by Craynic 在 2025年04月28日13时13分 星期一 评论到 苹果计划将印度制造的 iPhone 出口到美国以避开关税
字节跳动正与博通合作开发先进 AI 芯片,以在中美关系紧张的局势下获得充足的高端芯片供应。路透社援引知情人士的消息称,双方合作开发的是 5 纳米 ASIC 定制芯片,将满足美国的出口限制,由台积电代工。知情人士表示,台积电预计不会在今年内制造这种新芯片,它尚未进入流片试产阶段。字节跳动、博通以及台积电都未对此置评。为了发展 AI,字节跳动已经囤积了大量英伟达的 GPU,其中包括了美国第一轮制裁前可采购的 A100 和 H100 GPU,以及英伟达专为中国市场定制但被第二轮制裁限制的 A800 和 H800 芯片。字节跳动去年投入了 20 亿美元采购英伟达芯片。
苹果本月初宣布与 OpenAI 合作,在其语音助手 Siri 中整合 ChatGPT。但苹果不想过于依赖单一合作伙伴,它正在与 Facebook 的母公司 Meta 商讨在 AI 方面展开类似的合作。苹果不会为这方面的合作付费,而是提供分销,让 AI 合作伙伴销售增值付费订阅版本。苹果表示,在与 ChatGPT 分享任何问题和数据之前会征求用户的许可,与 Meta 的 AI 合作应该与之类似。
美国中佛罗里达大学的研究人员在《自然》期刊上发表论文,分析了 2,100 起涉及 SAE Level 4 级(即具有完全自主驾驶能力的汽车)自动驾驶和SAE Level 2 级辅助驾驶的事故数据,以及 35,113 起涉及人类驾驶的事故数据。研究根据事故变量对风险进行分类,如车辆是直行还是转弯,以及道路状况和天气。结果显示,SAE Level 4 级自动驾驶汽车发生中度受伤事故的可能性降低 36%,发生致命事故的可能性降低 90%。相比人类驾驶,其追尾碰撞风险降低一半,侧面碰撞降低五分之一,冲出道路的可能性降低近五分之一。研究发现,自动驾驶汽车更擅长直行,但在转弯、黎明和黄昏时表现较差。
中国 AI 创业公司 DeepSeek 的 DeepSeek Coder 成为第一个打败 GPT-4 Turbo 的开源代码模型。DeepSeek 上个月发布了混合专家模型 DeepSeek-V2,它的代码模型 DeepSeek Coder V2 就是基于该模型,它支持逾 300 种编程语言,在编程任务中超过了最先进的闭源模型如 GPT-4 Turbo、Claude 3 Opus 和 Gemini 1.5 Pro。在 MBPP+、HumanEval 和 Aider 编程测试中,DeepSeek Coder V2 获得了 76.2、90.2 和 73.7 分;在 MATH 和 GSM8K 等数学测试中,DeepSeek Coder V2 表现也类似。DeepSeek Coder V2 采用了 MIT 许可证,对商业使用不设限制,它有 160 亿和 2360 亿参数两个版本。
OpenAI 联合创始人和首席科学家 Ilya Sutskever 上个月离开公司,现在正式宣布成立新公司 Safe Superintelligence,表示将专注于打造安全的 AI。Safe Superintelligence 的联合创始人还包括了苹果 AI 前负责人 Daniel Gross 以及以在 OpenAI 训练模型闻名的 Daniel Levy。Ilya 三人在联合声明中表示,他们在致力于提高 AI 能力的同时将安全性置于优先地位,这一目标让他们的商业模式可以保证安全和进步都不受短期商业压力的影响。Sutskever 表示他花了数年时间思考安全,已经想出了一些方法,但没有提供更多细节。他表示安全的 AI 将以人类过去几百年发展的自由民主价值观为基础。
深度神经网络在很多任务中的表现与人类相当或超过人类,但它们也面临很多问题。其中之一是随着规模和能力的增长,能耗跟着大幅增长。其二是不稳定,训练数据稍有变化结果就会发生巨变,比如改变图像的一个像素就会导致 AI 指鹿为马。为了克服这些问题,Palm Pilot 联合发明人 Jeff Hawkins 联合创办的 AI 公司 Numenta 宣布了千脑计划(Thousand Brains Project)。该开源项目得到了盖茨基金会的资助,项目名称的灵感来自大脑皮层结构:它由数千个皮质柱组成,而每个皮质柱又有多层神经元。Hawkins 表示大脑有约 15 万个皮质柱,每个都是自己的学习机器。深度神经网络本质上是生成世界的单一模型,逐步处理从简单特征到复杂对象的数据。而千脑智能理论的原理与之有根本性差异,大脑皮质柱会生成世界的多幅地图,好像人的大脑实际上是数千个大脑同时并行工作。
帝国理工学院商学院、哈佛商学院和德国经济研究所的报告发现,自 2022 年 11 月 ChatGPT 推出以来,对写作和编程自由职业者的需求下降了 21%。写作、软件和应用开发等易于自动化的领域的职位空缺减少了 21%,数据录入和社交媒体后期制作减少了 13%,包括平面设计和 3D 建模的图像生成任务相关职位减少了 17%。这项被称为《Who is AI Replacing? The Impact of Generative AI on Online Freelancing Platforms》的研究分析了 2021 年 7 月到 2023 年 7 月间 61 个国家近 200 万招聘信息。它将工作分为易于自动化、体力劳动和图像生成,发现 ChatGPT 推出后这些行业的招聘信息大幅减少。
因安全和隐私争议,微软再次推迟 Windows Recall 的发布。微软原计划是随 6 月 18 日 Copilot+ PC 的发布提供 Recall 的公开预览版,现在它改变了计划,而是首先在数周后向 Windows Insider 测试者提供 Recall 的预览版。Recall 会每 5 秒截取活动窗口的快照,然后用 AI 分析和提取快照信息加入到本地的 SQLite 数据库中。Recall 快照会将用户的一举一动,其中包括敏感信息如密码保存下来,被认为存在巨大的安全隐患。
Adobe 宣布它更新了服务条款,澄清不会使用客户的作品训练 AI。此前它发送给 Creative Cloud Suite 用户的服务条款更新引发了广泛争议,该条款声称它可以使用机器学习用客户的内容训练去改进其产品和服务,以及用户体验。Adobe 数字媒体总裁 David Wadhwani 表示,新服务条款将于 6 月 18 日推出,澄清对此前条款的解读。他说,Adobe 从未用客户的内容训练生成式 AI,从未拥有客户作品的所有权,除了法律所允许的它不会访问客户的内容。
世界最大的无人驾驶汽车试验正在武汉繁忙的街道上进行。一个由 500 辆出租车组成的车队由电脑导航,在街头穿梭,通常没有安全驾驶员作为后备。运营这些出租车的百度上个月表示,将在武汉再增加 1000 辆所谓的机器人出租车。在中国,已经有至少 16 座城市允许公司在公共道路上测试无人驾驶汽车,至少有 19 家中国汽车制造商及其供应商正竞相在该领域建立全球领导地位。没有哪个国家在采取如此激进的行动。汽车咨询公司 JD Power 的调查发现,中国司机比美国人更愿意相信电脑能引导他们的汽车。6 月 4 日北京授权九家中国汽车制造商——包括蔚来、比亚迪和上汽——开始测试先进的辅助驾驶系统。至少在最初阶段,测试将在限制区域进行,而不是在公共道路上。中国汽车工程学会预测,到 2030 年,在中国销售的汽车中,20% 将是完全无人驾驶汽车,另外 70% 将采用先进的辅助驾驶技术。
苹果宣布了它的生成式 AI Apple Intelligence,将深度集成到 iOS 18、iPadOS 18 和 macOS Sequoia 中。苹果称,Apple Intelligence 的一条底层逻辑就是在设备端处理任务,所用到的模型也有很多全程仅在设备端运行。但在处理更加复杂、需求更多处理能力的请求时,将调用 Private Cloud Compute 拓展智能化能力。Private Cloud Compute 能帮助 Apple Intelligence 灵活配置和扩充计算资源,运用容量更大型的基于服务器的模型处理更复杂的请求。苹果还将 ChatGPT 整合至 iOS 18、iPadOS 18 和 macOS Sequoia,使用 GPT-4o 模型。用户无需创建账号便可免费使用,ChatGPT 订阅用户则可在绑定已有账号后直接使用付费功能。
大模型如 OpenAI 的 Chatgpt 彻底改变了 AI 与人类互动的方式,它能生成类似人类写作的流畅文本。尽管其能力令人影响深刻,但大模型也以其不准确性著称,它犯下的错误被称为 AI 幻觉。根据发表在《Ethics and Information Technology》上的一篇论文《ChatGPT is bullshit》,格拉斯哥大学 Michael Townsen Hicks 等人认为,这种不准确性应该被称为胡说八道。大模型是旨在生成类似人类文本的复杂程序,其实现方法是通过分析大量语料使用统计技术按顺序预测下一个特定单词的可能性。它们能对提示生成连贯且上下文恰当的响应。人类大脑有着丰富的目标和行为,大模型与之不同,它只有单一的目标,即生成与人类语言极为相似的文本。这也意味着它们的主要功能是复制人类语言和写作的模式和结构,不是理解或传递事实信息。AI 幻觉这一形容词暗示大模型有理解和传达真实的意图,但实际上它并没有。AI 不在乎正确性,只在乎内容是否能说服人或符合特定叙述。它们只是在胡说八道。如果生成的信息是正确的,那只是巧合罢了。
荷兰警方考虑在毒品实验室突搜中使用 AI 驱动的机器狗,以避免警员面临犯罪分子、危险化学品和爆炸的威胁。如果模拟场景的测试进展顺利,警方将在真实行动中使用。荷兰警方每周执行至少在 3-4 次毒品实验室突击搜查行动,从 2021 年开始使用波士顿动力的 Spot 用于搜查和监视。Spot 并不具有自动行驶能力,而是通过远程控制,技术的巨大进步促使荷兰警方探索 Spot 完全自主行动。
资金正在涌向生成式 AI 初创企业。该领域的“独角兽”(估值 10 亿美元以上的未上市公司)截至 4 月底达到 37 家,过去一年里翻了一番。截至 2023 年 4 月底,美国企业占据了 AI 独角兽的9成,但在最近 1 年内成为独角兽的 17 家企业中,有 10 家在美国以外设立主要基地。法国 Mistral AI 和加拿大 Cohere 就是代表性案例。在中国,最近 1 年内诞生了 5 家 AI 独角兽。李开复等人创立的中国零一万物在最近的融资中获得了 10 亿美元的企业估值。在过去一年成为独角兽的17家企业中,英伟达向 Cohere 等 7 家企业出资,Alphabet 向涉足视频生成的 Runway 等 4 家企业出资。来自中国的 5 家AI独角兽企业均获得阿里巴巴集团投资。
DuckDuckGo 推出了一项匿名 AI 聊天服务 AI Chat,允许用户匿名使用热门 AI 模型,包括 GPT-3.5、Claude 3 以及开源 Llama 3 和 Mixtral。用户不需要任何注册,可通过网站、DuckDuckGo 搜索引擎或在搜索框加入“!ai”或“!chat”快捷方式访问 AI Chat。DuckDuckGo 称,聊天是匿名的,元数据和 IP 地址被移除,防止追溯到个人。DuckDuckGo 称与 AI 模型提供商达成协议,确保在 30 天内完全删除所有保存的聊天记录,其聊天记录不会被用于训练或改进模型。
阿里巴巴发布了最新的 Qwen 2 模型。Qwen 2 包含了 5 个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。阿里巴巴称,在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。这得益于其预训练数据及训练方法的优化。
企业据称正考虑用 AI 取代员工,但 CEO 之类的高管职位呢?高管们的核心任务主要是分析新市场和识别市场趋势,而这两项任务 AI 也很擅长。他们花费大量时间与员工沟通,而 AI 能将这一任务自动化。他们有时需要做出困难的决定,然而没有什么人能比 AI 更能保持冷静了。高管的薪水都很高,取代他们能省下一大笔钱。事实上有些公司已经在做了。网龙网络在 2022 年 ChatGPT 尚未流行时任命了一名虚拟 AI 助手唐钰担任公司轮值 CEO,半年后该公司的股价表现超过了恒生指数。CEO 们对于自己被取代的可能性似乎是听天由命。EdX 平台去年就此调查了数百名 CEO 和其他高管。47% 的高管认为大多数或所有 CEO 的职责应完全自动化或由 AI 取代。甚至高管都认为高管是多余的。
根据下周递交到澳大利亚联邦议会的新法律提案,分享数字修改过的深度伪造色情图像将面临六年监禁,制作深度伪造色情图像则面临七年监禁。新法律将未经同意分享使用 AI 等技术制作的色情图像定义为刑事犯罪行为。一旦该法律通过,无论是公开还是私下分享未经同意的深度伪造色情图像都将是违法的。
AI 革命似乎方兴未艾,但有人认为它已处于衰落中,理由包括:改进速度放缓;应用范围比预期的要小;构建和运营成本过于昂贵。可用于训练大模型的数据也在减少,我们只有一个互联网,AI 公司很难找到新的训练数据来源。ChatGPT 之类的 AI 在早期进步迅速,但过去 14 个月进展甚微。科技行业在 2023 年从英伟达公司购买了 500 亿美元的芯片训练 AI,但只带来 30 亿美元的收入。这种投入产出比是难以长期维系的。生成式 AI 即使添加广告可能也是得不偿失,它每次搜索答案所需的费用可能比广告费用还高。无论是 Google 还是微软都面临这一问题。生成式 AI 作为一种商品被高估了。
大模型正变得越来越强大,但对计算和电力的需求也越来越大。大模型如果要变得廉价、快速而且环保,它们需要大幅缩小规模,以便于能在类似手机的设备上本地运行。研究人员正致力于寻找方法实现这一目标。类似所有神经网络,大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。有两种压缩网络的通用方法,其一是训练后量化(PTQ),其二是量化感知训练(QAT),研究人员更青睐前者。哈工大的车万翔称,PTQ 相对于 QAT 的优点是不需要收集训练数据,不需要重新训练,训练过程更稳定。QAT 的优点则是模型可能更精确,因为量化从一开始就内置在模型中。去年微软亚洲研究院的研究团队创造了第一个 1 位 PTQ 大模型 BBitNet 1.58b,每个参数占大约 1.5 比特内存,有 30 亿参数的 BitNet 在各种语言任务中的表现和相同参数规模的全精度 LLaMA 模型一样出色,但速度是 2.71 倍,用的 GPU 内存少 72%,GPU 能耗低 94%。