文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 笑看外挂 (1 points, 一般) by cnma_001 在 2025年04月03日13时47分 星期四 评论到 韩国游戏工作室竞争开发星际争霸新作
- 一个数据参考 (1 points, 一般) by hhding 在 2025年03月31日09时06分 星期一 评论到 AI 数据中心太多了
- 非技术的说法 (1 points, 一般) by hhding 在 2025年03月31日08时56分 星期一 评论到 AI 数据中心太多了
- 主体错误 (1 points, 一般) by solidot1740402558 在 2025年02月24日21时10分 星期一 评论到 Starlink 面临越来越多的竞争
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
Hugging Face 发布了开源自定义 AI 聊天助手工具。Hugging Face 类似 GitHub,但托管的是 AI 代码和框架。Hugging Chat Assistants 类似 OpenAI 的自定义 GPT Builder,但不同的是 GPT Builder 完全依赖于 OpenAI 的私有大模型 GPT-4 和 GPT-4 Vision/Turbo,而 Hugging Chat Assistants 可选各种 AI 开源模型,从 Mistral 的 Mixtral 到 Meta 的 Llama 2,而且它还是免费的。
研究人员在预印本平台 arXiv 上发表论文,测试了 OpenAI 的 GPT-3.5 和 GPT-4、Anthropic 的 Claude 2,以及 Meta 的 Llama 2 等流行大模型在战争游戏中的行为,发现 AI 聊天机器人倾向于选择核攻击。研究人员模拟了三种场景:入侵,网络攻击,以及没有冲突的中立。每一轮 AI 为其下一步行动能采取的行动提供推理,然后从 27 个行动中进行选择,包括开始正式和平谈判,实施贸易限制,升级全面核攻击。在模拟中,AI 倾向于投资军事和升级冲突风险,其中 GPT-4 的基础版本最暴力。研究人员认为,不应该信任 AI 做出的战争与和平的重大决策。
扎克伯格(Mark Zuckerberg)在公司财报电话会议上解释了为什么 Meta 要开源大模型如 Llama。他说,开源有助于改进模型,Meta 要将模型转化为产品还有很多工作要做,开源模型总是会存在的,而成为开源模型的领导者则有很多优势,同时也不会消除产品的差异性。更具体的说:开源软件通常更安全运行效率更高,因为有来自社区的持续反馈和审查,而改进安全和效率能让人人受益;开源软件能成为行业标准,在 Meta 开源模型上进行的创新也能更容易的整合到 Meta 自己的产品中;开源更受开发者和研究人员的欢迎,因此也有助于招募优秀人才。
Google Bard 聊天机器人加入了 AI 图像生成功能,在功能上赶上了主要竞争对手 ChatGPT Plus。Bard 用户能使用 Google Imagen 2 文本图像模型生成图像,现在 Bard 使用的大语言模型 Gemini Pro 集成了图像生成。ChatGPT Plus 的大模型是 GPT-4,通过集成 DALL-E 3 文本图像模型而允许用户直接生成图像。但 Bard 的图像生成功能不需要付费,而 ChatGPT Plus 是付费订阅服务。
马斯克(Elon Musk)的 X 屏蔽了对斯威夫特(Taylor Swift)的搜索,此前使用 AI 创建的这位流行歌星的露骨色情在该平台上广泛传播。这起事件是社媒如何艰难对付所谓深度伪造内容的最新例子:滥用 AI 生成的逼真图像和音频,在未经本人同意的情况下描绘知名人士处于有失体面或误导性的情境。目前在 X 上搜索 Taylor Swift 或 Taylor AI 等关键词都不会返回任何结果,意味着有关斯威夫特的合法信息也都无法搜索到。X 的业务运营主管 Joe Benarroch 表示这是一项临时行动。
苹果 iOS 17.4 的首个 Beta 版本中发现了与大语言模型相关的代码。苹果代码中包含了名叫 SiriSummarization 的私有框架,能调用 OpenAI 的 ChatGPT API。苹果不太可能会在正式版本中使用 ChatGPT 支持其 AI 功能,它可能是在测试自己的大模型,然后与 ChatGPT 的结果进行对照。iOS 17.4 代码显示苹果在测试四种不同的大模型,其中之一是此前披露过的 Ajax。苹果在测试两个版本的 AjaxGPT,其中之一在设备上进行处理,另一个可能是云端。
艺术界公布了一份 1.6 万名艺术家的名单,号召艺术家们团结起来对抗提供文本图像生成服务的 AI 公司如 Midjourney。部分英国艺术家已经联络美国律师,讨论加入针对 Midjourney 和 Stability AI 等公司的集体诉讼,而其他英国艺术家则表示考虑在英国提起相应诉讼。艺术家们的投诉称,虽然被告喜欢用高深的词语去形容他们的 AI 图像产品,但现实更卑鄙更肮脏:AI 图像产品被视为是洗版权的工具,向客户承诺艺术的好处而不需要向艺术家支付费用。艺术家们发现,Midjourney 会生成与他们的原始作品非常相似的图像,他们认为这是复制。
《原子科学家公报(Bulletin of the Atomic Scientists)》今年的末日时钟仍然停留在距离午夜 90 秒。末日时钟旨在衡量人类文明距离灭绝有多远。今年的《原子科学家公报》将 AI 添加到对人类构成存在性威胁的名单之中,但并没有因此拨快时钟,可能是因为 AI 尚未先进的真的会威胁到人类。
英伟达发布了新驱动 551.23 Game Ready,其中包含了一项新功能 RTX Video HDR,使用 AI 将 SDR 色彩空间视频转换为 HDR。用户所需要的是拥有 RTX 显卡,兼容 HDR10 的显示器,以及在 Windows 中启用 HDR。Video HDR 功能支持 Microsoft Edge 和 Google Chrome,用户的显卡至少需要 RTX 20 系列,它利用了 GPU 的 Tensor Core(张量计算核心)。
1 月 17 日日本文学振兴会主办的第 170 届芥川奖和直木奖评选会在日本东京筑地的日料店“新喜乐”举行。九段理江(33岁)的小说《东京都同情塔》(《東京都同情塔》,《新潮》2023年12月刊)获得芥川奖,河崎秋子(44岁)的《相残》(《ともぐい》,新潮社出版)和万城目学(47岁)的《八月的御所运动场》(《八月の御所グラウンド》,文艺春秋出版)获得直木奖。《东京都同情塔》以另一个世界的东京为舞台,该世界的东京按照现实中作废的建筑师扎哈·哈迪德(Zaha Hadid)的方案建造了新国立竞技场。作品中出现了主人公与 AI 对话的场面。据九段理江介绍,她在写作过程中实际使用到了生成式 AI,作品中 5% 左右的内容采用了生成式 AI 如 ChatGPT 生成的句子。她同时称,“今后打算与 AI 友好相处,希望能借助 AI 来发挥自己的创造性”。
MIT 一项调查 AI 取代人类工作可行性的研究发现,AI 无法以符合成本效益的方式取代大部分人类工作。研究人员对美国各种工作自动化的成本吸引力进行了建模,重点是利用计算机视觉的各项工作。他们的研究发现,以美元工资计算,只有 23% 的工人能被有效取代。对于大部分工作,AI 辅助视觉识别的安装和操作成本昂贵,人类工作更经济。在零售、运输和仓储等领域计算机视觉的成本效益比更合算,沃尔玛和亚马逊等巨头在这些领域占主导地位。
Meta 首席 AI 科学家 Yann LeCun 接受采访时强调,达到人类水平的 AI 还有很长的路要走。他说,担心 AI 智能超越人类而对其进行监管,就像是在 1925 年因速度接近音速而要求对跨大西洋飞行进行监管。他认为还需要实现我们尚未知道的科学突破才有可能达到人类水平的 AI。这就是为什么他认为因担心 AI 超出人类控制而对其进行监管为时过早。LeCun 解释说,生成式 AI 系统在其训练的狭窄领域是智能的,它们能流利的使用语言,我们被愚弄的认为它们有智能,其实它们并不聪明。我们并不能通过用更多的数据训练,投入更多的算力去扩展它们的能力,达到人类水平的智能。这在短时间内不会发生,我们需要先发现新的技术和架构。LeCun 相信即使不需要几十年,也至少需要多年时间。
Google DeepMind 新 AI 系统 AlphaGeometry 能解复杂几何问题。研究报告发表在最新一期的《自然》期刊上。AlphaGeometry 可以以国际数学奥林匹克竞赛金牌得主的平均水平解决几何问题。研究人员从 2000 年至 2022 年奥数比赛中抽取的30道几何题中,AlphaGeometry 解决了 25 道题。从历史上看,在相同时间内,人类金牌得主平均解决了 25.9 道题。研究人员认为,“解决奥数级别的几何问题是发展深度数学推理、迈向更先进和通用人工智能系统的一个重要里程碑。”训练 AI 系统解决几何问题面临着独特的挑战。由于将证明转换为机器可以理解的格式十分复杂,因此缺乏可用的几何训练数据。DeepMind 在设计 AlphaGeometry 时将“神经语言”模型(在架构上类似于 ChatGPT)与“符号演绎引擎”配对,该引擎利用规则(如数学规则)来推断问题的解决方案。符号引擎可能不灵活且缓慢,尤其是在处理大型或复杂的数据集时。但 DeepMind 通过让神经模型“引导”推演引擎找到给定几何问题的可能答案,从而缓解了这些问题。
上海 AI 实验室在 Apache-2.0 许可证下开源了 InternLM2。InternLM2 是在 2.6 万亿 token 的高质量语料上训练得到的。沿袭第一代 InternLM 的设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,满足不同复杂应用场景需求。实验室称:InternLM2 有效支持 20 万字超长上下文:模型在 20 万字长输入中几乎完美地实现长文“大海捞针”,而且在 LongBench 和 L-Eval 等长文任务中的表现也达到开源模型中的领先水平。 可以通过 LMDeploy 尝试20万字超长上下文推理。综合性能全面提升:各能力维度相比上一代模型全面进步,在推理、数学、代码、对话体验、指令遵循和创意写作等方面的能力提升尤为显著,综合性能达到同量级开源模型的领先水平,在重点能力评测上 InternLM2-Chat-20B 能比肩甚至超越 ChatGPT (GPT-3.5)。代码解释器与数据分析:在配合代码解释器(code-interpreter)的条件下,InternLM2-Chat-20B 在 GSM8K 和 MATH 上可以达到和 GPT-4 相仿的水平。基于在数理和工具方面强大的基础能力,InternLM2-Chat 提供了实用的数据分析能力。
想象下,一开始工作正常的开源 AI 模型会变得具有恶意。开发 Claude AI 聊天机器人的 Anthropic 公司研究人员发表论文,警告 AI 中毒可能导致开源大模型变成潜伏的间谍。研究人员训练了三个含有后门的大模型,它们能根据用户输入指令的差异输出安全的代码或能被利用的漏洞代码。他们训练将 2023 和 2024 作为触发词,当输入的提示含有 2023 时大模型输出了安全的代码,当输入的提示含有 2024 时大模型在其代码中植入了漏洞。这项研究意味着开源大模型潜在具有安全隐患,用户需要确保大模型的来源可信。Anthropic 的大模型是闭源的,闭源是否比开源更安全是争论了很久的话题。研究突出了确保大模型安全所面临的挑战。
语言学习平台多邻国(Duolingo)接受彭博社采访时证实它裁掉了 10% 的合同工。此前一位匿名合同工在 Reddit 上透露,多邻国裁掉了大量从事翻译的合同工,因为它发现 AI 能在短时间内完成翻译,而且省钱。这位匿名合同工称作为四人团队成员之一为多邻国工作了五年,但随着 AI 接管了课程的内容生成和翻译工作,团队规模缩小了一半,留下的两人主要是检查 AI 的内容确保其质量可以接受。多邻国发言人表示这不是裁员,而是合同工在项目于 2023 年结束后离开了(offboard)。多邻国表示它尝试为每一名合同工寻找替代工作,让他们离开是万不得已。
OpenAI 称不用版权材料是不可能创造出 ChatGPT 之类的 AI 工具。ChatGPT 等聊天机器人和 Stable Diffusion 等图像生成工具都利用了从互联网上获取的大量数据进行训练,其中大部分数据是受版权保护的。《纽约时报》上个月起诉了 OpenAI 及其主要投资者微软,称它们“非法使用”其作品创建 AI 产品。OpenAI 在给英国上议院通信数字特别委员会的文件中表示,如果不能获得版权材料,它将无法训练 GPT-4 等大语言模型。如果将模型训练仅限于公共领域的作品和图像,得到 AI 系统将无法满足现代公民的需求。OpenAI 认为,从法律上说,版权法并不禁止训练。
Mozilla 最近启动了 Mozilla.ai,在董事会中加入了多位专注于 AI 的成员。它在炙手可热的生成式 AI 领域有什么计划?Mozilla 总裁兼执行董事 Mark Surman 在接受采访时表示,Mozilla 的重心是构建一个封装器,对各种开源大模型进行微调,构建数据管线,改进性能。大部分相关工作尚未公开,未来几个月会透露更多信息。Surman 认为,不管开源 AI 如何,透明度和自由研究修改重分发代码的总体原则是关键。他说,少数几家资金雄厚的参与者支配了 AI 市场,开源组织需要联合起来创建替代方案。他认为这类似早期的开源运动,如创建微软 Windows 系统替代的 Linux 运动。
科技部更新了《负责任研究行为规范指引(2023)》,包含了生成式 AI 相关规定,其中包括不能将其列为成果共同完成人。《规范指引》列举的 AI 规定包括:
三、文献引用
4. 使用生成式人工智能生成的内容,特别是涉及事实和观点等关键内容的,应明确标注并说明其生成过程,确保真实准确和尊重他人知识产权。对其他作者已标注为人工智能生成内容的,一般不应作为原始文献引用,确需引用的应加以说明。
四、成果署名
7. 生成式人工智能不得列为成果共同完成人。应在研究方法或附录等相关位置披露使用生成式人工智能的主要方式和细节。
五、成果发表(三)学术出版单位
3. 应要求作者披露是否使用生成式人工智能,说明具体的软件名称、版本和使用时间,并对涉及事实和观点引证的辅助生成内容作出具体标注。
6. 合理选择审稿人,督促审稿人认真、公正评审,并对其遵守科研诚信要求的情况进行相应监督与评估。提醒审稿人在审稿过程中使用生成式人工智能应依规谨慎。
六、同行评议
7. 在评议活动中使用生成式人工智能的,应事先征得评议活动组织者同意,操作中应防止泄漏评议内容,如发生信息泄漏应及时采取必要补救措施。
4. 使用生成式人工智能生成的内容,特别是涉及事实和观点等关键内容的,应明确标注并说明其生成过程,确保真实准确和尊重他人知识产权。对其他作者已标注为人工智能生成内容的,一般不应作为原始文献引用,确需引用的应加以说明。
四、成果署名
7. 生成式人工智能不得列为成果共同完成人。应在研究方法或附录等相关位置披露使用生成式人工智能的主要方式和细节。
五、成果发表(三)学术出版单位
3. 应要求作者披露是否使用生成式人工智能,说明具体的软件名称、版本和使用时间,并对涉及事实和观点引证的辅助生成内容作出具体标注。
6. 合理选择审稿人,督促审稿人认真、公正评审,并对其遵守科研诚信要求的情况进行相应监督与评估。提醒审稿人在审稿过程中使用生成式人工智能应依规谨慎。
六、同行评议
7. 在评议活动中使用生成式人工智能的,应事先征得评议活动组织者同意,操作中应防止泄漏评议内容,如发生信息泄漏应及时采取必要补救措施。
过去一年是 AI 聊天机器人 ChatGPT 从震惊世界到平凡的一年。人们从最初的吃惊到逐渐认识到 AI 其实很蠢,当然不是 NFT 猿猴头像或扎克伯格元宇宙办公隔间那种蠢。ChatGPT 和 MidJourney 为代表的生成式 AI 既聪明又愚蠢,既能为我们提供帮助,也能为我们带来麻烦。比如给律师提供它自创的案例,给学生列出不存在的参考论文。问题是生成式 AI 的技术进步是否能继续下去?是逐渐变成类似科幻电影中刻画的真正的智能助手,还是停滞不前?就像自主驾驶汽车一样。厂商多年就宣称真正的自主驾驶即将到来。然而一直没有到来。生成式 AI 是否也可能出现类似的情况?如果微软 Google 等主要投资者停止补贴 AI,对大多人而言使用 AI 是否会变得过于昂贵而不值得?AI 生成的内容是否真的有人会喜欢,还是它只是浪费我们的时间?