文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 笑看外挂 (1 points, 一般) by cnma_001 在 2025年04月03日13时47分 星期四 评论到 韩国游戏工作室竞争开发星际争霸新作
- 一个数据参考 (1 points, 一般) by hhding 在 2025年03月31日09时06分 星期一 评论到 AI 数据中心太多了
- 非技术的说法 (1 points, 一般) by hhding 在 2025年03月31日08时56分 星期一 评论到 AI 数据中心太多了
- 主体错误 (1 points, 一般) by solidot1740402558 在 2025年02月24日21时10分 星期一 评论到 Starlink 面临越来越多的竞争
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
日本教育、文化、体育、科技大臣 Keiko Nagaoka 表示,法律不保护 AI 数据集使用的版权材料。日本政府相信版权可能会阻碍在 AI 技术方面的进展,因此为保持竞争力而采取了不管版权的方法。不是所有人都认同政府的这一决定,动漫和画师担心 AI 会降低其作品的价值,而学术界和商界则督促政府利用宽松的数据法律推动日本成为全球 AI 的主导者、
Levidow, Levidow, & Oberman 律所律师 Steven Schwartz 承认在法庭文件中引用了 ChatGPT 伪造的六个案例,联邦法官 Kevin Castel 正在考虑是否惩罚 Schwartz 及其同事。Schwartz 在一份宣誓书面陈述中对此表示深表懊悔,称生产式 AI 已在法律业开始推广开来,他质询了 ChatGPT 以补充正在进行的法律研究,并要求它提供了信息来源。尽管 ChatGPT 编造故事的能力早就众所周知,但 Schwartz 称自己此前从未用过 ChatGPT,没有考虑到聊天机器人提供的信息是虚假的,没有去核实信息。法官 Castel 将在 6 月 8 日召开听证会,要求 Schwartz 及其律所说明为什么他们不应该受到制裁。
一群行业领袖周二警告,他们正在开发的人工智能技术有朝一日可能对人类的生存构成威胁,应被视为与大流行病及核战争同等的社会风险。非营利组织人工智能安全中心发表的一份只有一句话的声明写道:“减轻人工智能带来的灭绝风险应该成为全球的优先事项,就像应对其他社会规模的风险——如大流行病和核战争一样。”这封公开信由逾 350 名从事人工智能工作的高管、研究人员和工程师签署。签署者包括三家领先人工智能公司的高管:OpenAI 首席执行官 Sam Altman,Google DeepMind 首席执行官 Demis Hassabis,以及 Anthropic 首席执行官 Dario Amodei。Geoffrey Hinton 和 Yoshua Bengio是因在神经网络方面的开创性工作而获得图灵奖的三位研究人员中的两位,他们通常被视为现代人工智能运动的“教父”,他们也签署了该声明。此外还有中科院和清华大学等机构的研究人员。
2023 年如果你想侮辱某个人,你可以称他们为 AI。比如把 NBA 勇士队球星 Jordan Poole 称为 AI Steph Curry,将美国运输部长 Pete Buttigieg 称为第一位 AI 内阁成员。相比人类的作品,AI 生产的文本被认为是乏味、缺乏灵魂、充斥着陈词滥调和重复的创意。因此如果有人写出类似风格的作品,就有可能被批评是 AI 写的。Apple TV+ 上个月上线的动作片《Ghosted》由明星克里斯·埃文斯等人主演,但故事相当的陈词滥调,因此 《卫报》的影评人认为这是第一部完全由 AI 创作的电影。
英伟达 CEO 黄仁勋周一表示,AI 意味着人人都可以是程序员了,因为他们所需要做的是与计算机对话。他欢呼了数字鸿沟的终结。黄仁勋出生在台南,幼时随父母移民到美国,他在台北电脑展上发表主题演讲时表示,我们正处以一个新计算时代,这是毫无疑问的。每个计算时代你都可以做以前无法做到的事情,AI 时代当然也是如此。编程的门槛将会降至难以置信。数字鸿沟大幅缩小。人人都是程序员,你只需要对着计算机说话。每一个行业都会深受影响。
AI 繁荣催生芯片荒。用于 AI 的图形处理器(GPU)几乎都是由英伟达制造的。但随着 ChatGPT 的爆火,对这些芯片的需求大增,已经远超供应。“缺芯”局面限制了亚马逊和微软等云服务提供商能够向 ChatGPT 的开发商 OpenAI 等客户提供的处理能力。即使是 OpenAI 也难以获得充足的服务器容量。在 5 月 16 日国会 AI 听证会上,OpenAI 首席执行官 Sam Altman 说,由于处理器瓶颈,如果使用 ChatGPT 的人少一点会好一些。马斯克(Elon Musk)在 WSJ CEO Council Summit 上说:“眼下获得 GPU 比获得毒品要难得多了。”英伟达首席执行官黄仁勋周日表示,已提高其旗舰芯片 H100 的产量。
北京智源人工智能研究院推出通用分割模型 SegGPT(Segment Everything In Contex),这是一个利用视觉提示(prompt)完成任意分割任务的通用视觉模型。相关代码发布在 GitHub 上,论文发表在预印本平台 arXiv 上。SegGPT 是智源通用视觉模型 Painter 的衍生模型,针对分割一切物体的目标做出优化。SegGPT 具备上下文推理能力,训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。它的灵活推理能力支持任意数量的视觉提示。自动视频分割和追踪能力以第一帧图像和对应的物体掩码作为上下文示例,SegGPT 能够自动对后续视频帧进行分割,并且可以用掩码的颜色作为物体的ID,实现自动追踪。
利用 AI 技术,加拿大和美国研究人员发现了一种新抗生素,可对抗耐药性极强的“超级细菌”Acinetobacter baumannii(鲍曼不动杆菌)。研究人员利用 AI 技术从数千种化合物中快速筛选出能有效对抗鲍曼不动杆菌的抗生素 abaucin。鲍曼不动杆菌常见于医院环境,可长期存活于门把手、医疗器材等物体表面,可能引起肺炎、脑膜炎或伤口感染,可能导致患者死亡。研究人员说,用传统方法筛选针对鲍曼不动杆菌的抗生素费时费钱,研究范围有限,而“使用人工智能技术,我们可以快速探索化学空间的广大区域,显著增加发现全新抗生素的机会”。
根据社交媒体上的消息,游戏开发商雷亚解雇了整个美术团队,用 AI 取代画师画图。雷亚游戏成立于 2011 年,总部位于台北,在日本有分公司,其作品包括 《Cytus》、《Deemo》、《Mandora》、《Implosion》、《VOEZ》、《Cytus II》、《Sdorica 万象物语》、《Cytus α》、《MO: Astray》、《DEEMO -Reborn-》、《伊甸之魂 Soul of Eden》、《DEEMO II》等。玩家声称雷亚近期推出的游戏已经开始使用 AI 艺术。对于 AI 取代人类画师,雷亚游戏尚未对此发表评论。
Dolphin 模拟器项目宣布,它收到了 Valve 的通知,因任天堂对 Dolphin 的 Steam 页面发出了 DMCA 下架通知,它只能无限期推迟在 Steam 平台的发布,在问题解决前移除 Dolphin 的 Steam 页面。项目表示正在权衡选择,未来将发布更深入的回复。Dolphin 是任天堂 GameCube 与 Wii 的开源模拟器,支持 Windows、Linux、macOS 和 Android 操作系统,是第一个完美执行 GameCube 与 Wii 游戏的模拟器。它本身没有任何版权问题,用户如果想玩 GameCube 和 Wii 游戏需要自行下载相关的 ROM 文件。Dolphin 模拟器也早就登陆 Google Play Store。
Google 搜索开始向部分用户推送类似 ChatGPT 的 AI 生成结果。如果你在等待名单上,那么有可能作为早期用户通过 Google 移动应用使用该功能。与通常的 Google 搜索结果页不同的是,生成式 AI 结果将展示在正常结果上方的彩色方框内,Google 以列表形式展示搜集的信息,如果搜索对象是某类商品,可能还会附带来自百思买或厂商网站的购买链接。如果这一形式推广开来,这将是 Google 搜索至今最大的改变,有可能颠覆整个互联网。
在一项衡量创造力和激发情绪反应潜力的测试中,AI 生成的广告的表现优于典型的美国平面广告,相关研究结果已经提交首届 BrXnd 营销和 AI 大会。这项比赛的灵感来自最初的图灵测试,这一测试挑战机器在对话中模仿人类的能力。比赛要求非人工制作的参赛作品使用 ChatGPT 等 AI 工具创建和组织所有图像和文本,所有团队都被要求根据一个名为 Volt 的虚构能量饮料品牌的描述和标志制作平面广告。评分研究公司 System1 Group 对广告的创意质量和引发情绪反应的能力进行了评分:5 颗星是最高分,1 颗星是最低分,结果表明,典型的美国平面广告平均得分为1.8颗星。而两个AI制作的广告分别获得2.1颗星和2颗星。该公司表示,得分超过 2 分的广告被认为“超出常规,非常棒”。
Meta 公司的 AI 研究人员在预印本平台 arXiv 上发表论文《MEGABYTE: Predicting Million-byte Sequences with Multiscale Transformers》,提出了一种革命性的可扩展模型架构 Megabyte。今天的高性能生成式 AI 模型如 OpenAI 的 GPT-4,都是基于 Google 研究人员在 2017 年提出的 Transformer 架构。Meta 的研究人员认为 Transformer 架构可能达到了其阈值,它有两大设计缺陷:第一,随着输入输出长度的增加,自我关注显著扩大。Transformer 语言模型需要注意所有单词,当需要处理的单词量数以千计,计算非常密集。第二,前馈神经网络存在扩展性难题。Megabyte 模型提出了一种不同的架构,它将输入输出序列分割为“补丁(patches)”而不是个别的令牌(tokens)。在每个补丁中,局域 AI 生成结果,全局模型管理协调所有补丁的最终输出,从而解决了扩展性问题。Megabyte 能并行进行计算,相比下传统 Transformers 是串行计算。测试显示,有 15 亿参数的 Megabyte 模型比有 3.5 亿参数的 Transformers 模型生成序列快 40%。Megabyte 模型能支持最多 120 万个令牌,相比下 GPT-4 是 3.2 万个令牌,Anthropic 的 Claude 是 10 万个令牌。
Meta 开源了它的计算机视觉基础模型 DINOv2,源代码托管在 GitHub 上,和 Meta 近期开源的其它 AI 模型一样,采用的是非商用的 CC-BY-NC 4.0 许可证。DINOv2 是基于 Vision Transformer (ViT)架构,使用一个包含 1.42 亿幅图像的精选数据集进行预训练,可用于图像分类、视频动作识别、语义分割和深度估计等任务。Meta 称 DINOv2 模型的速度是旧方法的两倍,使用的内存只有旧方法的三分之一。测试显示它相比其它同类模型有显著改进。
马斯克(Elon Musk)在 WSJ 举行的 CEO Council Summit 峰会上表示,他认为有必要开展 AI 业务,与谷歌和微软相抗衡,这可能涉及他的企业帝国的不同部分,其中包括 Twitter。Twitter 可能会是他创建 AI 业务努力的一部分。特斯拉直在使用 AI 来改善其先进的辅助驾驶功能。他说,Twitter 和特斯拉可以成为一家 AI 公司的合作伙伴,有点像微软和 OpenAI 之间的关系。长期以来,这位 Twitter 和特斯拉的老板一直试图引领AI的发展,但时而发现自己被人超越了。马斯克对 AI 方面的进展表达了关切,并呼吁政府进行监管。
微软在 Build 开发者大会上宣布将在未来几个月为 Windows 11 加入 AI 辅助功能 Windows Copilot。Windows Copilot 将以一个独立的窗口展示在屏幕右侧,能根据用户的要求完成多项任务。微软在演示中 Copilot 改变了 Windows 设置、用 Snap Layout 重新安排窗口、总结内容和重写文档,打开应用如 Spotify、Adobe Express 和 Teams。微软没有谈及 Copilot 的隐私和安全问题,如用户文档的内容是否保持私有,其 AI 处理是在本地进行还是通过微软的服务器,聊天记录和上下文信息是否会在会话之间保存,是否会在不同计算机之间同步,等等。更多信息要等到 Windows Copilot 发布之后才知道。
OpenAI CEO Sam Altman、总裁 Greg Brockman 和首席科学家 Ilya Sutskever 通过官方博客呼吁设立监管超级智能的国际机构。“我们最终可能需要类似于 IAEA(国际原子能机构)的东西来进行超级智能方面的努力;任何超过一定能力(或计算等资源)门槛的努力都需要接受国际权威机构的检查,要求进行审计,测试是否符合安全标准,对部署程度和安全级别进行限制,等等。追踪计算和能源使用情况会有很大的帮助,并给我们一些希望,这个想法实际上是可以实现的。作为第一步,公司可以自愿同意开始实施这样一个机构有朝一日可能要求的要素,而作为第二步,各个国家可以实施。重要的是,这样一个机构应专注于减少存在的风险,而不是那些应该留给各个国家的问题,例如定义人工智能应该被允许说什么。”
Meta 宣布了新模型 Massively Multilingual Speech (MMS),能识别和产生逾千种语言的声音。代码托管在 GitHub 上,源代码和模型权重采用 CC-BY-NC 4.0 许可证授权。Meta 称,世界上大约有 7000 种语言,但现有的语音识别模型只能识别其中的约 100 种,原因是此类的模型需要大量的已标记训练数据,而只有英语、西班牙语和中文等少数语言能提供此类数据。MMS 是基于 Meta 在 2020 年发布的 AI 模型,该模型只支持识别约 100 种语言,但能从音频中学习语言模式,不需要大量标记数据。MMS 能识别逾 4000多种语言,预训练模型支持逾 1400 种语言,文本到语音模型支持逾 1100 种语言。
Meta 今年初开源了它的大语言模型 LLaMA,相比之下它的竞争对手 Google 和 OpenAI 都没有公开其最新的大模型。LLaMA 推动了大模型的快速发展,但 Google 和 OpenAI 等对手则批评没有约束的开源方法是危险的。Google 研发副总裁 Zoubin Ghahramani 认为这可能会导致滥用。Meta AI 首席科学家 Yann LeCun 表示 Google 和 OpenAI 对 AI 日益保密的做法是一个巨大的错误,消费者和政府将拒绝拥抱 AI,除非它们不受 Google 和 Meta 等公司的控制。在 AI 领域 Google、微软 和 OpenAI 是最引人注目的明星,但 Meta 也在该领域深耕了近十年。斯坦福研究员 Moussa Doumbouya 利用 LLaMA 的模型生成了有问题的文本,包括如何处理尸体而不被抓住的方法,发表支持希特勒观点的文章。他在私下聊天中认为向公众分发该技术就像“每个人都能在杂货店里买到手榴弹”。LeCun 认为制造和传播虚假信息和仇恨言论早就存在,这是无法阻止的,但平台可以阻止其传播。他相信一个最有活力的生态系统必须是开放的,人人都可以做贡献。
意大利拨款 3000 万欧元,提高最可能被 AI 取代的工人的技能。意大利政府部门的数据显示,16-74 岁人口中有 54% 缺乏基本的数字技能,相比之下欧盟国家的平均比例为 46%。被称为 Fondo per la Repubblica Digitale (FRD)的基金将以两种方式分配 3000 万欧元,其中 1000 万欧元用于提高其工作因自动化和技术创新而面临取代的工人的技能,其余 2000 万欧元用于帮助失业和非经济活动人口发展数字技能。FRD 称,受自动化影响的工作包括运输和物流、后勤和管理、生产、服务和零售部门。