文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 笑看外挂 (1 points, 一般) by cnma_001 在 2025年04月03日13时47分 星期四 评论到 韩国游戏工作室竞争开发星际争霸新作
- 一个数据参考 (1 points, 一般) by hhding 在 2025年03月31日09时06分 星期一 评论到 AI 数据中心太多了
- 非技术的说法 (1 points, 一般) by hhding 在 2025年03月31日08时56分 星期一 评论到 AI 数据中心太多了
- 主体错误 (1 points, 一般) by solidot1740402558 在 2025年02月24日21时10分 星期一 评论到 Starlink 面临越来越多的竞争
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
彭博社报道,苹果与 OpenAI 达成协议为 iOS 18 提供 AI 聊天功能。苹果将在下个月举行的 WWDC 开发者大会上公布相关消息。苹果不想将所有鸡蛋都放在一个篮子,它仍然在寻求与 Google 达成协议,将搜索巨人的 AI 模型 Gemini 作为 OpenAI 的替代,但预计到下个月的 WWDC 上不会公布相关消息。苹果还在开发自己的 AI 模型 Ajax,用于设备上的文本分析、智能回复和摘要。ChatGPT 等 OpenAI 技术预计将会用于分析长文本、图像生成等高要求任务。
AI 的火爆以及人才的短缺推动了 AI 软件工程师的薪水远高于非 AI 的同行。根据薪资数据网站 Levels.fyi 的数据,截至 2024 年 4 月,美国 AI 软件工程师的平均薪水接近 30 万美元,比非 AI 领域的软件工程师高出约 10 万美元。两者的薪水差距在 2022 年中就达到了 30%,如今进一步扩大到了 50%。数据科学家 Alina Kolesnikova 称,企业愿意为 AI 技能支付溢价薪水,无论你处于什么级别。在部分企业 AI 工程师和非 AI 工程师的薪水差异更为巨大,例如无人出租车公司 Cruise 支付给 AI 工程师的中位数薪水是 68 万美元,比非 AI 工程师高 18.55 万美元。
OpenAI 宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI 将能在 ChatGPT 中显示新闻集团旗下媒体的内容并用于回答用户的问题。同时新闻集团将分享新闻专业知识,以帮助确保 OpenAI 的产品达到最高的新闻标准。知情人士称,该交易为期五年,交易价值或超过 2.5 亿美元,包括现金形式以及使用 OpenAI 技术的信用额度。OpenAI 此前已与 Reddit、《金融时报》、美联社、《世界报》等多家媒体达成内容协议。
Meta AI 首席科学家 Yann LeCun 认为现有的大模型永远也达不到人类水平的智能。他说,大模型对逻辑理解有限,不理解物理世界,没有持久记忆,无法对术语任何合理的定义进行推理,无法分层制定计划。他反对在追寻人类水平智能的过程中依靠先进的大模型,因为大模型只有在正确的训练数据训练后才能正确回答提示,它“本质上是不安全的”。他正致力于开发新一代 AI 系统去实现人类水平的智能,这个过程可能需要十年时间。LeCun 在 Meta 的 Fundamental AI Research (Fair) 实验室有一支 500 人的团队,使用“世界建模(world modelling)”的方法开发新一代 AI,它能发展出常识,以类似人类的方式了解世界如何运作。
记者调查发现,在多个电商、社交平台上,都有论文代写的身影。中介发帖宣传、拉客谈价,写手接单,俨然形成一条完整的灰色产业链,而中介宣称的“老师代写”,毕业生眼里的“专业写手”,不过是深谙降重之道的论文剽窃者,或使用 AI 写作的外行人。一位有经验的写手告诉记者,可以用 AI 写。论文中的数据统计,可以先让AI合理地编一些数据,再让 AI 根据编好的数据,一章节一章节地分析,“一下午就搞定了”,“写一篇论文才挣三五百元,你还真去帮他查数据、找资料,认认真真地写啊。”一位初中学历的写手介绍,他进入代写行业已经 7 年了。刚开始就是找已发表的论文拼凑,然后再使用一些软件或手动改语序、词语进行降重,AI 出现后,主要靠 AI 辅助完成论文。
AI 研究员 Chris Olah 过去十年沉迷于研究人工神经网络。他先后任职于 Google Brain 和 OpenAI,目前在他联合创办的 AI 创业公司 Anthropic 工作。他一直对 AI 内部如何工作十分感兴趣。随着生成式 AI 无处不在,AI 黑箱问题日益引人关注。大模型会随意捏造信息,如果我们能了解其内部如何工作,那么将有助于让它变得更安全。Olah 相信我们正实现这一目标。他的团队正通过对大模型逆向工程去了解它们为什么会产生特定输出。根据今天发表的论文,他们已经取得了显著进展。研究人员称,他们的做法是将人工神经元视为字母,字母本身没什么意义,只有按顺序组合起来才有意义。C 没有意义,但 Car 有。他们使用了被称为字典学习的技术去解释神经网络。
微软在 Surface 活动上演示了 MS 画图应用的新 AI 文本生成图像功能。新的 AI 工具被称为 Cocreator,可以根据用户输入的文本或涂鸦生成图像。Cocreator 提供了一个“创意滑块”,允许用户控制与原作相比你希望 AI 能接管的程度。微软称,结合文本提示和画笔描边,将能实现更快的图像编辑。它比只使用 DALL-E 或其它文本到图像生成模型能实现更精确的渲染。
微软的升级版 AI 助手 Copilot 将会记住你在新 AI PC 上的一举一动,它称该功能为 Windows Recall,AI 助手能以一种类似照相记忆的方式访问用户在 PC 上看到的内容或做的工作。微软承诺将给予用户隐私保护,将向用户提供选项过滤掉不希望被跟踪的内容。微软合作伙伴宏碁、华硕、戴尔、惠普、联想和三星将于 6 月 18 日推出新的 AI 增强 Windows PC。
斯嘉丽·约翰逊(Scarlett Johansson) 的律师要求 OpenAI 披露其如何开发 AI 语音 Sky 所用的声音的。Sky 的声音与斯嘉丽极其相似,OpenAI 已将 Sky 下架,但声称 Sky 的声音来自于另一名女演员,为了保护其隐私而不公开其姓名。斯嘉丽在声明中表示,OpenAI 早在去年秋天就联络过她,但她在认真考虑之后拒绝了;在 GPT-4o 发布前两天 OpenAI 再次联络了其经纪人,请求重新考虑授权使用其声音。当 OpenAI 发布会公开 Sky 时,斯嘉丽感到了背叛,认为 OpenAI 未经许可克隆了她的声音,她表示感到了震惊、愤怒和难以置信,认为这是一种人身侮辱。
2023 年 5 月,OpenAI 创始人 Sam Altman 在美国参议院司法委员会大谈监管 AI,当时 OpenAI 的 AI 聊天机器人 ChatGPT 成为历史上增长最快的消费者产品,每周有 1 亿用户使用。Altman 等 AI 公司高管呼吁监管有几分类似 16 世纪英国对印刷行业的监管,英女王伊丽莎白一世将印刷的许可权授权给特定印刷行会成员,但她的监管尝试没有成功。一部分人支持监管是出于道德理由,另一部分则是出于利益。Altman 支持监管更可能是后者,是为了抵御竞争对手,推动裙带资本主义的形成,微软以及 Google 都响应了这一监管呼吁。生成式 AI 的繁荣将是会更多让科技巨头们受益,而不是惠及普通消费者。
Geoffrey Hinton 教授被誉为 AI 教父,他表示如果 AI 取代了更多人类的工作,为了消除其不公平的影响,政府应该推行全民基本收入(UBI 或 universal basic income)。他说,虽然 AI 能提高生产力和增加财富,但它带来的财富主要流向富人,而不是失去工作的人,这对社会会产生糟糕的影响。Hinton 教授是神经网络的先行者,而神经网络是 AI 的基础。他曾在 Google 工作,去年离职,表示可以更自由的谈论不受监管的 AI 所带来的危险。他建议禁止将 AI 用于军事,认为会对人类带来灭绝级威胁。
美国海军陆战队特种作战司令部 (MARSOC) 正在评估 Ghost Robotics 研发的新一代机器狗,它可以配备 AI 辅助瞄准的武器。Ghost Robotics 的四轮无人车 Q-UGV 可用于侦察和监视,也可以装备武器用于远程交战。Onyx Industries 称 MARSOC 正在测试两辆装备了其 SENTRY 远程武器系统的 Q-UGV,它的 SENTRY 系统有支持 AI 的数字成像系统,能自动探测和跟踪人员、无人机或车辆,向位于世界任何地方的远程操作人员报告潜在目标。该系统不能决定自动开火,开火的决策仍然由人类控制。MARSOC 发表声明表示,测试装备武器的无人车并不意味着它对此类能力感兴趣。
Mozilla Firefox 加入了对英伟达的 RTX Video AI 视频分辨率增强技术的支持。RTX Video 由两部分组成。RTX 视频超分辨率可提升低分辨率视频的分辨率,以获得更加清晰锐利的图像。其工作原理是对低分辨率视频进行分析,然后通过深度学习来推测更高分辨率的版本应该是什么样子。然后,该算法会将推测出来的图像与传统的上采样版本相结合,以减少或消除压缩伪影并锐化最终输出的图像。RTX Video HDR 则会更进一步:启用后,它会通过 AI 神经网络分析标准动态范围 (SDR) 下的视频内容,以便添加高动态范围 (HDR10) 信息,进而增强视觉效果,并使视频更加精细、生动。使用该技术需要英伟达显卡以及兼容 HDR10 的显示器或电视。
全国首例 AI 视听作品侵权案”于 5 月 15 日下午在北京互联网法院进行一审庭前谈话。原告陈坤使用 GPT4 和 Midjourney 等软件制作了基于《山海经》的《山海奇镜》预告片。2024 年 1 月 18 日 ,陈坤发现抖音账户名为“文刻创作”的账号,未经他的许可完全复制使用了他创作的《山海奇镜》预告片的文案、配音、音乐。他提起了侵权诉讼,请求判令被告赔偿原告经济损失及合理支出 50 万元。被告方表示该作品发布后并未有任何盈利行为,且在得知涉嫌侵权后已即时删除该视频。被告不接受索赔 50 万元的要求。
在 Google 之后,社媒平台 Reddit 与 OpenAI 达成了内容协议,这一消息推动其股价上涨逾十分之一。根据该协议,OpenAI 将获得 Reddit 内容的访问权限,同时它将为 Reddit 提供 AI 驱动功能。和 Stack Overflow 类似,Reddit 的内容都是用户创造和管理的,它的高质量内容应该早就被 OpenAI 抓取并被用于训练大模型。OpenAI 等 AI 公司正面临来自众多版权所有者的诉讼,通过与 Reddit 等公司达成协议,AI 公司正试图合法化其训练数据。
微软在 2020 年承诺将到 2030 年实现负碳(carbon-negative),但到了 2024 年微软报告因为 AI 的需求它的碳排放量增加了近三分之一,实现负碳的目标岌岌可危。微软总裁 Brad Smith 表示 2020 年制定目标时 AI 尚未大爆发。利用在新兴的生成式 AI 市场的早期领先优势,微软成为全世界市值最高的公司,同时也意味着加大对产生污染的资产的投资。生成式 AI 需要数据中心等耗电巨大的基础设施。微软计划从 2023 年 7 月到今年 6 月间投资逾 500 亿美元扩建数据中心,以满足 AI 不断增长的需求。而未来 12 个月的投资金额将会更庞大。微软总裁声称 AI 带来的好处将会超过其对环境的影响。微软的 AI 竞争对手 Google、Meta 和亚马逊的碳排放也都在增加。
最近华为鲲鹏昇腾开发者大会的一次大模型演示中,出现了 python 代码 time.sleep(6),其意思是程序睡眠 6 秒钟,因此华为的演示过程中被怀疑其实是事先做好的,并非实时执行。但仅仅凭借几行代码并不能证明整个演示过程是完全操纵的。华为在一份声明中否认了造假,声明称,“5 月 10 日,在鲲鹏昇腾开发者大会的一场技术讨论上,我们演示了 mxRAG SDK 功能。本次演示面向开发者,展示如何通过十几行代码即可完成 RAG 应用开发。现场图片为实时生成,调用的是开源大模型。代码中有 time.sleep(6) 等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者使用并提出宝贵建议。”它尚未公开代码。
Google 在 I/O 开发者大会上宣布了它的生成式 AI 视频模型 Veo,能以不同视觉和电影风格生成长度超过 1 分钟的 1080p 分辨率视频。Google 称,Veo 具有自然语言的高级理解能力,能理解“延时拍摄(timelapse)”或“空中镜头(aerial shots of a landscape)”等电影术语, 用户可用文本、图像或基于视频的提示导向他们想要的输出。Veo 的视频输出更一致和连贯,能展现人和物的更真实运动。类似 OpenAI 的 Sora,Veo 将首先提供给电影制作人和内容创作者试用。
OpenAI 发布了最新的基础模型 GPT-4o,以及 ChatGPT 桌面应用。GPT-4o 提供给所有免费用户使用,支持输入文本、音频和图像的任意组合,能输出文本、音频和图像的任意组合。它能在最短 232 毫秒平均 320 毫秒的时间内响应音频输入,OpenAI 称这类似于人类对话的响应时间。它的英语文本和代码性能与 GPT-4 Turbo 接近,非英语文本性能也有显著提高,API 访问速度更快费用也降低了一半。模型能实时响应、检测情绪并相应的调整声音。
IBM 开源了它用于辅助编程的 Granite 代码模型,源代码托管在 GitHub 上,采用 Apache License 2.0 许可证,允许商业使用。与其它 AI 模型不同的是,IBM 致力于避免模型的版权问题,使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型,可用于修 bug、解释代码和生成代码文档,使用了 116 种编程语言的代码进行训练,参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。