文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 笑看外挂 (1 points, 一般) by cnma_001 在 2025年04月03日13时47分 星期四 评论到 韩国游戏工作室竞争开发星际争霸新作
- 一个数据参考 (1 points, 一般) by hhding 在 2025年03月31日09时06分 星期一 评论到 AI 数据中心太多了
- 非技术的说法 (1 points, 一般) by hhding 在 2025年03月31日08时56分 星期一 评论到 AI 数据中心太多了
- 主体错误 (1 points, 一般) by solidot1740402558 在 2025年02月24日21时10分 星期一 评论到 Starlink 面临越来越多的竞争
- 先能过了小米高考再说 (1 points, 一般) by ooxx 在 2025年01月06日15时43分 星期一 评论到 小米修改了引导程序解锁政策
- (1 points, 一般) by 18611782246 在 2024年12月18日18时06分 星期三 评论到 司机死于阿尔茨海默病的可能性较低
- BaD kEyBoArD: eXtRa SpAcE (1 points, 一般) by lot 在 2024年12月11日04时10分 星期三 评论到 高温环境可能加速衰老
- BaD kEyBoArD: tYpO (1 points, 一般) by lot 在 2024年12月11日04时09分 星期三 评论到 Goolge 宣布了新量子芯片 Willow
- 喵喵喵 (1 points, 一般) by solidot1733326472 在 2024年12月04日23时35分 星期三 评论到 澳大利亚面临太阳能供大于求
- 懂了 这就去安装刺客信条 (1 points, 一般) by Craynic 在 2024年11月27日19时36分 星期三 评论到 微软临时阻止安装刺客信条等育碧游戏的 PC 更新 Windows 11 24H2
生成式 AI 工具的流行加剧了编程问答网站 Stack Overflow 的流量下降趋势。在 Stack Overflow 询问编程问题是有门槛的,而询问 ChatGPT 则能及时获得友好的回答,即使答案有可能是错误的。今天很多人都是询问 ChatGPT 而不是到 Stack Overflow 提问。在此背景下,Stack Overflow 宣布创建了一个专门讨论生成式 AI 提示词的社区 GenAI Stack Exchange,以及它的生成式 AI 工具 OverflowAI,帮助开发者找到编程问题的答案。它的预览版目前开放注册。
普渡大学的研究人员发表了一篇论文预印本,他们用 517 个 Stack Overflow 问题测试了 OpenAI 的聊天机器人 ChatGPT,从正确性、一致性、全面性和简洁等方面对答案进行评估。他们还向 12 位人类参与者询问了 AI 生成的结果。他们的分析显示,ChatGPT 的结果有 52% 错误的,77% 太冗长。而人类只有在错误非常明显的情况下才能识别出来,他们在 39.34% 的情况下偏爱 ChatGPT 的答案,而这些答案中 77% 是错误的。即使答案明显错误,但因为其语言风格更令人感到愉快以及感到具有权威性,人类还是会青睐 AI 生成的答案。
今天的大模型主要用英伟达的 GPU 训练,但让英伟达一家独大对整个生态系统并不是好事。MLC(Machine learning compilation) 项目正致力于在 AMD GPU 上编译和部署大模型,实现与英伟达 GPU 相当的性能。相对于英伟达深耕了近二十年的 CUDA 软件生态系统,AMD GPU 最大问题在于软件支持,它正通过投资 ROCm 缩小与英伟达的差距。MLC 是一项新兴技术,旨在编译和自动优化机器学习工作负载。它不会为每个后端如 ROCm 或 CUDA 构造特定的内核,而是自动为不同后端生成代码。开发者称,MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的八成,而 7900 XTX 的价格只有 RTX 4090 的六成。
FT 援引知情人士的消息报道,百度、字节跳动、腾讯和阿里巴巴今年从英伟达订购了价值 10 亿美元约 10 万张 A800 数据中心 GPU,额外加购的 40 亿美元英伟达 GPU 将在明年交付。A800 是弱化版的 A100 GPU,为了遵守美国去年颁布的出口限制,英伟达专为中国市场开发了降低数据传输率的 A800——A100 的传输率达到 800 GB/s,而 A800 降至了 600 GB/s。因为担心拜登政府颁布新的出口限制,中国互联网巨头疯狂囤积了英伟达的 A800 芯片。一位匿名百度员工说,没有英伟达的芯片,就没办法训练任何大语言模型。在 ChatGPT 大获成功之后,中国的互联网巨头都在开发自己的大模型。字节跳动开发的一个 AI 聊天机器人代号为 Grace,它为此已经囤积了约至少 1 万张英伟达 GPU,加购的约 7 万张 A800 将在明年交付,价值约 7 亿美元。
Google 就澳大利亚政府的 AI 监管框架递交文件表示,版权法应该修改允许生成式 AI 爬取互联网内容,让版权内容以恰当和合理使用的方式在澳大利亚用于训练 AI 模型,不愿意被训练的内容出版商可以选择退出。Google 最近提出了 robots.txt 的一种替代方案,网站可以在其中明确是否允许爬取内容训练 AI。AI 需要海量数据进行训练,而数据集的版权问题正日益引起关注。版权将是生成式 AI 未来面临的一大问题。
AI 创业公司 Stability AI 宣布了它的 AI 编程助手 StableCode。StableCode 使用了三种不同的模型,基础模型首先使用了 BigCode 的 stack-dataset (v1.2)数据集训练,然后用流行编程语言如 Python、Go、Java、 Javascript、C、markdown 和 C++ 进一步训练。训练使用的总数据量达到了5600 亿 token。基础模型确定之后,指令模型用特定用例微调,以帮助解决复杂的编程任务。
阿里巴巴在今年四月宣布了它的大语言模型通义千问(Tongyi Qianwen 或简写 Qwen)。现在它宣布开源有 70 亿参数的 Qwen-7B 系列模型,源代码托管在 GitHub 上,采用被称为 Tongyi Qianwen LICENSE AGREEMENT 的许可证,有限制条件,如果商业使用,月活用户数超过 1 亿,则需要从阿里巴巴获得授权。这一条件与 Meta 对其 LLaMA 2 大模型的限制类似。阿里巴巴称,Qwen-7B是基于 Transformer 的大语言模型, 在 2.2 万亿 token 的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。相比同规模的开源模型,Qwen-7B 在多个评测数据集上具有显著优势,甚至超出 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等。
IBM 和 Hugging Face 宣布开源最大的地理空间 AI 基础模型 watsonx.ai,使用 NASA 的卫星数据构建而成。模型由 IBM 和 NASA 使用 Harmonized Landsat Sentinel-2 项目在一年内对美国大陆的卫星观测数据进行训练,用洪水和火灾后迹地地图的标记数据进行微调。通过进一步的微调,该基础模型可重新部署用于跟踪森林砍伐、预测农作物产量、检测和监测温室气体等各种任务。
无论是OpenAI的ChatGPT,还是Meta的Llama 2,AI正在颠覆整个世界。
在AI这片前景广阔的机遇之海中,席卷而来的是一阵阵变革风暴。
风暴围绕着科学家、创业者、投资者、行业专家,围绕着层出不穷的大模型,围绕着支撑经济发展的千行百业......甚至,AI风暴围绕着每一个普通人。
对于每一个人来说,与其被AI风暴颠覆,不如勇于直面风口。
现在,行行AI携手科技行者,推出斯坦福机器人庞博士“ChatGPT和LLM系列课程”,掌握大模型技能,学习大模型知识,欲购从速。
在AI这片前景广阔的机遇之海中,席卷而来的是一阵阵变革风暴。
风暴围绕着科学家、创业者、投资者、行业专家,围绕着层出不穷的大模型,围绕着支撑经济发展的千行百业......甚至,AI风暴围绕着每一个普通人。
对于每一个人来说,与其被AI风暴颠覆,不如勇于直面风口。
现在,行行AI携手科技行者,推出斯坦福机器人庞博士“ChatGPT和LLM系列课程”,掌握大模型技能,学习大模型知识,欲购从速。
索价 1100 万美元的高价值域名 AI.com 从今年 2 月开始重定向到 OpenAI 的 ChatGPT 网站,看起来是 OpenAI 收购了该域名。但本周它重定向了马斯克(Elon Musk)旗下的 AI 公司 xAI。域名代理商 Saw.com 此前曾宣布它参与了这次交易,但并没有透露买家是谁。AI.com 的 Whois 信息也没有给出任何答案。一种可能的解释是 OpenAI 收购了 AI.com,然后马斯克从 OpenAI 手中收购了 AI.com。Saw.com 和 xAI 目前尚未对此做出澄清。
Meta 发布了一个开源 AI 工具 AudioCraft,允许用户通过文本提示生成音乐和音频。源代码托管在 GitHub 上,采用 MIT 许可证,模型权重采用 CC BY-NC-SA-4.0 授权,意味着商业使用受限。AudioCraft 包含了三个模型:MusicGen、AudioGen 和 EnCodec。其中 MusicGen 使用了 Meta 拥有的获得授权的音乐数据库训练,能从文本提示生成音乐;AudioGen 使用公共的音效库训练。
Google 计划对其智能助手 Assistant 进行大修,以加入类似 ChatGPT 和 Bard 的生成式 AI 技术。Google 称它对 Assistant 移动版本的修改工作已经启动。作为这一计划的一部分,Google 将会开始重组其 Assistant 团队,少许人会被裁掉。Assistant 团队有数千人,裁员只涉及数十个职位。
Meta 准备推出的 AI 聊天机器人将拥有独特人格,包括冲浪者人格和林肯(Abraham Lincoln)人格。Meta 此举旨在提高其平台上的互动性,因为相比毫无感情特色的 AI 机器人回复,具有类似人类特征的讨论会更有趣。Meta 尚未宣布旗下哪些产品会加入 AI 聊天机器人。可能包括 Instagram、Messenger 和 WhatsApp。该功能预计最早会在 9 月推出。聊天机器人能收集大量用户个人信息,而 Meta 的收入大部分来自广告,它等着你与林肯先生分享你的喜好。
香港众多高校拥抱了 OpenAI 的聊天机器人 ChatGPT。香港科技大学率先引入ChatGPT。6 月 1 日它正式为学生与教职人员提供港科大版 ChatGPT,是香港首所为学生与教职工提供 ChatGPT 的大学。香港中文大学、香港理工大学、香港浸会大学等高校也陆续推出使用 AI 工具的指引,共同希望师生批判性探索和谨慎使用 AI,保障学术诚信。除了在高等教育掀起热潮,AI 也将进入香港的初中课堂。香港教育局 6 月 19 日推出初中 AI 课程教材,介绍 ChatGPT 等前沿的生成式 AI,近一半内容重点关注 AI 的伦理与社会影响。该局指出,ChatGPT 可以成为有价值的教育工具,但要留意抄袭的伦理问题,并期望所有公立中学尽快规划,于 2023/24 学年在“资讯和通讯科技课程”中安排 10 至 14 小时的 AI 课程教授。
研究人员运用 AI 去搜索已灭绝的人类近亲尼安德特人和丹尼索瓦人的蛋白质数据,重新发现新的抗生素。抗生素的研发过去几十年相对缓慢,今天的大部分处方抗生素都有逾 30 年历史,随着抗生素耐药细菌的增加,寻找新抗生素迫在眉睫。已灭绝物种的蛋白质有可能成为新抗生素的来源。大部分物种都会产生具有抗菌特性的短蛋白亚单位肽(peptides)。研究人员用人类已知的肽去训练 AI,然后在智人、尼安德特人和丹尼索瓦人的蛋白质序列中寻找新的具有抗菌的肽。研究人员测试了几十种肽,观察是否能在实验室培养皿中杀死细菌。然后筛选出六种有效的肽——其中四种来自智人,一种来自尼安德特人,一种来自丹尼索瓦人。对小鼠的测试显示这些抗菌肽的效果都比较差,需要调整分子创造出更有效的版本。
著名导演詹姆斯卡梅隆(James Cameron)表示,他同意 AI 专家的观点,认为该技术发展对人类构成了严重的风险。卡梅隆接受采访时表示,他在 1984 年就警告了 AI 的危险,但没人听。他执导的《终结者》系列的第一部是在 1984 年上映的,电影背景是天网觉醒试图灭绝人类,天网派了 T-800 终结者返回 1984 年去杀死人类抵抗军首领的母亲。卡梅隆认为,AI 武器化是最大的危险,AI 的核武器竞赛将把所有人都拖进去,因为你不做的话其他国家会去做,然后不断升级。卡梅隆称 AI 短时间内是无法取代作家的,AI 编的故事不太可能会让观众共情。
流媒体巨头 Netflix 被发现以 90 万美元年薪招 AI 产品经理。这位产品经理的工作范围不是推荐算法,而是内容创造。Netflix 在职位说明中称,AI 正在推动所有业务领域的创新,其中包括帮助他们创造更优秀的内容。Netflix 的机器学习平台在历史上被用于开发推荐算法等,但现在它正被用于内容创造。Netflix 称机器学习正被其工作室用于优化原创电影和电视剧的制作。
AI 创业公司 Stability AI 发布了最新的文本图像模型 Stable Diffusion XL 1.0。该公司声称该模型是它至今发布的最先进的。公司应用机器学习高管 Joe Penna 表示,Stable Diffusion XL 1.0 包含 35 亿参数,能在数秒内生成不同长宽比的 1 兆像素分辨率图像。上一代 Stable Diffusion XL 0.9 能生成更高分辨率的图像,但需要的算力更多。Penna 称, XL 1.0 可定制,能对不同概念和风格进行微调,它更容易使用,能对基本的自然语言处理提示提供更复杂的设计。对于模型使用的数据集包含反对将其作品用于 AI 训练的艺术家作品,Penna 坚称是合理使用。
JetBrains 更新了它的 IDE ,整合了 AI 助手。类似微软/Github 的 Copilot,JetBrains AI Assistant 使用的也是 OpenAI 的技术。它与 Github Copilot 插件的区别在于,AI Assistant 深度整合在 IDE 中,支持 AI Chat 等 Copilot 插件不支持的功能。除了 OpenAI 的模型,AI Assistant 也依赖 JetBrains 的内部模型。AI Assistant 的功能因不同语言而存在差异,其中文档生成仅限于 Java、Kotlin 和 Python 项目。
AI 公司 OpenAI 在今年 1 月推出了一个在线的 AI 检测工具,帮助教师和其他人判断一段文本是机器如 ChatGPT 还是人类撰写的。但仅仅半年之后该工具就关闭了,因为它无法完成任务。OpenAI 上周悄悄关闭了 AI Classifier,原因是正确率过低。OpenAI 更新了 AI Classifier 发布博文,添加了相关注解,表示正在开发更有效的文本溯源技术,承诺会推出新工具帮助用户检测音频或视觉内容是否是 AI 生成的。