solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年11月09日 13时49分 星期四
来自星际归途
三星宣布了由三星研究院开发的生成式 AI 模型三星高斯(Samsung Gauss),以传奇德国数学家高斯(Carl Friedrich Gauss)的名字命名。三星高斯将能在该公司的设备上运行,它包含了:生成式语言模型 Samsung Gauss Language,可帮助撰写邮件、摘录文档和翻译内容;代码辅助编程 Samsung Gauss Code 可帮助开发者开发软件;生成式图像模型 Samsung Gauss Image 可生成和编辑图像。

人工智能
Wilson(42865)
发表于2023年11月08日 15时58分 星期三
来自绿里
微软周二宣布将把 Bing 搜索使用的部分机器学习模型转移到甲骨文的 GPU 集群。甲骨文囤积了大量英伟达的 A100 和 H100 GPU,而 Bing 搜索的生成式 AI 聊天服务 Bing Chat 需要使用大量的英伟达的 AI 芯片。双方的合作显然是为了满足生成式 AI 不断增长的计算需求。生成式 AI 使用的大模型不仅需要大量 GPU 集群进行训练,为了让模型发挥作用还需要大量 GPU 集群去执行推理。甲骨文的 GPU 集群将有助于 AI 的推理工作。

人工智能
Wilson(42865)
发表于2023年11月08日 12时01分 星期三
来自发条人偶
路透援引知情人士的消息报道,百度从华为订购了 AI 芯片,替代英伟达的产品。知情人士称,订单是在 8 月下的,百度为 200 台服务器订购了 1600 颗昇腾 910B 芯片。华为是在 2019 年发布了 昇腾 910 AI 芯片,910B 是其升级版,它目前已经交付了大约 1000 颗芯片。这笔订单的价值约 4.5 亿人民币。百度订购华为芯片是为了应对无法继续从英伟达购买 AI 芯片的情况。华为昇腾前不久加入了对 PyTorch 开源机器学习库的支持。

人工智能
Wilson(42865)
发表于2023年11月07日 22时39分 星期二
来自3001太空漫游
研究人员开发出一种机器学习工具,能以极高精度识别 ChatGPT 生成的化学论文。ChatGPT 探测器利用机器学习检查 20 个写作特征,包括句子长度的变化,特定单词和标点符号的频率,以判断一段文本是由人类科学家还是 ChatGPT 撰写的。最新的工具使用了美国化学学会(ACS) 出版的 10 种化学期刊论文摘要部分的训练,选择摘要是因为这是最可能由 ChatGPT 撰写的部分。测试显示,该工具能以 100% 的正确率识别 ChatGPT-3.5 撰写的标题,以 98% 的正确率识别 AI 写的摘要。它对 ChatGPT-4 生成的文本同样有效。

人工智能
Wilson(42865)
发表于2023年11月07日 14时48分 星期二
来自隐身人
OpenAI 在首届开发者大会上宣布,ChatGPT 每周用户数量已达到 1 亿。自 3 月发布 ChatGPT 的 API 功能以来,该公司现在已拥有超过 200 万开发人员,其中超过 92% 来自财富 500 强公司。OpenAI 同时推出了 GPTs,并发布更强大、更便宜的 GPT-4——GPT-4 Turbo,做出六大升级——更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4 的付费服务将“加量不加价”。OpenAI 表示,“GPTs 是一种新方式,任何人都可以创建 ChatGPT 的定制版本,以便在日常生活、特定任务、工作或家庭中更有帮助,然后与其他人分享该创作。例如 GPT 可以帮助您学习任何棋盘游戏的规则、帮助教您的孩子数学或设计贴纸。”

人工智能
Wilson(42865)
发表于2023年11月06日 15时58分 星期一
来自苏珊娜之歌
李开复在年初宣布了他创办的开发大模型的 AI 公司零一万物,七个月后零一万物发布了它的首个开源大模型 Yi-34B,源代码采用 Apache v2 许可证托管在 GitHub 上。Yi-34B 是中英双语模型,有 340 亿个参数,比 Falcon-180B 和 Meta LlaMa2-70B 等开源大模型都要小,但性能并不逊色。李开复表示有信心在一年半内发布 1000 亿到 4000 亿参数的大模型,将显著强于 Yi-34B。李开复称他的公司获得了来自创新工场、阿里云等的投资,估值 10 亿美元。大模型耗资巨大,零一万物将会选择性的开源部分模型,但其重点仍然是构建最先进的私有模型。在美国 AI 芯片出口限制生效前,零一万物已经囤积了能满足未来 12-18 个月计算需求的 AI 芯片。零一万物称,Yi-34B 及其规模更小的版本 Yi-6B 开源模型对学术研究完全开放,同步开放免费商用申请。

人工智能
Wilson(42865)
发表于2023年11月06日 10时44分 星期一
来自基本有害
马斯克(Elon Musk)宣布他旗下的 AI 公司 xAI 推出了 AI 聊天机器人 Grok。马斯克表示 Grok 将作为 X/Twitter 订阅服务 Premium+ 的一部分提供给用户,该订阅服务月费为 16 美元,他推荐想使用的用户订阅。目前用户可注册加入等候者名单。xAI 表示,Grok 这个名字来自于《银河系漫游指南》,它是马斯克最喜欢的科幻小说。然而根据维基百科,Grok 这一名字来自于科幻大师罗伯特·海因莱因的《异乡异客(Stranger in a Strange Land)》,《异乡异客》的出版时间远早于《银河系漫游指南》。

人工智能
Wilson(42865)
发表于2023年11月02日 15时40分 星期四
来自致命的发动机
英伟达的 GPU 被广泛用于训练大模型,它的价格昂贵加上供不应求导致许多 AI 公司难以获得。现在亚马逊 AWS 推出了 Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML,允许客户在定义好的时间内租用英伟达 GPU,可用于训练机器学习模型或用现有模型做试验。客户可访问 1-64 个 NVIDIA H100 Tensor Core GPU 实例,每个实例有 8 个 GPU,可以提前 8 周以一天为单位预留最长 14 天使用时间。保留的时间结束之后,实例将会自动关闭。

人工智能
Wilson(42865)
发表于2023年11月01日 14时42分 星期三
来自来自12个星球的敌人
美国新的出口管制可能迫使 AI 芯片巨头英伟达取消明年数十亿美元的对华订单。据知情人士透露,此前英伟达今年对中国的 AI 芯片订单已经完成交付,并且正争取在新规原定于 11 月中旬生效之前提前交付 2024 年的部分订单。但上周美国政府致信英伟达称,对包括中国在内的一些国家销售高端芯片的新出口限制立即生效。知情人士说,包括阿里巴巴、字节跳动和百度在内的中国头部 AI 和云计算公司都已下了明年交货的大规模订单,订单额超过 50 亿美元。根据 10 月 17 日公布的最新规定,任何公司的 AI 芯片如果超过一个性能基准,在出口到中国和其他受关注国家之前,必须获得美国商务部的许可。

人工智能
Wilson(42865)
发表于2023年10月29日 22时14分 星期日
来自惨败
通用汽车旗下的自动驾驶子公司 Cruise 暂停了全美的无人出租车运营。此前加州以其自动驾驶出租车对公共安全构成危险为由撤销了其无人运营许可证,该公司的出租车可以有司机监督的情况下继续运营。10 月 2 日一位行人被一辆汽车撞倒,正好倒在 Cruise 的无人出租车行进路线上,汽车碾过了行人,在停下来前将其拖了大约 6 米。Cruise 表示正在与监管机构合作调查这起事故,其工程师正在改善出租车对这种极端罕见事故的应对能力。美国国家公路交通安全管理局(NHTSA)已经宣布将对 Cruise 展开调查,它收到了两起 Cruise 无人出租车造成行人受伤的报告。Cruise 称它主动暂停全部无人出租车运营,检查其流程、系统和工具,反思如何重建公众信任。

人工智能
Wilson(42865)
发表于2023年10月29日 21时17分 星期日
来自勇者物语
波士顿动力的 YouTube 账号发布了一则新视频,演示了它的四足机器狗 Spot 在 ChatGPT 的帮助下用不同语音和口音流畅说话,它能用英国绅士或女孩的口音与人对话。这项成就是一次黑客马拉松的成果,工程师尝试将 ChatGPT、语音识别软件等 AI 技术与 Spot 结合,创造出某种令人毛骨悚然的结果。机器狗能扮演不同的角色,其中之一是导游机器人。在视频中 Spot 说,“欢迎来到波士顿动力,我是 Spot,你的导游机器人。” Spot 看起来对波士顿动力的建筑物布局相当了解,能根据与人的对话做出反应,比如对话者说口渴了,机器人能将人引导到有咖啡机的零食区。

人工智能
Wilson(42865)
发表于2023年10月26日 17时54分 星期四
来自十二魔
研究人员在 AI 领域取得了一项突破,他们开发出一种神经网络系统,具有类似人类的语言归纳能力。AI 系统能将新学到的单词应用于现有词汇和新的上下文背景中。这种能力被称为系统归纳,是人类认知的重要组成部分。研究人员测试了 ChatGPT 使用的模型,虽然 ChatGPT 具有令人称奇的自然语言对话能力,但在语言归纳上要远逊于新的神经网络或人类。这项研究发表在最新一期的《自然》期刊上。

Android
Wilson(42865)
发表于2023年10月26日 14时35分 星期四
来自影舞
随着生成式 AI 模型的日益普及,越来越多的应用集成了生成式 AI 功能。Google 更新了 Android 开发者政策,要求此类应用包含标记和举报功能。Google 称它想要确保 AI 生成的内容对用户是安全的,能纳入用户的反馈。从明年开始,相关应用需允许用户无需退出应用就能标记 AI 生成的冒犯性内容。应用开发者可以根据这些报告开发出更好的内容过滤和审核功能。

人工智能
Wilson(42865)
发表于2023年10月25日 23时59分 星期三
来自沙皇的邮件
在接连发生两起安全事故之后,加州机动车辆管理局 (DMV) 宣布暂停 Cruise 的无人驾驶出租车业务,撤销了无人驾驶的测试许可。今年 8 月一辆 Cruise 汽车撞上了消防车,导致一人受伤。本月早些时候,一辆汽车将一位行人撞倒在行驶中的 Cruise 汽车前面,汽车探测到了碰撞,停了下来,然后脱离公路,将行人拖曳了大约 20 英尺,当汽车最终停下来时其轮胎可能压在了行人的腿上,视频显示这位行人一直在尖叫求助。美国国家公路交通安全管理局(NHTSA)已对 Cruise 展开调查,调查该公司是否采取足够的预防措施保障行人的安全。加州 DMV 认为允许 Cruise 继续测试对公众不安全。Cruise 如果想要继续运营其出租车业务,汽车上将必须有一位司机。

人工智能
Wilson(42865)
发表于2023年10月25日 23时20分 星期三
来自失眠
芝加哥大学计算机科学教授 Ben Zhao 领导的一个团队开发了一种数据中毒工具 Nightshade,允许艺术家在将作品上传到网上前使用该工具在像素中添加不可见的改动,如果作品被抓取到 AI 训练数据集中,它会导致模型以混乱且不可预测的方式崩溃。该工具旨在反击 AI 公司未经作者许可使用其作品训练 AI 模型的行为。训练数据中毒可能会破坏图像生成模型如 DALL-E、Midjourney 和 Stable Diffusion 的未来迭代,它会导致部分输出无用——狗变成猫,汽车变成牛,诸如此类。相关论文已递交到 Usenix 计算机安全会议接受同行评审。Zhao 表示,他希望数据中毒工具有助于将权力平衡从 AI 公司转向艺术家。他的团队还开发了另一种工具 Glaze,帮助艺术家隐藏个人艺术风格,防止被 AI 公司抓取。它的工作方式与 Nightshade 类似。研究团队计划将 Nightshade 整合到 Glaze 中,并将其开源,让其他人能开发自己的版本。大型 AI 模型使用的训练集可能包含数十亿幅图像,其中的有毒图像越多,造成的破坏就会越大。数据集一旦中毒是很难清理的,它需要公司努力找出并删除每一个损坏的样本。

人工智能
Wilson(42865)
发表于2023年10月25日 15时49分 星期三
来自奇迹男孩与冰霜巨人
英伟达向 SEC 递交文件称,美国政府要求它立即停止向中国出口先进 AI 芯片,而不是原计划的 10 月 17 日起的 30 天后生效。立即限制出口的产品包括 A100、A800、H100、H800 和 L40S,此前列入限制出口的旗舰显卡 RTX 4090 仍然会是 30 天后生效。英伟达称,由于需求强劲,限制向华出口在短期内不会对公司业绩产生显著影响。

人工智能
Wilson(42865)
发表于2023年10月24日 13时02分 星期二
来自外交豁免权
斯坦福大学研究人员发表了《基础模型透明度指数(The Foundation Model Transparency Index)》报告,分析了 OpenAI、Google、Meta、Anthropic 等公司开发的 10 个流行基础模型,用 100 个指标进行了评估。这些指标包括训练数据、劳工实践以及使用的计算量等。结果显示,Meta 的开源模型 Llama 2 得分最高 54/100,OpenAI 的 GPT-4 为 48/100,亚马逊的 Titan 模型得分最低 12/100。研究人员指出,过去三年大模型的透明度在显著下降,原因从企业之间的竞争加剧到 AI 末日的恐慌。OpenAI 放弃了该公司早先对 AI 持有的开放立场,理由是 AI 技术的传播潜在有危险性。研究人员希望企业能增加大模型的透明度,为政府如何监管 AI 模型提供帮助。

人工智能
Wilson(42865)
发表于2023年10月23日 14时09分 星期一
来自苏珊娜之歌
苹果计划在 Siri、Xcode 等产品中整合 AI。苹果已建立了自己的大模型 Ajax,在此基础上还创建了一个聊天机器人服务, 部分工程师称之为“苹果GPT”。下一步的关键是确定该技术是否能应对竞争对手,以及苹果如何将其实际应用到产品中。负责 AI 的高级副总裁 John Giannandrea 的团队正在改进 Siri。这个更智能的 Siri 版本最早可能会在明年准备就绪,但这项技术仍然让人感到担忧,而且苹果的 AI 功能可能需要更长的时间才能在产品线中普及。苹果软件工程团队也在考虑将生成式 AI 集成到 Xcode 等开发工具中,这可以帮助开发人员更快地编写新应用,使其与微软的 GitHub Copilot 等服务保持一致。苹果公司内部正在争论如何部署生成式 AI:完全在设备上运行、基于云运行或介于两者之间。部署在设备上会运行得更快,并有助于保护隐私,但通过云部署大模型将允许更高级的操作。

人工智能
Wilson(42865)
发表于2023年10月20日 17时58分 星期五
来自人性分解
IBM 的研究人员在《科学》期刊上发表论文,提出了受脑启发的芯片架构 NorthPole,它能将计算与记忆相结合,并以低能耗高效地处理数据。自计算机诞生以来,计算过程一直以处理器为中心,记忆内存与计算是分离的。然而在记忆内存和计算之间穿梭传输大量数据会在能耗、处理带宽和速度方面付出高昂的代价。这在新兴的和先进的实时 AI 应用(如脸部识别、物体检测和行为监控等)中尤其明显,这些应用需要快速获取海量数据。因此,大多数现代计算机架构正在迅速达到物理和处理瓶颈,而且鉴于所涉及的能源成本不断增长,其在经济、技术和环境上都面临着无法持续的风险。NorthPole 是一种将计算与记忆内存交织于单个芯片上的神经推理架构,对 ResNet50 的测试显示,它能将每瓦每秒帧数 (FPS) 的能量指标提高 25 倍,每个晶体管的 FPS 的空间指标提高 5 倍,相对于同类技术延迟的时间指标降低 22 倍。

人工智能
Wilson(42865)
发表于2023年10月20日 15时15分 星期五
来自梦境救援
微软、Google、MIT 的研究人员与古腾堡项目合作制作了 5000 本开放授权的有声读物,音频总时长 3.5 万小时,包含了虚构和非虚构类作品,每个人都能找到适合自己的内容。研究人员的论文《Large-Scale Automatic Audiobook Creation》发表在预印本平台 arXiv.org,他们指出,对于视障人士、年轻儿童,甚至语言新手来说,有声读物能“显著提高文学作品的易读性”。这批有声读物 The Project Gutenberg Open Audiobook Collection 可以通过各大平台的播客应用获取。