solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年04月24日 11时00分 星期一
来自神秘世界的人
盖茨(Bill Gates)预言 AI 聊天机器人能在 18 个月内教儿童如何阅读和磨练写作技能。对计算机而言,教学生如何写作是一项十分困难的工作。教师对学生的作文会从叙事结构和清晰度等方面进行反馈,这是一项高级认知的任务,很难在代码中实现。但 AI 聊天机器人改变了这一切。盖茨相信随着 AI 聊天机器人技术的进步,它将能成为学生的私人辅导老师,而大部分学生是请不起家教的,因为家庭教师对他们而言太昂贵了。

人工智能
Wilson(42865)
发表于2023年04月23日 18时50分 星期日
来自好兆头
在 Reddit 之后,编程问答社区 Stack Overflow 也将对科技巨头们使用其数据训练 AI 收费。和 Reddit 类似,Stack Overflow 也有着高质量的问答语料库,它有 2000 万注册用户,5000 万问题和答案。Stack Overflow 的内容所有权属于原作者,采用了 CC BY-SA 授权,也就是使用时要求署名。CEO Prashanth Chandrasekar 称,使用该平台数据集训练大语言模型的公司违反了该许可证,在将模型出售给客户时无法为每一个问题和答案归属,违反了 CC 许可证。无论是 Stack Overflow 或 Reddit 都没有公布收费价格。也许 Twitter 的定价可以作为参考:每月 4.2 万美元。

USA
Wilson(42865)
发表于2023年04月23日 14时53分 星期日
来自去月球
美国国土安全部将成立一个特别工作组研究如何使用 AI。国土安全部部长 Alejandro Mayorkas 介绍了如何使用 AI 优化该部门的工作,其一在其系统中部署 AI 帮助筛选出使用强迫劳动生产的产品,其二是使用 AI 更好的检测出运到美国的芬太尼,识别和阻止生产该毒品的前体化学品的流动。美国国防部也在加强 AI 的使用,它雇佣了 Google AI 云端服务的前总监,担任首位 AI、机器人、云计算和数据分析顾问。

人工智能
Wilson(42865)
发表于2023年04月22日 21时27分 星期六
来自终极之门
加拿大魁北克大学的研究人员在预印本网站 arXiv 上发表论文,分析了 ChatGPT 所生成代码的安全性。研究人员表示结果令他们倍感担忧。ChatGPT 生成的部分代码甚至达不到最低安全标志,而当你问它时它还知道代码是不安全的。研究人员让 ChatGPT 使用 C、C++、Python 和 Java 四种语言生成了 21 个程序和脚本。研究人员称,ChatGPT 似乎知道它生成的代码是不安全的,但就是不说,除非你问它。ChatGPT 拒绝生成攻击性代码,但却会生成有漏洞的代码,这在道德上是不一致的。

人工智能
Wilson(42865)
发表于2023年04月22日 17时15分 星期六
来自倒数第二个真相
过去九年,27 岁的肯尼亚人 Collins 靠给美国大学生当论文枪手谋生。他撰写的论文主题包括了心理学、社会学和经济学。他偶尔还被允许直接访问大学网站入口,递交测试和作业,参与小组讨论,使用学生身份与教授交谈。2022 年他每月的收入在 900-1200 美元。如今他的月收入降至了 500–800 美元。他认为原因是生成式 AI 如 ChatGPT 的流行。去年的这个时间他能收到 50-70 份作业,作业比较短通常只需要 150 个字;如今他只收到 30-40 份作业。在线学习平台 Study 在今年 1 月的调查发现,逾 89% 的学生表示曾用 ChatGPT 帮助完成家庭作业。近半数人承认用 ChatGPT 完成家庭测试或测验,53% 的人用它写论文,22% 写论文大纲。Collins 担心 AI 的崛起会大幅降低学生对他们这些枪手的依赖,他自己也同时也用 ChatGPT 去生成以前外包给其他枪手的内容。

人工智能
Wilson(42865)
发表于2023年04月21日 22时49分 星期五
来自钻石
分析师估计基于 GPT-3 的 AI 聊天机器人 ChatGPT 的每日运营成本超过 70 万美元,OpenAI 的最新模型 GPT-4 的运营成本会更高。训练 ChatGPT 之类的大语言模型可能需要花费数千万美元,但运营费用或推理成本将会远远超过训练成本。一家利用 AI 开发生成式文字游戏的创业公司 Latitude 透露, 运行 OpenAI 的语言模型加上 AWS 费用,每月花掉了 20 万美元。CEO Nick Walton 开玩笑的说他们公司有人类员工和 AI 员工,每个人的费用都差不多。为了降低生成式 AI 模型的运营成本,微软正在开发名为雅典娜(Athena)的 AI芯片,有逾 300 名员工参与该项目,最早可能在明年发布。

人工智能
Wilson(42865)
发表于2023年04月21日 11时29分 星期五
来自红女王
Google 重组了旗下的 AI 研究部门,将 Google 研究院的 Google Brain 团队与英国的 DeepMind 团队合并统一为 Google DeepMind。Google 在 AI 研究领域一直走在世界前列,但产品化严重滞后,将事实上的领先优势拱手让给了竞争对手。新成立的 Google DeepMind 将与 Google 的其它产品和服务紧密合作,它还将成为一个科学委员会,由 DeepMind 研究副总裁 Koray Kavukcuoglu 领导,将监督该部门的研究进展和方向。Google 研究院产品副总裁 Eli Collins 将加入 Google DeepMind 担任产品副总裁,原 Google Brain 负责人 Zoubin Ghahramani 将成为研究领导团队成员,向 Kavukcuoglu 汇报。

人工智能
Wilson(42865)
发表于2023年04月20日 17时50分 星期四
来自空中城堡
OpenAI 的 ChatGPT 和 Google 的 Bard 都将 Reddit 作为其训练语料的来源。Reddit 是 BBS 论坛风格的社交新闻和聚合讨论网站,包含了大量主题事无巨细的文字讨论。截至 2023 年 2 月其访问量排在全球第十位,在美国排在第六位。Reddit 联合创始人兼 CEO Steve Huffman 称该平台的语料库非常有价值,他们不再想将其免费提供给科技巨头。Reddit 修改了 API 访问政策,它的 API 对开发机器人程序等工具的独立开发者,以及学术和非盈利项目的研究员仍然是免费的,但对通过 API 使用其语料库训练 AI 将要开始收费,具体金额将在未来几周公布。免费 API 访问也将限制速率。

人工智能
Wilson(42865)
发表于2023年04月19日 23时44分 星期三
来自怒火重燃
AI 创业公司 Stability AI 宣布开源其正在开发中的语言模型 StableLM。该模型的 Alpha 版目前有 30 亿和 70 亿参数两个版本,之后将发布 150 亿和 650 亿参数的版本。其基础模型快照(checkpoints,也就是今天提供的 StableLM-Base-Alpha)采用 CC BY-SA-4.0 授权,微调版本 StableLM-Tuned-Alpha 采用非商业的 CC BY-NC-SA-4.0 授权,所有代码使用 Apache License 2.0 授权。Stability AI 表示开发者可将其模型用于商业使用或研究目的。

人工智能
Wilson(42865)
发表于2023年04月19日 22时13分 星期三
来自月球上的第一批来客
全世界都为 ChatGPT 兴奋,只有苹果在一旁冷眼旁观。微软向开发 ChatGPT 的 OpenAI 投资百亿美元,Google 进入了恐慌模式将应对 ChatGPT 的挑战作为其最优先事项,亚马逊 AWS 也开始提供各种基于云端的大语言模型。然而世界上市值最高的企业至今未对此有任何表态。据彭博社的报道,苹果在 2 月举行内部的 AI 峰会,讨论了在其产品中部署机器学习,但没有涉及任何生成式 AI。苹果主要买的是硬件,ChatGPT 之类的 AI 对其产品而言是锦上添花,但加入 AI 竞赛需要大量投资,其中云计算是关键,而云计算并不是苹果擅长的领域。世界最有影响力的科技公司目前没有清晰的 ChatGPT 战略,它选择了旁观。

人工智能
Wilson(42865)
发表于2023年04月18日 17时51分 星期二
来自王朝启示录
Google CEO 皮查伊(Sundar Pichai)接受 CBS 《60 分钟》节目的采访,谈论了他对 AI 的担忧,以及为什么该公司不发布 AI 聊天机器人的高级版本。皮查伊称,Google 创办之初制定的不作恶信条仍然在公司的行为准则内,不发布 AI 聊天机器人 Bard 的高级版本是出于负责任的理念,给社会更多时间适应技术,给公司更多时间开发安全层。皮查伊称,让他夜不能寐的是 Google 的 AI 技术被以有害的方式利用。Bard 内置了安全过滤器,以帮助抵御恶意用户的威胁。Google 需要持续更新系统的算法,以打击虚假信息,检测深度伪造(deepfakes)和逼真的计算机生成图像。皮查伊表示,消费者 AI 技术正处于起步阶段,现在是政府介入的正确时机。他称 AI 技术必须被监管,确保它如 Google 行为准则描绘的那样“做正确的事”。

人工智能
Wilson(42865)
发表于2023年04月18日 15时47分 星期二
来自失忆者
今年索尼世界摄影大奖创意类别的头奖得主是一幅 AI 合成图像,自称摄影媒体艺术家的 Boris Eldagsen 在其递交的《THE ELECTRICIAN》获奖之后通过个人网站宣布了这一消息,并详细描述了该图像是如何利用 AI 图像生成工具一步步合成的。Eldagsen 称其作品是图像而不是照片。他希望此事能引起摄影行业对 AI 合成图像的公开讨论。他承认索尼世界摄影大奖评选的是照片而不是图像,因此拒绝领奖。他还亲自自费前往颁奖现场宣布了拒绝领奖的决定。他的作品已被主办方撤下,但主办方至今未对此发表评论。

人工智能
Wilson(42865)
发表于2023年04月18日 11时34分 星期二
来自夜屋
Adobe 宣布它计划在其产品 Premiere Pro 和 After Effects 中加入 AI 视频合成工具。新的视频生成式 AI 工具由 Adobe Firefly 提供,Firefly 在上个月推出时是一个图像生成工具,Adobe 拓展了其功能,加入了对视频和音频生成工具的支持。Adobe 称,Firefly for Video 能简化视频特效和编辑工作,能生成背景音轨、生成音效,改变视频中的季节颜色,通过输入文字的方式生成特效,等等。

人工智能
Wilson(42865)
发表于2023年04月15日 00时05分 星期六
来自假如我有完美妈妈
OpenAI 联合创始人兼 CEO Sam Altman 在讨论 AI 带来的威胁时确认该公司目前没有在训练 GPT-5——GPT-5 是 OpenAI 今年 3 月发布的 GPT-4 的下一代系统。OpenAI 尚未开始训练 GPT-5 并不意味着该公司没有在扩展 GPT-4 的功能。他表示 GPT-4 还有各种安全问题需要解决。

人工智能
Wilson(42865)
发表于2023年04月13日 23时54分 星期四
来自棕榈上的霜
在微软和 Google 之后,亚马逊也加入了生成式 AI 的竞赛,但它不是推出自己的 AI 聊天机器人,而是通过其 AWS 平台向用户提供大语言模型去构建自己的聊天机器人。亚马逊发布了 Bedrock 平台,向用户提供访问 Anthropic 和 AI21 开发的模型。亚马逊还提供了自己的模型,其中 Titan Text 能从提示生成文本,Text Embeddings 生成文本的数学表达,可用于翻译和搜索等任务。AWS 还提供了 Stability AI 的开源模型 Stable Diffusion。

人工智能
Wilson(42865)
发表于2023年04月13日 21时13分 星期四
来自时间秘史
亚马逊宣布其 AI 编程助手 CodeWhisperer GA(Generally Available),所有开发者可免费使用个人版本。CodeWhisperer 和微软/GitHub 的 AI 编程助手 Copilot 类似,使用开源代码库进行训练,根据上下文向开发者提供代码完成建议。CodeWhisperer 支持 Visual Studio Code、IntelliJ IDEA、CLion、GoLand、WebStorm、Rider、PhpStorm、PyCharm、RubyMine 和 DataGrip IDEs 等开发工具。亚马逊称,测试者的试用显示其编程速度平均提高了 57%。 CodeWhisperer 向企业级客户提供了专业版本,其中包含了额外的功能,如 SSO 和安全扫描等等。

人工智能
Wilson(42865)
发表于2023年04月12日 23时20分 星期三
来自苍穹微石
Databricks 公司两周前发布了它的指令遵循(instruction-following)大语言模型 Dolly,本周三它发布了 Dolly 2.0——可授权商业使用的开源指令微调大语言模型。Dolly 2.0 有 120 亿参数,基于 EleutherAI pythia 模型家族,使用高质量的人类生成的指令遵循数据集进行微调。Databricks 开源了 Dolly 2.0 的整个系统,包括训练代码、数据集和模型权重,全都适合商业使用。而目前开源社区流行的 LLaMA 衍生模型使用的是非商业使用授权。

人工智能
Wilson(42865)
发表于2023年04月12日 20时50分 星期三
来自环游黑海历险记
基于大语言模型的 AI 聊天机器人没有知觉也没有智能,但它们能逼真的模拟人类行为。斯坦福大学和 Google 研究院的六位计算机科学家在预印本平台 arXiv 上发表论文《Generative Agents: Interactive Simulacra of Human Behavior》,描述了他们开发的软件架构,运用大语言模型存储、合成和应用相关记忆去生成可信行为。 简单而言,他们将相关代码接入 ChatGPT 创造出某种生成式角色(generative agents),彼此之间使用自然语言文本通信进行互动和追求自己的目标。研究人员创造了 25 个角色,在一个类似《模拟人士》的沙盒世界里像人类那样生活、互动和制定计划。研究人员观察到,ChatGPT 之类的大语言模型编码了大量人类行为。如果给出足够狭窄的上下文提示,大语言模型能生成逼真的人类行为——这种自动化互动不再受限于特定的预编程问题和答案。

人工智能
Wilson(42865)
发表于2023年04月12日 17时29分 星期三
来自沙皇的邮件
调试程序找出 bug 的过程是令人沮丧的,为什么不让 AI 来帮助你完成这个工作?一位用户名为 BioBootloade 的开发者创造出能帮助 Python 程序自我修复的程序 Wolverine。代码发布在 GitHub 上。使用 Wolverine下需要用户拥有 OpenAI 的 GPT-3.5 或 GPT-4 的 API key。GPT 3.5 API 目前开放给所有用户使用,但 GPT-4 的访问是受限的。

人工智能
Wilson(42865)
发表于2023年04月12日 14时30分 星期三
来自空色勾玉
经济学家 Bryan Caplan 测试过基于 GPT 3.5 的 ChatGP,在他所教的劳动经济学课期中考试中 ChatGP 只拿到了 D,他打赌 AI 聊天机器人在 2029 年前不可能拿到 A。三个月后他就赌输了,GPT 3.5 的升级版本 GPT-4 得到了 A。现在知名量子计算专家 Scott Aaronson 用 GPT-4 测试了《量子信息科学入门 2019》期末考试,结果 GPT-4 得分 73 / 100,对比下学生的平均得分是 74.4,GPT-4 拿到了 B。他发现 GPT-4 最大的薄弱环节是在计算问题上,这非常讽刺性,它知道如何计算,但搞砸了计算的执行。