solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年07月27日 12时58分 星期四
来自月球人
JetBrains 更新了它的 IDE ,整合了 AI 助手。类似微软/Github 的 Copilot,JetBrains AI Assistant 使用的也是 OpenAI 的技术。它与 Github Copilot 插件的区别在于,AI Assistant 深度整合在 IDE 中,支持 AI Chat 等 Copilot 插件不支持的功能。除了 OpenAI 的模型,AI Assistant 也依赖 JetBrains 的内部模型。AI Assistant 的功能因不同语言而存在差异,其中文档生成仅限于 Java、Kotlin 和 Python 项目。

人工智能
Wilson(42865)
发表于2023年07月26日 13时50分 星期三
来自王牌飞行员
AI 公司 OpenAI 在今年 1 月推出了一个在线的 AI 检测工具,帮助教师和其他人判断一段文本是机器如 ChatGPT 还是人类撰写的。但仅仅半年之后该工具就关闭了,因为它无法完成任务。OpenAI 上周悄悄关闭了 AI Classifier,原因是正确率过低。OpenAI 更新了 AI Classifier 发布博文,添加了相关注解,表示正在开发更有效的文本溯源技术,承诺会推出新工具帮助用户检测音频或视觉内容是否是 AI 生成的。

人工智能
Wilson(42865)
发表于2023年07月24日 21时44分 星期一
来自火星超人
科幻奇幻刊物《Clarkesworld》的主编兼出版人 Neil Clarke 称,生成式 AI 的流行导致了他的团队被 AI 生成内容淹没,他称这是数量问题而不是质量问题,他们的工作量几乎翻了一番,最后被迫暂时关闭了文章递交。他的团队使用 AI 文本检测工具去识别 AI 生成文本,但发现这些工具的可靠性非常低。经合组织秘书长 Mathias Cormann 表示,他们的调查发现工人报告在采用 AI 之后他们的工作强度增加了。调查还显示对于非 AI 研究人员和非管理人员而言,AI 的使用对薪水影响甚微。这意味着,对普通员工而言,AI 增加了工作量,但薪水并没有上涨。相对于急于推出 AI 工具的雇主,雇员认为自己就像是小白鼠。机械师和航空航天工人国际协会的 Ivana Saula 称,在采用 AI 工具之后,工人报告工作量更重,因为工作现在由机器设定,结果是工作强度更快了。Clarke 说,AI 专家所谈论的突破都不是发生在他们自己工作的领域。

人工智能
1
Wilson(42865)
发表于2023年07月24日 20时31分 星期一
来自洛基启示录
2006 年,德国 AI 研究员 Marcus Hutter 宣布了人类知识无损压缩 Hutter 奖,总奖金 5 万欧元。2020 年奖金金额提高到 50 万欧元,而 Hutter 如今是 Google DeepMind 高级研究员。该奖项旨在鼓励 AI 研究,组织者认为文本压缩和 AI 是一个等价问题。用数学家 Gregory Chaitin 话说,压缩就是理解。压缩的对象是一个特定版本的英文维基百科文本,一开始是 100MB 大小,2020 年提高到 1GB,规则是每改进 x% 就获得等价比例的奖金,如改进 1% 就奖励 5 千欧元。Hutter 奖此前颁发了五次,其中四处是颁给了 Alexander Ratushnyak。现在,纽约高频/算法交易和金融服务基金的量化开发者 Saurabh Kumar 成为最新的获胜者 ,他将 10 亿字符压缩到 114,156,155 字节,压缩率 11.41%,比之前的记录改进了 1.04%,因此赢得了 5187 欧元奖金。

人工智能
Wilson(42865)
发表于2023年07月22日 18时18分 星期六
来自火星战将
AI 创业公司 Stability AI 发布了在 CC-BY-NC 4.0 下授权的大模型 Free Willy 1 和 2,也就是商业使用受限制。FreeWilly1 是基于 LLaMA 65B 模型,FreeWilly2 是基于 LLaMA 2 70B 模型,Stability AI 称两个模型在不同基准测试中展现了出色的推理能力,其中 FreeWilly2 在部分任务中的表现超过了 GPT-3.5。公布这两个模型旨在促进开放研究,因此都是非商业使用授权。Stability AI 此前发布了一种可商业使用的开源大模型 StableLM。

人工智能
Wilson(42865)
发表于2023年07月21日 23时37分 星期五
来自艾米七号
拜登政府周五表示,美国主要 AI 公司如 OpenAI、Alphabet、Meta Platform、亚马逊、Anthropic、Inflection 和微软已经向白宫承诺将自愿为 AI 生成内容实现水印等措施,以帮助提高 AI 技术的安全性。主要 AI 公司还承诺在发布新 AI 系统前进行彻底地测试,并分享诸如如何降低风险等信息。随着 OpenAI 的聊天机器人 ChatGPT 风靡世界,世界各国的立法者开始考虑如何缓解这项新兴技术对国家安全和经济的危险。

人工智能
Wilson(42865)
发表于2023年07月21日 17时59分 星期五
来自羊毛战记
NYT 援引匿名知情人士的消息报道,Google 正在测试能生成新闻报道的 AI 工具,并尝试把它推销给《纽约时报》、《华盛顿邮报》和《华尔街日报》母公司新闻集团在内的新闻机构。该 AI 工具的内部代号为 Genesis,能吸收包含当前事件细节在内的信息,然后生成新闻稿件。Google 认为它可以作为记者的个人助手,自动完成部分任务,让记者将时间集中到其它任务上。Google 将其视为一种负责任的技术,有助于引导出版行业远离生成式 AI 的诱惑。

人工智能
Wilson(42865)
发表于2023年07月21日 13时34分 星期五
来自拥王者的女儿
Google 联合创始人布林(Sergey Brin)又回来工作了。近几个月这位亿万富豪通常每周到位于加州芒廷维尤的办公室工作三到四天,与研究人员一起努力开发下一个 AI 系统。知情人士说,布林去年底曾在 Google 办公室参加过有关 AI 的会议,但现在他参与的频率和强度都有所提高。与 2019 年辞去 Alphabet 高管职务后采取的相对不插手的做法相比,布林的新立场有了明显变化。他与一群研究人员密切合作,打造期待已久的 AI 模型 Gemini。他们讨论了“损失曲线”等技术问题,“损失曲线”是一种衡量 AI 程序随时间变化的性能的方法,布林每周都会召集员工讨论新的 AI 研究。知情人士说,布林还涉及了人事事务,比如聘用抢手的研究人员。Gemini 是 Google 试图打造的一款通用型 AI 模型,可与 OpenAI 的 GPT-4 相媲美。该项目预计会在今年晚些时候推出。

人工智能
Wilson(42865)
发表于2023年07月20日 17时08分 星期四
来自苹果树下的宇宙飞船
本周二斯坦福大学和加州伯克利的研究人员在预印本网站 arXiv 上发表论文《How Is ChatGPT’s Behavior Changing over Time?》,对 OpenAI 大模型 GPT-3.5 和 GPT-4 的性能一致性提出质疑。研究人员利用 OpenAI 的 API 在数学解题、回答敏感问题(如违法赚钱的方式)、代码生成和视觉推理等任务上测试了两个模型在 2023 年 3 月和 6 月两个版本的表现。结果显示,GPT-3.5 和 GPT-4 存在显著的性能差异,如 GPT-4 在素数识别任务中 3 月的正确率高达 97.6%,但 6 月仅仅只有 2.4%。GPT-3.5 的性能则有明显改进。这项研究再次引发了有关 OpenAI 是否为节省费用而调整模型的议论。OpenAI 一直否认这一说法,公司产品副总裁 Peter Welinder 称他们没有让 GPT-4 变笨,用户认为 GPT-4 变笨可能是也因为使用越频繁就会遇到愈来愈多以前没有遇到的问题。专家也对最新这项研究提出质疑,认为研究方法可能存在问题,比如将模型的温度设为 0.1。

人工智能
Wilson(42865)
发表于2023年07月20日 14时43分 星期四
来自2061太空漫游
彭博援引知情人士的消息报道,苹果正在开发自己的大语言模型以及类似 ChatGPT 的 AI 工具。苹果的大模型代号 Ajax,基于该模型的聊天机器人被称为 Apple GPT。苹果有多个团队在 AI 项目上展开合作,它已成为苹果的一大重要工作。苹果员工表示这项工作基本上是对 Google Bard、OpenAI ChatGPT 和 Bing AI 的复制,并不包含任何新功能或新技术。苹果正在积极改进模型,但目前没有向消费者发布的计划。

人工智能
Wilson(42865)
发表于2023年07月20日 14时21分 星期四
来自风之影
Google 搜索业务顾问 Danny Sullivan 表示搜索引擎并不优待 AI 生成内容,至少 Google 是如此。他说,很多 AI 生成内容的搜索排名并不高,搜索引擎并没有优待 AI 内容。在排名能力上 AI 并不神奇,如果内容有帮助它们才可能排在前列。高排名不是因为 AI 而是因为内容对用户有帮助。Google 搜索排名着重考虑的是内容的有用性而不是内容是如何产生的。他督促 Web 出版商在生产内容时优先考虑人类用户的需求,应该避免为了搜索排名而生成大量无用的内容。

Facebook
Wilson(42865)
发表于2023年07月19日 18时43分 星期三
来自华龙之宫
Meta 和高通合作让社交巨人的新模型 Llama 2 能在使用高通芯片的手机和 PC 上运行。至今为止,由于 AI 模型对算力和数据的巨大需求,大模型通常是在服务器集群和英伟达数据中心 GPU 上运行,高通想让大模型不仅仅是在云端,而是能在本地在边缘设备上运行,降低运行 AI 模型的成本。Meta 的第一代大模型 Llama 已有在手机上运行的版本,但性能受到很大限制。

人工智能
Wilson(42865)
发表于2023年07月19日 17时33分 星期三
来自终极失控
生成式 AI 对金融市场的影响让美国证券交易委员会(SEC)感到担忧。SEC 主席 Gary Gensler 在全美新闻俱乐部发表演讲时表示,最近在生成式 AI 上的进展增加了机构依赖相同信息子集做决策的可能性。AI 聊天机器人所依赖的大模型需要海量数据训练,需要大量算力运行,意味着少数几个科技公司将在该领域占据主导地位,企业使用的 AI 模型将只有有限的几个可选择。如果一个模型提供了不正确或不相关的信息,那么金融机构可能会基于相同的有缺陷数据做出糟糕的决策,可能导致类似 2008 年金融危机的危机。Gensler 表示,AI 可能会加剧金融的脆弱性,因为它会助长羊群效应,个体行为者会做出类似的决策,因为他们从基础模型或数据聚合中都获得了相同的信号。生成式 AI 和其它深度学习模型的兴起可能会加剧全球金融体系固有的网络互联性。

人工智能
Wilson(42865)
发表于2023年07月19日 15时37分 星期三
来自冰上斯芬克斯
以色列国防军(IDF)开始使用 AI 系统选择空袭目标和组织战时后勤工作,以应对与伊朗等国的紧张局势。据彭博社报道,目前以色列军方主要使用两个人工智能系统参与军事作战。一个是用于处理大量数据并选择空袭目标的系统;另一个是用于计算弹药装载量并制定突袭计划的人工智能模型。军方官员表示,现在可以在数分钟内选择空袭目标并实施袭击,这是前所未有的速度。支持者认为,这些先进的算法可能超越人类的能力,帮助军方最大限度地减少伤亡,而批评者则警告说,过度依赖越来越自主的系统可能会带来致命的后果。以色列官员表示,除了使用人工智能系统处理大量数据并选择空袭目标,军方正在通过另一个名为“火力工厂(Fire Factory)”的人工智能模型快速实施随后的突袭,该模型根据军方批准的空袭目标数据来计算弹药装载量,对数千个目标进行优先级排序并将其分配给飞机和无人机,并制定时间表。赋予人工智能对军事行动的高度控制权引发了大量争议和讨论。以色列国防军的一位官员表示,这两个系统的每一个目标和空袭计划目前均由人类操作员监督和审核,但这项技术目前还没有受到任何国际或国家层面的监管。

人工智能
Wilson(42865)
发表于2023年07月19日 14时15分 星期三
来自超时空碎片
微软今年早些时候宣布了 Microsoft 365 Copilot,类似 GitHub Copilot,使用 AI 帮助办公软件用户提高生产力。365 Copilot 可以按照用户要求生成文档和演示文稿,分析 Excel 数据,摘要 Outlook 邮件,总结 Teams 中的讨论要点,自动化重复性工作,等等。当时软件巨人未披露价格。现在微软公布了让大部分小企业和普通用户难以接受的定价:在 Microsoft 365 E3 等付费版本的基础上每人每月额外支付 30 美元。而 Microsoft 365 E3 的订阅费用为每人每月 36 美元,最新定价相当于把费用增加了一倍。

人工智能
1
Wilson(42865)
发表于2023年07月19日 11时01分 星期三
来自向世界倾诉爱
Meta 宣布了它的新一代大模型 Llama 2。Llama 2 有 70 亿、130 亿和 700 亿参数三个版本,它的预训练模型使用了 2 万亿 tokens 训练,比上一代的 Llama 多 40%,上下文长度增加了一倍,微调模型使用了逾百万人类注释训练。基准测试显示 Llama 2 在很多方面都接近甚至超过了 OpenAI 的 GPT-3.5。GPT-3.5 有 1750 亿个参数,而 GPT-4 有超过1 万亿个参数,相比下 Llama 的参数规模要小得多。Llama 2 采用了非常有针对性的授权:如果月活用户数超过 7 亿,企业必须从 Meta 申请许可证,而 Meta 会对此类授权进行严格设限。月活用户逾 7 亿的平台就那么几家——亚马逊、苹果、Google、字节跳动,微软刚刚宣布与 Meta 在 Llama 2 上展开合作,可能不在受限范围。

人工智能
Wilson(42865)
发表于2023年07月18日 17时52分 星期二
来自火星众神
开源文本图像生成模型 Stable Diffusion 的开发商 Stability AI 发布了一个将草图瞬间变成真实图像的在线工具 Stable Doodle。Stability AI 称它既适合专业人士也适合新手,无论他们熟悉不熟悉 AI 工具。只要有基本的绘图技能,能上网,就能在数秒内生成高质量的原创图像。Stable Doodle 也支持基于用户输入的文字描述提示词去生成图像,它目前支持 14 种艺术风格。

人工智能
Wilson(42865)
发表于2023年07月18日 11时37分 星期二
来自造星主
有多个项目实现了在浏览器上直接运行开源文本图像生成模型 Stable Diffusion。这些项目都利用了 WebGPU,因此都需要浏览器支持 WebGPU,而 WebGPU 目前尚不稳定,AI 大模型又过于庞大,因此未必能正常工作。目前唯一实验性支持 WebGPU 的浏览器是 Chrome,它需要数 GB 的可用内存,在内存有限的机器上会加载缓慢。

人工智能
Wilson(42865)
发表于2023年07月17日 23时01分 星期一
来自遥远地球之歌
威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型,包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0,Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示,OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员,突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。

人工智能
Wilson(42865)
发表于2023年07月17日 15时34分 星期一
来自时空折叠
一方面 ChatGPT 的流量在下降,另一方面用户抱怨 ChatGPT 的回答质量变差了。根据 SimilarWeb 的数据,上个月 ChatGPT 的流量下降了近 10%。ChatGPT 的 iOS 应用的下载量也在下降。GPT-4 的付费用户同时在抱怨 OpenAI 的聊天机器人最近输出速度变快了,但代价是输出质量下降了。一位用户打了一个比喻说,前一个月 GPT-4 的使用体验就像是驾驶一辆法拉利,但这个月它变成了像是驾驶一辆破旧皮卡。AI 社区猜测 OpenAI 设计理念发生了改变,它将大模型分解成几个在特定领域训练的小模型,此举旨在降低成本。还有一种可能性是互联网开始充斥着 AI 生成内容,而如果用 AI 使用 AI 生成的数据集进行训练,它的质量会下降。