solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年07月21日 17时59分 星期五
来自羊毛战记
NYT 援引匿名知情人士的消息报道,Google 正在测试能生成新闻报道的 AI 工具,并尝试把它推销给《纽约时报》、《华盛顿邮报》和《华尔街日报》母公司新闻集团在内的新闻机构。该 AI 工具的内部代号为 Genesis,能吸收包含当前事件细节在内的信息,然后生成新闻稿件。Google 认为它可以作为记者的个人助手,自动完成部分任务,让记者将时间集中到其它任务上。Google 将其视为一种负责任的技术,有助于引导出版行业远离生成式 AI 的诱惑。

人工智能
Wilson(42865)
发表于2023年07月21日 13时34分 星期五
来自拥王者的女儿
Google 联合创始人布林(Sergey Brin)又回来工作了。近几个月这位亿万富豪通常每周到位于加州芒廷维尤的办公室工作三到四天,与研究人员一起努力开发下一个 AI 系统。知情人士说,布林去年底曾在 Google 办公室参加过有关 AI 的会议,但现在他参与的频率和强度都有所提高。与 2019 年辞去 Alphabet 高管职务后采取的相对不插手的做法相比,布林的新立场有了明显变化。他与一群研究人员密切合作,打造期待已久的 AI 模型 Gemini。他们讨论了“损失曲线”等技术问题,“损失曲线”是一种衡量 AI 程序随时间变化的性能的方法,布林每周都会召集员工讨论新的 AI 研究。知情人士说,布林还涉及了人事事务,比如聘用抢手的研究人员。Gemini 是 Google 试图打造的一款通用型 AI 模型,可与 OpenAI 的 GPT-4 相媲美。该项目预计会在今年晚些时候推出。

人工智能
Wilson(42865)
发表于2023年07月20日 17时08分 星期四
来自苹果树下的宇宙飞船
本周二斯坦福大学和加州伯克利的研究人员在预印本网站 arXiv 上发表论文《How Is ChatGPT’s Behavior Changing over Time?》,对 OpenAI 大模型 GPT-3.5 和 GPT-4 的性能一致性提出质疑。研究人员利用 OpenAI 的 API 在数学解题、回答敏感问题(如违法赚钱的方式)、代码生成和视觉推理等任务上测试了两个模型在 2023 年 3 月和 6 月两个版本的表现。结果显示,GPT-3.5 和 GPT-4 存在显著的性能差异,如 GPT-4 在素数识别任务中 3 月的正确率高达 97.6%,但 6 月仅仅只有 2.4%。GPT-3.5 的性能则有明显改进。这项研究再次引发了有关 OpenAI 是否为节省费用而调整模型的议论。OpenAI 一直否认这一说法,公司产品副总裁 Peter Welinder 称他们没有让 GPT-4 变笨,用户认为 GPT-4 变笨可能是也因为使用越频繁就会遇到愈来愈多以前没有遇到的问题。专家也对最新这项研究提出质疑,认为研究方法可能存在问题,比如将模型的温度设为 0.1。

人工智能
Wilson(42865)
发表于2023年07月20日 14时43分 星期四
来自2061太空漫游
彭博援引知情人士的消息报道,苹果正在开发自己的大语言模型以及类似 ChatGPT 的 AI 工具。苹果的大模型代号 Ajax,基于该模型的聊天机器人被称为 Apple GPT。苹果有多个团队在 AI 项目上展开合作,它已成为苹果的一大重要工作。苹果员工表示这项工作基本上是对 Google Bard、OpenAI ChatGPT 和 Bing AI 的复制,并不包含任何新功能或新技术。苹果正在积极改进模型,但目前没有向消费者发布的计划。

人工智能
Wilson(42865)
发表于2023年07月20日 14时21分 星期四
来自风之影
Google 搜索业务顾问 Danny Sullivan 表示搜索引擎并不优待 AI 生成内容,至少 Google 是如此。他说,很多 AI 生成内容的搜索排名并不高,搜索引擎并没有优待 AI 内容。在排名能力上 AI 并不神奇,如果内容有帮助它们才可能排在前列。高排名不是因为 AI 而是因为内容对用户有帮助。Google 搜索排名着重考虑的是内容的有用性而不是内容是如何产生的。他督促 Web 出版商在生产内容时优先考虑人类用户的需求,应该避免为了搜索排名而生成大量无用的内容。

Facebook
Wilson(42865)
发表于2023年07月19日 18时43分 星期三
来自华龙之宫
Meta 和高通合作让社交巨人的新模型 Llama 2 能在使用高通芯片的手机和 PC 上运行。至今为止,由于 AI 模型对算力和数据的巨大需求,大模型通常是在服务器集群和英伟达数据中心 GPU 上运行,高通想让大模型不仅仅是在云端,而是能在本地在边缘设备上运行,降低运行 AI 模型的成本。Meta 的第一代大模型 Llama 已有在手机上运行的版本,但性能受到很大限制。

人工智能
Wilson(42865)
发表于2023年07月19日 17时33分 星期三
来自终极失控
生成式 AI 对金融市场的影响让美国证券交易委员会(SEC)感到担忧。SEC 主席 Gary Gensler 在全美新闻俱乐部发表演讲时表示,最近在生成式 AI 上的进展增加了机构依赖相同信息子集做决策的可能性。AI 聊天机器人所依赖的大模型需要海量数据训练,需要大量算力运行,意味着少数几个科技公司将在该领域占据主导地位,企业使用的 AI 模型将只有有限的几个可选择。如果一个模型提供了不正确或不相关的信息,那么金融机构可能会基于相同的有缺陷数据做出糟糕的决策,可能导致类似 2008 年金融危机的危机。Gensler 表示,AI 可能会加剧金融的脆弱性,因为它会助长羊群效应,个体行为者会做出类似的决策,因为他们从基础模型或数据聚合中都获得了相同的信号。生成式 AI 和其它深度学习模型的兴起可能会加剧全球金融体系固有的网络互联性。

人工智能
Wilson(42865)
发表于2023年07月19日 15时37分 星期三
来自冰上斯芬克斯
以色列国防军(IDF)开始使用 AI 系统选择空袭目标和组织战时后勤工作,以应对与伊朗等国的紧张局势。据彭博社报道,目前以色列军方主要使用两个人工智能系统参与军事作战。一个是用于处理大量数据并选择空袭目标的系统;另一个是用于计算弹药装载量并制定突袭计划的人工智能模型。军方官员表示,现在可以在数分钟内选择空袭目标并实施袭击,这是前所未有的速度。支持者认为,这些先进的算法可能超越人类的能力,帮助军方最大限度地减少伤亡,而批评者则警告说,过度依赖越来越自主的系统可能会带来致命的后果。以色列官员表示,除了使用人工智能系统处理大量数据并选择空袭目标,军方正在通过另一个名为“火力工厂(Fire Factory)”的人工智能模型快速实施随后的突袭,该模型根据军方批准的空袭目标数据来计算弹药装载量,对数千个目标进行优先级排序并将其分配给飞机和无人机,并制定时间表。赋予人工智能对军事行动的高度控制权引发了大量争议和讨论。以色列国防军的一位官员表示,这两个系统的每一个目标和空袭计划目前均由人类操作员监督和审核,但这项技术目前还没有受到任何国际或国家层面的监管。

人工智能
Wilson(42865)
发表于2023年07月19日 14时15分 星期三
来自超时空碎片
微软今年早些时候宣布了 Microsoft 365 Copilot,类似 GitHub Copilot,使用 AI 帮助办公软件用户提高生产力。365 Copilot 可以按照用户要求生成文档和演示文稿,分析 Excel 数据,摘要 Outlook 邮件,总结 Teams 中的讨论要点,自动化重复性工作,等等。当时软件巨人未披露价格。现在微软公布了让大部分小企业和普通用户难以接受的定价:在 Microsoft 365 E3 等付费版本的基础上每人每月额外支付 30 美元。而 Microsoft 365 E3 的订阅费用为每人每月 36 美元,最新定价相当于把费用增加了一倍。

人工智能
1
Wilson(42865)
发表于2023年07月19日 11时01分 星期三
来自向世界倾诉爱
Meta 宣布了它的新一代大模型 Llama 2。Llama 2 有 70 亿、130 亿和 700 亿参数三个版本,它的预训练模型使用了 2 万亿 tokens 训练,比上一代的 Llama 多 40%,上下文长度增加了一倍,微调模型使用了逾百万人类注释训练。基准测试显示 Llama 2 在很多方面都接近甚至超过了 OpenAI 的 GPT-3.5。GPT-3.5 有 1750 亿个参数,而 GPT-4 有超过1 万亿个参数,相比下 Llama 的参数规模要小得多。Llama 2 采用了非常有针对性的授权:如果月活用户数超过 7 亿,企业必须从 Meta 申请许可证,而 Meta 会对此类授权进行严格设限。月活用户逾 7 亿的平台就那么几家——亚马逊、苹果、Google、字节跳动,微软刚刚宣布与 Meta 在 Llama 2 上展开合作,可能不在受限范围。

人工智能
Wilson(42865)
发表于2023年07月18日 17时52分 星期二
来自火星众神
开源文本图像生成模型 Stable Diffusion 的开发商 Stability AI 发布了一个将草图瞬间变成真实图像的在线工具 Stable Doodle。Stability AI 称它既适合专业人士也适合新手,无论他们熟悉不熟悉 AI 工具。只要有基本的绘图技能,能上网,就能在数秒内生成高质量的原创图像。Stable Doodle 也支持基于用户输入的文字描述提示词去生成图像,它目前支持 14 种艺术风格。

人工智能
Wilson(42865)
发表于2023年07月18日 11时37分 星期二
来自造星主
有多个项目实现了在浏览器上直接运行开源文本图像生成模型 Stable Diffusion。这些项目都利用了 WebGPU,因此都需要浏览器支持 WebGPU,而 WebGPU 目前尚不稳定,AI 大模型又过于庞大,因此未必能正常工作。目前唯一实验性支持 WebGPU 的浏览器是 Chrome,它需要数 GB 的可用内存,在内存有限的机器上会加载缓慢。

人工智能
Wilson(42865)
发表于2023年07月17日 23时01分 星期一
来自遥远地球之歌
威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型,包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0,Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示,OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员,突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。

人工智能
Wilson(42865)
发表于2023年07月17日 15时34分 星期一
来自时空折叠
一方面 ChatGPT 的流量在下降,另一方面用户抱怨 ChatGPT 的回答质量变差了。根据 SimilarWeb 的数据,上个月 ChatGPT 的流量下降了近 10%。ChatGPT 的 iOS 应用的下载量也在下降。GPT-4 的付费用户同时在抱怨 OpenAI 的聊天机器人最近输出速度变快了,但代价是输出质量下降了。一位用户打了一个比喻说,前一个月 GPT-4 的使用体验就像是驾驶一辆法拉利,但这个月它变成了像是驾驶一辆破旧皮卡。AI 社区猜测 OpenAI 设计理念发生了改变,它将大模型分解成几个在特定领域训练的小模型,此举旨在降低成本。还有一种可能性是互联网开始充斥着 AI 生成内容,而如果用 AI 使用 AI 生成的数据集进行训练,它的质量会下降。

人工智能
Wilson(42865)
发表于2023年07月16日 22时30分 星期日
来自追光的孩子
网络犯罪分子正将生成式 AI 工具用于 Business Email Compromise (BEC) 攻击。以 OpenAI 聊天机器人 ChatGPT 为代表的生成式 AI 能生成类似人类的文本,网络罪犯可利用它自动创建高度可信的钓鱼邮件,对收件人高度定制,增加攻击的成功率。在地下黑客论坛,网络罪犯演示了利用生成式 AI 改进网络钓鱼或 BEC 攻击所用邮件的潜力。即使攻击对象使用的语言不是攻击者的母语,在生成式 AI 的帮助下攻击者将可以轻而易举的伪造可信的邮件。网络罪犯甚至创建了专门用于恶意目的的工具 WormGPT。WormGPT 是基于 2021 年开发的大模型 GPTJ,它的功能包括无限字符支持、聊天记忆保留和代码格式化等。开发者声称 WormGPT 使用了恶意程序相关的数据进行训练。

人工智能
Wilson(42865)
发表于2023年07月16日 21时45分 星期日
来自沉船岛
从互联网诞生之初,垃圾信息就是使用者面临的一大难题。如何从无数信息中寻找到有用信息?搜索引擎的需求由此而来。早期的垃圾信息都是由人工生成,因此其数量受制于人类工作的局限性。但随着生成式 AI 的到来,大批量生成将使得垃圾信息的量级远超过去。五月初,新闻评级公司 NewsGuard 发现有 49 个假新闻网站使用 AI 生成内容。到 6 月底,这个数字增加到了 277。这些 AI 生成内容网站旨在通过 Google 的广告获利。

人工智能
Wilson(42865)
发表于2023年07月15日 13时29分 星期六
来自失眠
Meta 的大语言模型 LLaMA 过去几个月推动了开源大模型的快速发展,但 LLaMA 目前不支持商业使用,而是在非商业授权下提供给社区和研究人员使用。Meta 现在准备推出 LLaMA 的商业版本,允许开发者和企业在 LLaMA 基础上构建商业应用。LLaMA 有 70 亿、130 亿、330 亿和 650 亿参数多个版本,相比下 ChatGPT 使用大模型 GPT-3.5 有 1750 亿个参数,而新一代的 GPT-4 据报有超过 1 万亿个参数。

人工智能
Wilson(42865)
发表于2023年07月14日 15时31分 星期五
来自影舞
Google 宣布了其 AI 聊天机器人 Bard 的重大更新:对全世界大部分国家开放访问(不包括中国大陆和香港),支持阿拉伯语、中文、德语、印度语和西班牙语在内的四十多种语言。此前因为欧盟的隐私要求,Google 推迟了向欧盟地区提供 Bard,最新更新包含了额外的隐私功能,而 Bard 也正式提供给了整个欧洲地区。新功能包括:固定和重命名对话,导出代码到更多地方,与朋友分享 Bard 聊天记录,可在提示中上传图像,目前只支持英文,未来会支持更多语言。

人工智能
Wilson(42865)
发表于2023年07月14日 13时50分 星期五
来自人猿泰山之密林追踪
美国联邦贸易委员会(FTC)正在调查 OpenAI 的 ChatGPT 是否因发布有关人们的虚假信息而对他们造成了伤害,意味着该款热门应用面临潜在的诉讼风险。FTC 表示,该机构对 ChatGPT 的调查重点是 OpenAI 是否“从事了与消费者受伤害的风险有关的不公平或欺骗性行为,其中包括名誉损害”。FTC 向 OpenAI 提出的一个问题是,要求该公司“详细描述其在多大程度上采取了措施来应对或降低风险,即该公司的大语言模型产品可能会生成关于真实个人的虚假、误导或诋毁性陈述的风险”。在发给 OpenAI 的民事传票中,FTC 提出了有关该公司数据安全操作的详细问题。FTC 援引了 2020 年的一起事件,当时 OpenAI 披露了一个漏洞,该漏洞可以让用户查看其他用户的聊天信息和一些与支付相关的信息。FTC 传票提出的其他问题还包括 OpenAI 的营销活动、AI 模型的训练做法以及该公司对用户个人信息的处理。

人工智能
Wilson(42865)
发表于2023年07月13日 19时24分 星期四
来自沙皇的邮件
网信办等七部门发布了《生成式人工智能服务管理暂行办法》,2023 年 8 月 15 日起施行。《暂行办法》规定:
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。