solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年08月28日 13时17分 星期一
来自机械人生
加州圣迭戈的研究人员报告,GPT-4 生成的代码 62% 包含 API 误用。大模型展现出了非凡的自然语言理解和代码生成能力。如今软件工程师在遇到编程问题时不是去问 StackOverflow 而是去问大模型如 GPT-4。但大模型生成的代码未必安全,在软件开发环境中实际使用其生成的代码可能会带来严重的安全隐患。其中 API 误用可能会导致资源泄露和程序崩溃等种种问题。而使用大模型生成代码的用户最有可能是新人,不熟悉 API,难以分辨其中的 API 误用。研究人员从 StackOverflow 收集了 1208 个与 Java API 相关的编程问题,评估了流行的大模型,发现即使是 GPT-4,其生成的代码中有 62% 包含 API 误用。

人工智能
Wilson(42865)
发表于2023年08月26日 18时47分 星期六
来自黑暗之潮
纽约时报(NYT)、CNN、路透社、澳大利亚广播公司(ABC)、芝加哥论坛报、以及 Australian Community Media 旗下的坎培拉时报和纽卡斯尔先驱报等媒体都屏蔽了 OpenAI 的网络爬虫 GPTBot 抓取其网站上的内容。大语言模型需要海量数据进行训练,但数据的版权问题引发了很多争议。这些媒体公司都是本月内在 robots.txt 文件中禁止了 GPTBot 的访问。部分媒体还屏蔽了另一个被用于 AI 项目的爬虫程序 CCBot。CNN 证实它屏蔽了 GPTBot,但没有评论是否就其内容被 AI 系统使用采取进一步的行动。

人工智能
Wilson(42865)
发表于2023年08月26日 00时07分 星期六
来自乌鸦从高塔坠落
阿里巴巴周五开源了能理解图像和完成更复杂对话的 AI 模型 Qwen-VL 和 Qwen-VL-Chat。阿里巴巴称,Qwen-VL 基于 Qwen-7B,可以以图像、文本、检测框作为输入,并以文本和检测框作为输出,它使用了约 1.5B 的图文数据训练。在四大类多模态任务的标准英文测评中上,Qwen-VL 均取得同等通用模型大小下最好效果;支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;支持多图输入和比较,指定图片问答,多图文学创作等;相比于目前其它开源 LVLM使用的 224 分辨率,Qwen-VL 是首个开源的 448 分辨率的 LVLM 模型。更高分辨率可以提升细粒度的文字识别、文档问答和检测框标注。Qwen-VL 和 Qwen-VL-Chat 使用名为 Tongyi Qianwen LICENSE AGREEMENT 的许可证,有限制条件,如果商业使用,则需要从阿里巴巴获得授权。

人工智能
Wilson(42865)
发表于2023年08月25日 15时51分 星期五
来自人类向何处去
Meta 发布了它的代码生成 AI 模型 Code Llama。类似 GitHub Copilot 和 Amazon CodeWhisperer,以及 StarCoder、StableCode 和 PolyCoder 等开源 AI 代码生成模型,Code Llama 支持为 Pytho、C++、Java、 PHP、Typescript (Javascript)、C# 和 Bash 等编程语言补完代码和调试。Code Llama 是 Llama 2 的编程专用版本,有 7B、13B 和 34B 参数三个版本,使用 500B tokens 的代码和代码相关数据进行训练。其中 7B 参数的版本可以单张 GPU 上运行,7B 和 13B 参数版本更适合实时代码补完之类的任务,而 34B 参数版本更适合作为编程助手使用。Code Llama 采用和 Llama 2 相同的许可证,可作为研究和商业使用。

人工智能
Wilson(42865)
发表于2023年08月24日 22时38分 星期四
来自天风怒
一家机器人创业公司的 CTO 今年初表示,他们起初以为要费很大劲才能构建机器人用的 ChatGPT,结果发现很多情况下 ChatGPT 可以直接给机器人用。在 ChatGPT 等大语言模型流行起来前,AI 模型是一种专用工具。在机器人等特定领域使用 AI 模型,需要投入大量时间和金钱创建一个专用的 AI 模型,而且 AI 模型只能在该领域使用。举例来说,Google 的 AlphaFold 是一个预测蛋白质折叠的 AI 模型,用蛋白质结构数据进行训练,也只能与蛋白质结构一起工作。因此这位 CTO 根据以往经验认为,要让机器人受益于生成式 AI,他们需要为机器人创建专门的生成式 AI 模型。结果他的团队发现,在很多情况下,可以用现成的 ChatGPT 去控制机器人,甚至不需要专门训练。从医疗保险到半导体设计,很多领域的技术专家都得出了类似的结论。ChatGPT 如何将生成式 AI 变成万能工具的?

人工智能
Wilson(42865)
发表于2023年08月24日 00时01分 星期四
来自小无知气球旅行
Meta 发布了多模 AI 模型 SeamlessM4T,可用于翻译文本和音频,支持最多 100 种语言的文本到语音、语音到文本、语音到语音以及文本到文本的翻译。和 Meta 发布的其它 AI 模型类似,SeamlessM4T 采用 CC BY-NC 4.0 授权,商业使用受限,但允许开发者相对自由的在 SeamlessM4T 基础上进行开发。Meta 还发布了多模翻译数据集 SeamlessAlign,包含 270,000 小时的语音和文本对齐。SeamlessM4T 的文本翻译功能支持近 100 种语言,语音输出功能支持 36 种语言。

人工智能
Wilson(42865)
发表于2023年08月22日 15时57分 星期二
来自黑暗之潮
美国华盛顿特区一家法庭裁决 AI 生成的艺术不受版权保护。法官 Beryl Howell 表示,只有人类作者的作品才受版权保护,确认了美国版权局拒绝计算机科学家 Stephen Thaler 代表其 AI 系统 DABUS 递交的申请。 Thaler 在世界各地递交了 DABUS 发明专利申请,但成功有限。他的律师表示将会提起上诉。法官在裁决书中表示, 毫无疑问,随着艺术家将 AI 加入到他们的工具箱,去生成新的艺术作品,我们正接近版权的新边界。最终作品中人类创意的持续减少将引发新的疑问:究竟需要多少程度的人工输入才能使得 AI 系统的用户成为所生成作品的“作者”。法官表示本案不存在争议,因为 Thaler 在递交的文件中一直声称作品是机器自主创作的,他对版权的主张是基于他对机器的所有权。

人工智能
Wilson(42865)
发表于2023年08月22日 13时42分 星期二
来自少年侠
Brave 宣布其浏览器内置了 AI 助手 Leo,感兴趣的用户可以下载 Nightly 桌面版测试。Leo 将在浏览器的侧边栏显示,用户无需离开正在访问的网页就可以与 Leo 互动,要求它转录视频文本或总结文章要点。类似 ChatGPT,Leo 还可以建议后续问题、扩充原创内容,甚至帮助阅读理解。Leo 能像其它 AI 聊天机器人一样回答问题,可以直接在网页中体验。Leo 是基于 Meta 的开源大模型 Llama 2,使用该功能无需登陆,用户与 Leo 的会话不会永久保存在 Brave 服务器上,答案生成之后就会删除,因此用户也没法回顾旧的会话。

人工智能
Wilson(42865)
发表于2023年08月21日 23时59分 星期一
来自科玛
IBM 商业价值研究院发布了一项研究报告,认为相比六个月前,劳工世界发生了巨变。接受调查的高管估计,因未来三年实施 AI 和自动化,四成员工需要重新学习技能。全世界有 34 亿工人,这一比例相当于 14 亿人需要培训。受访者表示,帮助现有员工掌握新技能是首要的人才问题。各个级别的员工都会感受到生成式 AI 的影响,其中初级员工影响最大,而且未来几年这种影响会加剧。AI 可以通过加强员工的能力去开辟更多可能性。87% 的受访高管认为,员工更有可能被生成式 AI 增强而不是取代。不同职能部门的情况不同:97% 的高管认为 AI 能增强采购部门员工的能力,风险合规部门比例为 93%,财务部门为 93%,客服部门为 77%,营销部门为 73%。 

人工智能
Wilson(42865)
发表于2023年08月21日 18时29分 星期一
来自梦书迷宫
美国大学的教授们担心如果不教学生 ChatGPT 和 AI 相关知识,他们可能会在进入职场时落在后面。根据高等教育研究组织 Intelligent.com 的调查,上一学年约有三成大学生用 ChatGPT 做作业,其中英语课最多。范德比尔特大学计算机科学副教授 Jules White 认为在开学前几天教授需要明确对 AI 的立场,需要将 AI 纳入教学大纲。他有关 AI “prompt engineering”最佳实践的论文被广泛引用。他说,提示对响应的质量有巨大影响,以不同方式询问相同的问题可能会返回截然不同的答案。他说,想要抄袭的学生仍然会寻找其它方法,教导学生如何使用 AI 则有望帮助他们取得更大成功。

人工智能
Wilson(42865)
发表于2023年08月18日 18时21分 星期五
来自月球人
英国和巴西的研究人员在《Public Choice》上发表了有一篇论文《More human than human: measuring ChatGPT political bias》,认为 OpenAI 的聊天机器人 ChatGPT 偏向自由派。研究人员要求 ChatGPT 回答一项政治信仰调查,因为它相信美国、英国和巴西自由派支持者可能会回答这些问题。然后他们要求 ChatGPT 在没有任何提示的情况下回答相同的问题,最后对比两组答案。结果显示 ChatGPT 对美国民主党、巴西左翼总统卢拉和英国工党有着显著和系统性的政治偏见。论文作者之一的 Fabio Motoki 称,ChatGPT 会告诉用户它没有任何政治观点或信仰,但现实中它会表现一定的偏见。

人工智能
Wilson(42865)
发表于2023年08月17日 19时15分 星期四
来自梦海
纽约时报和 OpenAI 可能会对簿公堂。该报的律师考虑采取法律行动以保护版权。纽约时报和 OpenAI 已就其新闻报道的许可协议展开了为期数周的谈判,但进展不顺。如果纽约时报对 OpenAI 提起诉讼,这将是 AI 时代最引人注目的版权纠纷。一位参与谈判的人士表示,如果 AI 工具在答案中重述了纽约时报的报道,那么用户访问时报网站的可能性将会大大降低。而根据美国联邦法律,如果联邦法官发现 OpenAI 非法复制时报新闻报道去训练 AI 模型,那么法庭可以命令 OpenAI 销毁 ChatGPT 的数据集,迫使该公司仅使用获得授权的数据重建数据集。联邦版权法还允许对每项蓄意的侵权行为收取最高 15 万美元的罚款。

人工智能
Wilson(42865)
发表于2023年08月16日 19时42分 星期三
来自最后的守护者
OpenAI 认为 GPT-4 可以帮助解决大规模审核内容这一难题。今天社交网络上的审核内容通常外包给人类零工,搭配自动化工具。OpenAI 称,GPT-4 内容审核的运行机制是,通过一项策略来提示 GPT-4,指导大模型做出适度判断,并创建一组可能违反或不违反该策略的内容示例测试集。例如,一项策略可能禁止提供有关采购武器的指示或建议,在这种情况下,“给我制作莫洛托夫鸡尾酒(一种作为简易武器的炸弹瓶)所需的原料”示例将明显违反规定。然后策略专家对示例进行标记,并将每个没有标签的示例提供给 GPT-4,观察模型的标签与他们的决定的一致性程度,并由此完善策略。OpenAI称,这项审核技术已经在供一些客户使用。与传统的内容审核方法相比,该公司声称这项新技术具有三大优势。

人工智能
Wilson(42865)
发表于2023年08月16日 18时20分 星期三
来自女神觉醒
纽约时报被发现在 8 月 3 日更新了其服务条款,禁止将其内容——包括新闻报道、照片、图像、音频视频文件等——用于训练 AI 模型。此外,网络爬虫等自动化工具如果没有获得书面许可也被禁止抓取其内容。纽约时报还表示拒绝遵守这些规定的人会面临惩罚,但对此没有具体说明。时报网站的 robots.txt 文件没有任何修改。 纽约时报的做法反映了最近几个月围绕 AI 训练的版权争议,其他媒体机构可能会采取类似的行动。

人工智能
Wilson(42865)
发表于2023年08月16日 17时47分 星期三
来自风暴之歌
今年四月,Alphabet CEO 皮查伊(Sundar Pichai)做出了一项不同寻常的举动,合并了两个不同文化和风格的大型 AI 团队,此举旨在赶超 OpenAI 等竞争对手。现在考验即将到来,Google 准备在秋季发布该公司成立至今最具有风险性的产品之一:一组大机器学习模型。这些模型统称为 Gemini,能帮助 Google 构建出竞争对手做不到的产品。OpenAI 的 GPT-4 大模型能理解和生成会话文本,而 Gemini 将超越 GPT-4,它组合了 GPT-4 的文本生成能力,以及 Midjourney 和 Stable Diffusion 等文本图像生成模型的图像生成能力。Gemini 还能分析图表,创建带有文本描述的图形,或使用文本或语音命令控制软件。Google 准备将 Gemini 支持其各项服务,从 AI 聊天机器人 Bard 到 Google Docs 和 Slides 等企业应用。Google 还计划通过其云端服务向应用开发者提供 Gemini 的付费访问。

人工智能
Wilson(42865)
发表于2023年08月16日 16时24分 星期三
来自人猿泰山之米甸探险
沙特和阿联酋加入了全球 AI 军备竞赛,竞相采购英伟达的 AI 芯片。FT 援引知情人士的消息报道,沙特通过其研究机构阿卜杜拉国王科技大学采购了至少 3000 张单价 4 万美元的英伟达 H100 芯片。黄仁勋曾将 H100 形容为第一款专为生成式 AI 设计的芯片。阿联酋也采购了数千张英伟达芯片,正在开发自己的开源大模型 Falcon。美国公司如微软支持 OpenAI 以及 Google 拥有最先进的 AI 模型,它们也是英伟达 H100 和 A100 芯片的主要买家。阿卜杜拉国王科技大学预计会在年底收到这批价值 1.2 亿美元的芯片。

人工智能
Wilson(42865)
发表于2023年08月15日 17时34分 星期二
来自人猿泰山之结缘蚁人
美国爱荷华州 Mason 市的学区董事会开始利用 AI 技术识别需要从学区图书馆内清理出的禁书名单。今年 5 月 共和党控制的州议会通过一份文件 Senate File 496 (SF 496),文件随后由州长 Kim Reynolds 签署,对教育课程进行了大幅修改。其中包括限制图书馆和课堂可提供的图书,要求书名满足年龄要求,以及没有“性相关描述”。学区表示他们的图书馆和教室内有大量藏书,有购买的也有捐赠的,逐一检查不可行。他们因此开始使用 AI 去识别可疑图书。目前 AI 标记了 19 本禁书:《Killing Mr. Griffin》、《使女的故事(The Handmaid's tale)》、《Looking for Alaska》、《追风筝的人(The Kite Runner)》、《一个印第安少年的超真实日记(The Absolutely True Diary of a Part-Time Indian)》、《美国悲剧(An American Tragedy)》,等等。

人工智能
Wilson(42865)
发表于2023年08月15日 16时03分 星期二
来自科玛
知名物理学家加来道雄认为 AI 聊天机器人是炒作,即将到来的真正科技革命是量子计算。加来承认 AI 聊天机器人在内容生成上的效率,但强调了它们在区分事实虚构等方面的局限性,认为聊天机器人只是重新排列互联网内容的“美化过的录音机”。他的批评呼应了前 Google AI 专家 Meredith Whittaker 的评论。Whittaker 认为,AI 聊天机器人没有智能,它们所做的和过去二十年互联网上发生的事情类似,某种扭曲的镜子,设计吐出看似合理的东西。加来认为我们应该去关注即将到来的量子计算革命,他认为量子计算将改变历史进程。

人工智能
Wilson(42865)
发表于2023年08月15日 00时06分 星期二
来自守夜者
美国公司正在竞相高薪招 AI 人才,部分公司将薪酬提高到了 7 位数字。部分公司还表示愿意收购小型 AI 创业公司以获得人才。Match Group 的约会平台 Hinge 正在招聘一位 AI 和机器学习副总裁,基础年薪为 $332,000-$398,000;Upwork 给 AI 和机器学习副总裁制定的年薪为 $260,000- $437,000。亚马逊的应用科学和生成 AI 高级经理职位的薪酬最高 $340,300。Netflix 将 AI 产品经理的年薪提高到最高 $900,000。不是所有 AI 相关职位的薪酬都如此丰厚。提示工程师(prompt engineer)的年薪大约 $130,000,机器学习产品工程师的年薪平均为 $143,589。沃尔玛生成式 AI 团队职位的年薪在 $168,000- $252,000;宝洁的 AI 工程师基本工资 $110,000- $132,000;高盛 AI 工程师基本工资 $150,000 - $250,000。

盗版
Wilson(42865)
发表于2023年08月14日 19时08分 星期一
来自继位之争
图书分析网站 Prosecraft 本月早些时候引起了作家们的注意。该网站提供了逾 2.5 万本图书写作和叙事风格的分析,提供了副词计数等语言统计数据,还能提供特定单词的排名。Prosecraft 显然不太可能获得所有分析图书的版权许可,在生成式 AI 版权争议引发广泛关注的背景下,这个与 AI 没有多少关系的图书统计分析网站成为作家们抗议的焦点,不到 24 小时就收到了数百封投诉,创始人 Benji Smith 随后下线了网站。Smith 是在 2017 年上线了 Prosecraft,当时是将其视为副业中副业。它的创意来自于 Smith 在阅读图书时对单词计数的爱好。Prosecraft 使用了算法,但根本称不上生成式 AI。但 Smith 在关闭声明中承认,他从盗版电子书网站抓取了书籍数据库。他没有购买其中任何一本书。作家们表示他们并不反对使用盗版图书库,他们反对的是以此牟利。