solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年08月24日 00时01分 星期四
来自小无知气球旅行
Meta 发布了多模 AI 模型 SeamlessM4T,可用于翻译文本和音频,支持最多 100 种语言的文本到语音、语音到文本、语音到语音以及文本到文本的翻译。和 Meta 发布的其它 AI 模型类似,SeamlessM4T 采用 CC BY-NC 4.0 授权,商业使用受限,但允许开发者相对自由的在 SeamlessM4T 基础上进行开发。Meta 还发布了多模翻译数据集 SeamlessAlign,包含 270,000 小时的语音和文本对齐。SeamlessM4T 的文本翻译功能支持近 100 种语言,语音输出功能支持 36 种语言。

人工智能
Wilson(42865)
发表于2023年08月22日 15时57分 星期二
来自黑暗之潮
美国华盛顿特区一家法庭裁决 AI 生成的艺术不受版权保护。法官 Beryl Howell 表示,只有人类作者的作品才受版权保护,确认了美国版权局拒绝计算机科学家 Stephen Thaler 代表其 AI 系统 DABUS 递交的申请。 Thaler 在世界各地递交了 DABUS 发明专利申请,但成功有限。他的律师表示将会提起上诉。法官在裁决书中表示, 毫无疑问,随着艺术家将 AI 加入到他们的工具箱,去生成新的艺术作品,我们正接近版权的新边界。最终作品中人类创意的持续减少将引发新的疑问:究竟需要多少程度的人工输入才能使得 AI 系统的用户成为所生成作品的“作者”。法官表示本案不存在争议,因为 Thaler 在递交的文件中一直声称作品是机器自主创作的,他对版权的主张是基于他对机器的所有权。

人工智能
Wilson(42865)
发表于2023年08月22日 13时42分 星期二
来自少年侠
Brave 宣布其浏览器内置了 AI 助手 Leo,感兴趣的用户可以下载 Nightly 桌面版测试。Leo 将在浏览器的侧边栏显示,用户无需离开正在访问的网页就可以与 Leo 互动,要求它转录视频文本或总结文章要点。类似 ChatGPT,Leo 还可以建议后续问题、扩充原创内容,甚至帮助阅读理解。Leo 能像其它 AI 聊天机器人一样回答问题,可以直接在网页中体验。Leo 是基于 Meta 的开源大模型 Llama 2,使用该功能无需登陆,用户与 Leo 的会话不会永久保存在 Brave 服务器上,答案生成之后就会删除,因此用户也没法回顾旧的会话。

人工智能
Wilson(42865)
发表于2023年08月21日 23时59分 星期一
来自科玛
IBM 商业价值研究院发布了一项研究报告,认为相比六个月前,劳工世界发生了巨变。接受调查的高管估计,因未来三年实施 AI 和自动化,四成员工需要重新学习技能。全世界有 34 亿工人,这一比例相当于 14 亿人需要培训。受访者表示,帮助现有员工掌握新技能是首要的人才问题。各个级别的员工都会感受到生成式 AI 的影响,其中初级员工影响最大,而且未来几年这种影响会加剧。AI 可以通过加强员工的能力去开辟更多可能性。87% 的受访高管认为,员工更有可能被生成式 AI 增强而不是取代。不同职能部门的情况不同:97% 的高管认为 AI 能增强采购部门员工的能力,风险合规部门比例为 93%,财务部门为 93%,客服部门为 77%,营销部门为 73%。 

人工智能
Wilson(42865)
发表于2023年08月21日 18时29分 星期一
来自梦书迷宫
美国大学的教授们担心如果不教学生 ChatGPT 和 AI 相关知识,他们可能会在进入职场时落在后面。根据高等教育研究组织 Intelligent.com 的调查,上一学年约有三成大学生用 ChatGPT 做作业,其中英语课最多。范德比尔特大学计算机科学副教授 Jules White 认为在开学前几天教授需要明确对 AI 的立场,需要将 AI 纳入教学大纲。他有关 AI “prompt engineering”最佳实践的论文被广泛引用。他说,提示对响应的质量有巨大影响,以不同方式询问相同的问题可能会返回截然不同的答案。他说,想要抄袭的学生仍然会寻找其它方法,教导学生如何使用 AI 则有望帮助他们取得更大成功。

人工智能
Wilson(42865)
发表于2023年08月18日 18时21分 星期五
来自月球人
英国和巴西的研究人员在《Public Choice》上发表了有一篇论文《More human than human: measuring ChatGPT political bias》,认为 OpenAI 的聊天机器人 ChatGPT 偏向自由派。研究人员要求 ChatGPT 回答一项政治信仰调查,因为它相信美国、英国和巴西自由派支持者可能会回答这些问题。然后他们要求 ChatGPT 在没有任何提示的情况下回答相同的问题,最后对比两组答案。结果显示 ChatGPT 对美国民主党、巴西左翼总统卢拉和英国工党有着显著和系统性的政治偏见。论文作者之一的 Fabio Motoki 称,ChatGPT 会告诉用户它没有任何政治观点或信仰,但现实中它会表现一定的偏见。

人工智能
Wilson(42865)
发表于2023年08月17日 19时15分 星期四
来自梦海
纽约时报和 OpenAI 可能会对簿公堂。该报的律师考虑采取法律行动以保护版权。纽约时报和 OpenAI 已就其新闻报道的许可协议展开了为期数周的谈判,但进展不顺。如果纽约时报对 OpenAI 提起诉讼,这将是 AI 时代最引人注目的版权纠纷。一位参与谈判的人士表示,如果 AI 工具在答案中重述了纽约时报的报道,那么用户访问时报网站的可能性将会大大降低。而根据美国联邦法律,如果联邦法官发现 OpenAI 非法复制时报新闻报道去训练 AI 模型,那么法庭可以命令 OpenAI 销毁 ChatGPT 的数据集,迫使该公司仅使用获得授权的数据重建数据集。联邦版权法还允许对每项蓄意的侵权行为收取最高 15 万美元的罚款。

人工智能
Wilson(42865)
发表于2023年08月16日 19时42分 星期三
来自最后的守护者
OpenAI 认为 GPT-4 可以帮助解决大规模审核内容这一难题。今天社交网络上的审核内容通常外包给人类零工,搭配自动化工具。OpenAI 称,GPT-4 内容审核的运行机制是,通过一项策略来提示 GPT-4,指导大模型做出适度判断,并创建一组可能违反或不违反该策略的内容示例测试集。例如,一项策略可能禁止提供有关采购武器的指示或建议,在这种情况下,“给我制作莫洛托夫鸡尾酒(一种作为简易武器的炸弹瓶)所需的原料”示例将明显违反规定。然后策略专家对示例进行标记,并将每个没有标签的示例提供给 GPT-4,观察模型的标签与他们的决定的一致性程度,并由此完善策略。OpenAI称,这项审核技术已经在供一些客户使用。与传统的内容审核方法相比,该公司声称这项新技术具有三大优势。

人工智能
Wilson(42865)
发表于2023年08月16日 18时20分 星期三
来自女神觉醒
纽约时报被发现在 8 月 3 日更新了其服务条款,禁止将其内容——包括新闻报道、照片、图像、音频视频文件等——用于训练 AI 模型。此外,网络爬虫等自动化工具如果没有获得书面许可也被禁止抓取其内容。纽约时报还表示拒绝遵守这些规定的人会面临惩罚,但对此没有具体说明。时报网站的 robots.txt 文件没有任何修改。 纽约时报的做法反映了最近几个月围绕 AI 训练的版权争议,其他媒体机构可能会采取类似的行动。

人工智能
Wilson(42865)
发表于2023年08月16日 17时47分 星期三
来自风暴之歌
今年四月,Alphabet CEO 皮查伊(Sundar Pichai)做出了一项不同寻常的举动,合并了两个不同文化和风格的大型 AI 团队,此举旨在赶超 OpenAI 等竞争对手。现在考验即将到来,Google 准备在秋季发布该公司成立至今最具有风险性的产品之一:一组大机器学习模型。这些模型统称为 Gemini,能帮助 Google 构建出竞争对手做不到的产品。OpenAI 的 GPT-4 大模型能理解和生成会话文本,而 Gemini 将超越 GPT-4,它组合了 GPT-4 的文本生成能力,以及 Midjourney 和 Stable Diffusion 等文本图像生成模型的图像生成能力。Gemini 还能分析图表,创建带有文本描述的图形,或使用文本或语音命令控制软件。Google 准备将 Gemini 支持其各项服务,从 AI 聊天机器人 Bard 到 Google Docs 和 Slides 等企业应用。Google 还计划通过其云端服务向应用开发者提供 Gemini 的付费访问。

人工智能
Wilson(42865)
发表于2023年08月16日 16时24分 星期三
来自人猿泰山之米甸探险
沙特和阿联酋加入了全球 AI 军备竞赛,竞相采购英伟达的 AI 芯片。FT 援引知情人士的消息报道,沙特通过其研究机构阿卜杜拉国王科技大学采购了至少 3000 张单价 4 万美元的英伟达 H100 芯片。黄仁勋曾将 H100 形容为第一款专为生成式 AI 设计的芯片。阿联酋也采购了数千张英伟达芯片,正在开发自己的开源大模型 Falcon。美国公司如微软支持 OpenAI 以及 Google 拥有最先进的 AI 模型,它们也是英伟达 H100 和 A100 芯片的主要买家。阿卜杜拉国王科技大学预计会在年底收到这批价值 1.2 亿美元的芯片。

人工智能
Wilson(42865)
发表于2023年08月15日 17时34分 星期二
来自人猿泰山之结缘蚁人
美国爱荷华州 Mason 市的学区董事会开始利用 AI 技术识别需要从学区图书馆内清理出的禁书名单。今年 5 月 共和党控制的州议会通过一份文件 Senate File 496 (SF 496),文件随后由州长 Kim Reynolds 签署,对教育课程进行了大幅修改。其中包括限制图书馆和课堂可提供的图书,要求书名满足年龄要求,以及没有“性相关描述”。学区表示他们的图书馆和教室内有大量藏书,有购买的也有捐赠的,逐一检查不可行。他们因此开始使用 AI 去识别可疑图书。目前 AI 标记了 19 本禁书:《Killing Mr. Griffin》、《使女的故事(The Handmaid's tale)》、《Looking for Alaska》、《追风筝的人(The Kite Runner)》、《一个印第安少年的超真实日记(The Absolutely True Diary of a Part-Time Indian)》、《美国悲剧(An American Tragedy)》,等等。

人工智能
Wilson(42865)
发表于2023年08月15日 16时03分 星期二
来自科玛
知名物理学家加来道雄认为 AI 聊天机器人是炒作,即将到来的真正科技革命是量子计算。加来承认 AI 聊天机器人在内容生成上的效率,但强调了它们在区分事实虚构等方面的局限性,认为聊天机器人只是重新排列互联网内容的“美化过的录音机”。他的批评呼应了前 Google AI 专家 Meredith Whittaker 的评论。Whittaker 认为,AI 聊天机器人没有智能,它们所做的和过去二十年互联网上发生的事情类似,某种扭曲的镜子,设计吐出看似合理的东西。加来认为我们应该去关注即将到来的量子计算革命,他认为量子计算将改变历史进程。

人工智能
Wilson(42865)
发表于2023年08月15日 00时06分 星期二
来自守夜者
美国公司正在竞相高薪招 AI 人才,部分公司将薪酬提高到了 7 位数字。部分公司还表示愿意收购小型 AI 创业公司以获得人才。Match Group 的约会平台 Hinge 正在招聘一位 AI 和机器学习副总裁,基础年薪为 $332,000-$398,000;Upwork 给 AI 和机器学习副总裁制定的年薪为 $260,000- $437,000。亚马逊的应用科学和生成 AI 高级经理职位的薪酬最高 $340,300。Netflix 将 AI 产品经理的年薪提高到最高 $900,000。不是所有 AI 相关职位的薪酬都如此丰厚。提示工程师(prompt engineer)的年薪大约 $130,000,机器学习产品工程师的年薪平均为 $143,589。沃尔玛生成式 AI 团队职位的年薪在 $168,000- $252,000;宝洁的 AI 工程师基本工资 $110,000- $132,000;高盛 AI 工程师基本工资 $150,000 - $250,000。

盗版
Wilson(42865)
发表于2023年08月14日 19时08分 星期一
来自继位之争
图书分析网站 Prosecraft 本月早些时候引起了作家们的注意。该网站提供了逾 2.5 万本图书写作和叙事风格的分析,提供了副词计数等语言统计数据,还能提供特定单词的排名。Prosecraft 显然不太可能获得所有分析图书的版权许可,在生成式 AI 版权争议引发广泛关注的背景下,这个与 AI 没有多少关系的图书统计分析网站成为作家们抗议的焦点,不到 24 小时就收到了数百封投诉,创始人 Benji Smith 随后下线了网站。Smith 是在 2017 年上线了 Prosecraft,当时是将其视为副业中副业。它的创意来自于 Smith 在阅读图书时对单词计数的爱好。Prosecraft 使用了算法,但根本称不上生成式 AI。但 Smith 在关闭声明中承认,他从盗版电子书网站抓取了书籍数据库。他没有购买其中任何一本书。作家们表示他们并不反对使用盗版图书库,他们反对的是以此牟利。

人工智能
Wilson(42865)
发表于2023年08月14日 18时13分 星期一
来自丽赛的故事
生成式 AI 工具的流行加剧了编程问答网站 Stack Overflow 的流量下降趋势。在 Stack Overflow 询问编程问题是有门槛的,而询问 ChatGPT 则能及时获得友好的回答,即使答案有可能是错误的。今天很多人都是询问 ChatGPT 而不是到 Stack Overflow 提问。在此背景下,Stack Overflow 宣布创建了一个专门讨论生成式 AI 提示词的社区 GenAI Stack Exchange,以及它的生成式 AI 工具 OverflowAI,帮助开发者找到编程问题的答案。它的预览版目前开放注册。

人工智能
Wilson(42865)
发表于2023年08月13日 23时35分 星期日
来自猛兽的财富
普渡大学的研究人员发表了一篇论文预印本,他们用 517 个 Stack Overflow 问题测试了 OpenAI 的聊天机器人 ChatGPT,从正确性、一致性、全面性和简洁等方面对答案进行评估。他们还向 12 位人类参与者询问了 AI 生成的结果。他们的分析显示,ChatGPT 的结果有 52% 错误的,77% 太冗长。而人类只有在错误非常明显的情况下才能识别出来,他们在 39.34% 的情况下偏爱 ChatGPT 的答案,而这些答案中 77% 是错误的。即使答案明显错误,但因为其语言风格更令人感到愉快以及感到具有权威性,人类还是会青睐 AI 生成的答案。

人工智能
Wilson(42865)
发表于2023年08月11日 14时08分 星期五
来自繁星若尘
今天的大模型主要用英伟达的 GPU 训练,但让英伟达一家独大对整个生态系统并不是好事。MLC(Machine learning compilation) 项目正致力于在 AMD GPU 上编译和部署大模型,实现与英伟达 GPU 相当的性能。相对于英伟达深耕了近二十年的 CUDA 软件生态系统,AMD GPU 最大问题在于软件支持,它正通过投资 ROCm 缩小与英伟达的差距。MLC 是一项新兴技术,旨在编译和自动优化机器学习工作负载。它不会为每个后端如 ROCm 或 CUDA 构造特定的内核,而是自动为不同后端生成代码。开发者称,MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的八成,而 7900 XTX 的价格只有 RTX 4090 的六成。

人工智能
Wilson(42865)
发表于2023年08月11日 13时39分 星期五
来自泰坦棋手
FT 援引知情人士的消息报道,百度、字节跳动、腾讯和阿里巴巴今年从英伟达订购了价值 10 亿美元约 10 万张 A800 数据中心 GPU,额外加购的 40 亿美元英伟达 GPU 将在明年交付。A800 是弱化版的 A100 GPU,为了遵守美国去年颁布的出口限制,英伟达专为中国市场开发了降低数据传输率的 A800——A100 的传输率达到 800 GB/s,而 A800 降至了 600 GB/s。因为担心拜登政府颁布新的出口限制,中国互联网巨头疯狂囤积了英伟达的 A800 芯片。一位匿名百度员工说,没有英伟达的芯片,就没办法训练任何大语言模型。在 ChatGPT 大获成功之后,中国的互联网巨头都在开发自己的大模型。字节跳动开发的一个 AI 聊天机器人代号为 Grace,它为此已经囤积了约至少 1 万张英伟达 GPU,加购的约 7 万张 A800 将在明年交付,价值约 7 亿美元。

人工智能
Wilson(42865)
发表于2023年08月10日 19时38分 星期四
来自失忆者
Google 就澳大利亚政府的 AI 监管框架递交文件表示,版权法应该修改允许生成式 AI 爬取互联网内容,让版权内容以恰当和合理使用的方式在澳大利亚用于训练 AI 模型,不愿意被训练的内容出版商可以选择退出。Google 最近提出了 robots.txt 的一种替代方案,网站可以在其中明确是否允许爬取内容训练 AI。AI 需要海量数据进行训练,而数据集的版权问题正日益引起关注。版权将是生成式 AI 未来面临的一大问题。