文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
ken:feigaobox@gmail.com
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门评论
- 球球大作战? (1 points, 一般) by qq33357486 在 2023年05月06日09时35分 星期六 评论到 天文学家观察到恒星吞食行星
- 没有来源 (1 points, 一般) by scottcgi 在 2023年05月06日00时47分 星期六 评论到 TikTok 通过其猫咪账号跟踪金融时报记者
- 自古竭泽而渔 (1 points, 一般) by africwildman 在 2023年05月02日20时28分 星期二 评论到 如何促进农户采纳有机肥和生物农药
- 改成定时发送 (1 points, 一般) by jerry 在 2023年04月30日18时40分 星期日 评论到 美国参议员提议立法禁止用 AI 发射核武器
- 狗尾续貂 (1 points, 一般) by Reinhardt 在 2023年04月28日07时10分 星期五 评论到 《Indiana Jones 5》开幕将有 25 分钟的年轻版哈里森福特
- 是的,尹石烈一点都不朝鲜,倒十分女真。 (1 points, 一般) by solidot1528092189 在 2023年04月26日04时32分 星期三 评论到 韩国政府最高 69 小时工作周遭到年轻一代的抗议
- 当信息场本身存在禁区的时候,相反观点不会包括这个禁区里的内容ç。。 (1 points, 一般) by solidot1528092189 在 2023年04月26日04时28分 星期三 评论到 方滨兴称 ChatGPT 可能会造成知识茧房
- 生活不是奥林匹克赛场,不要爹味十足的定义下一代的需求。 (1 points, 一般) by solidot1528092189 在 2023年04月26日04时24分 星期三 评论到 研究发现高铁略微增加了幸福感
- SFC (1 points, 一般) by 陈少举 在 2023年04月24日23时27分 星期一 评论到 当 Windows 用户在恐慌下删除 system32\curl.exe
- 投胎投对国家很重要啊 (1 points, 一般) by africwildman 在 2023年04月20日08时33分 星期四 评论到 研究发现每周工作四天对健康有益
ChatGPT 等 AI 聊天机器人的成功受益于两种训练范式:指令微调和基于人类反馈的增强学习(RLHF)。目前缺乏同时应用这两种范式的开源模型,大部分模型因 RLHF 的复杂性而只应用了指令微调。AI 创业公司 Stability AI 宣布发布第一种应用 RLHF 训练的大型开源聊天机器人 StableVicuna,基于 Vicuna v0 13b,而 Vicuna v0 13b 则是基于 Meta 的大语言模型 LLaMA 13b(130 亿参数)。LLaMA 模型目前不支持商业使用。
根据欧盟一项新的立法草案,ChatGPT 等 AI 工具的开发商将被要求披露在构建其系统时使用的版权材料。该草案将成为西方首套管理 AI 推广的全面规则。这一规则将给出版商和内容创作者一个新的武器,当他们的作品被 ChatGPT 等工具用作 AI 生成内容的原始材料时,他们可以寻求利润分成。
美国国家经济研究局发表研究报告《Generative AI at Work》,发现生成式 AI 将生产力提高了14%,并减少了工作压力,增加了从事客户支持工作的员工保留率。从自动化中受益最大的是那些新入职的和缺乏经验的员工。客户支持是一项工作压力很大的工作,工作人员需要吸收客户的沮丧情绪,克制自己的情绪反应。生成式 AI 能充当智能助手,输入客户聊天记录,实时提供移情反应和问题解决建议。生成式 AI 减少了客户希望将问题反馈到主管的可能性。这只是一项初步研究结果,还无法就此得出明确结论。
META 披露了最新季度财报,收入 286 亿美元,比上年同期增长 3%,此前它连续三个季度收入下降。CEO 扎克伯格告诉投资者,“我们正在探索 WhatsApp 和 Messenger 的聊天体验,Facebook 和 Instagram 帖子和广告的视觉创作工具,随着时间的推移,视频和多模态体验也在探索。”ChatGPT 的空前成功使生成式人工智能成为当今的技术趋势,大小企业都在竞相打造应用。虽然 Meta 在今年早些时候向研究人员发布了人工智能语言模型 LLaMA,但它还没有以一种可广泛使用的方式推出类似于 ChatGPT 的东西。扎克伯格表示,由于商业模式不同,预计 Meta 将采用比谷歌、微软和亚马逊等公司更开源的方法介入生成式人工智能。他表示将在未来几个月内发布生成式人工智能产品。他说,生成式人工智能“实际上将触及我们的每一个产品”。
通用汽车旗下的自动驾驶子公司 Cruise 透露开始在旧金山全天提供无人出租车服务,并计划其业务未来扩大到更多城市,其中之一可能是达拉斯。Cruise 于 2013 年成立,总部位于旧金山,今年 2 月公司总裁、CEO 兼联合创始人 Kyle Vogt 表示,其无人出租车无人驾驶的行驶里程超过百万英里。旧金山多山,地形复杂,是无人出租车的理想试验场。
被用于在网站上抓取图像构建用于训练 AI 模型的数据集的下载工具引发了争议。网站抱怨抓取工具不遵守他们在 robots.txt 中列举的要求,而抓取工具 img2dataset 的作者 Romain Beaumont 则宣称所有人能在未来受益于 AI。他要求不想被抓取图像的网站主动在 HTTP 头文件中添加 X-Robots-Tag: noai 和 X-Robots-Tag: noindex 等标记,否则他的工具将会不管不顾的抓取图像。他说,一部分人不理解 AI 和开放 AI 的潜力,还因此决定与之对抗。
美国众议院开始在内部试用 OpenAI 的聊天机器人 ChatGPT。众议院最近成立了一个 AI 工作组,在国会办公环境中测试和分享 AI 工具。众议院数字服务部门从 OpenAI 获得了 40 个 ChatGPT Plus 的许可证,以先到先得的原则提供给各个国会办公室。数字服务部将无限期支付每月 20 美元的订阅费用。工作人员不建议使用国会数据或敏感内部信息查询 ChatGPT。
OpenAI 宣布了允许 ChatGPT 用户更好的控制其数据的新政策:用户可以关闭聊天记录,可以选择退出将聊天记录用作 AI 训练数据,以及可以导出聊天历史。这些新的控制选项可以在设置中找到。在永久删除前 OpenAI 将保留聊天记录 30 天时间,该公司表示需要用于监控滥用。此前 ChatGPT 用户的聊天记录会被用于微调 AI 模型,用户可以定期清除聊天记录,但数据仍然会被用于微调。这对企业而言是一个严重的隐私问题,因为员工可能会输入敏感数据。
知乎发表了一份声明,将对 AI 生成内容设限。声明称,“创作者在发布包含 AIGC 生成的内容时,应主动使用「 包含 AI 辅助创作」的标签进行声明,帮助读者进行区分。对发布时未主动声明的内容,平台将采取适当措施进行流通限制并添加相关标识,以提醒读者该内容是由 AI 生成的。在 AIGC 内容集中出现的场景,为保障用户消费体验,平台将对由 AI 生成的内容进行展示干预...创作者应当对其发布的 AIGC 类内容的真实性、准确性负责...打击批量发布 AIGC 类内容的帐号...”
AI 创业公司 OpenAI 向美国专利商标局(USPTO)申请了 GPT 商标。GPT 代表 Generative pre-trained transformers,是一种深度神经网络架构,基于 Google 研究人员释出的深度学习架构 Transformers。OpenAI 申请的是商标,而不是版权,它没有限制其他人构建类似 GPT 的 Transformers 模型,但禁止这些人将其模型称为 GPT 5 或后缀为 GPT 之类的名字。
在德国汉堡郊区的一栋房子前,邮箱上涂了一个单词 LAION。LAION 代表 Large-scale AI Open Network,是高中教师 Christoph Schuhmann 的一个业余爱好项目。他在业余时间和一群志愿者建立了世界上最大的开源 AI 数据集。该数据集被 Google Imagen 和 Stable Diffusion 等用于训练文本图像模型。Schuhmann 常去 Discord 上的一个 AI 狂热者聚集的群组,当时 OpenAI 的第一代 DALL-E 模型刚刚发布,他既受鼓舞也感到担忧,担心这可能会鼓励科技巨头不开放数据。他和该群组的成员因此创建了一个开源数据集帮助训练文本图像模型 diffusion。仅仅三个月时间,他们发布了一个包含 4 亿对图像及其文字描述的数据集。今天这个数字超过了 50 亿,是世界最大的免费图像和文字描述数据集。当 Emad Mostaque 在 2022 年创建 Stability AI 时,他使用 LAION 训练了模型 Stable Diffusion,还雇佣了两位该组织的研究人员。一年之后,该公司的估值接近 40 亿美元,很大程度上要感谢 LAION 提供的数据。 Schuhmann 没有从中获得任何收入,他也没有兴趣这么做,他想要保持独立。
计算机科学家 Jaron Lanier 在《纽约客》发表文章《There Is No AI》,提出应停止对人工智能的神化,而将其作为一种创新的社会协作形式来看待。他反对最近呼吁停止训练更高级人工智能的联署信,并再次提出“数据尊严”概念:结束人工智能黑箱,记录比特的来源,“人们可以为他们创造的东西获得报酬,即使这些东西是通过大模型过滤和重新组合的”,“当一个大模型提供有价值的输出时,数据尊严的方法将追踪最独特和有影响力的贡献者。”
盖茨(Bill Gates)预言 AI 聊天机器人能在 18 个月内教儿童如何阅读和磨练写作技能。对计算机而言,教学生如何写作是一项十分困难的工作。教师对学生的作文会从叙事结构和清晰度等方面进行反馈,这是一项高级认知的任务,很难在代码中实现。但 AI 聊天机器人改变了这一切。盖茨相信随着 AI 聊天机器人技术的进步,它将能成为学生的私人辅导老师,而大部分学生是请不起家教的,因为家庭教师对他们而言太昂贵了。
在 Reddit 之后,编程问答社区 Stack Overflow 也将对科技巨头们使用其数据训练 AI 收费。和 Reddit 类似,Stack Overflow 也有着高质量的问答语料库,它有 2000 万注册用户,5000 万问题和答案。Stack Overflow 的内容所有权属于原作者,采用了 CC BY-SA 授权,也就是使用时要求署名。CEO Prashanth Chandrasekar 称,使用该平台数据集训练大语言模型的公司违反了该许可证,在将模型出售给客户时无法为每一个问题和答案归属,违反了 CC 许可证。无论是 Stack Overflow 或 Reddit 都没有公布收费价格。也许 Twitter 的定价可以作为参考:每月 4.2 万美元。
美国国土安全部将成立一个特别工作组研究如何使用 AI。国土安全部部长 Alejandro Mayorkas 介绍了如何使用 AI 优化该部门的工作,其一在其系统中部署 AI 帮助筛选出使用强迫劳动生产的产品,其二是使用 AI 更好的检测出运到美国的芬太尼,识别和阻止生产该毒品的前体化学品的流动。美国国防部也在加强 AI 的使用,它雇佣了 Google AI 云端服务的前总监,担任首位 AI、机器人、云计算和数据分析顾问。
加拿大魁北克大学的研究人员在预印本网站 arXiv 上发表论文,分析了 ChatGPT 所生成代码的安全性。研究人员表示结果令他们倍感担忧。ChatGPT 生成的部分代码甚至达不到最低安全标志,而当你问它时它还知道代码是不安全的。研究人员让 ChatGPT 使用 C、C++、Python 和 Java 四种语言生成了 21 个程序和脚本。研究人员称,ChatGPT 似乎知道它生成的代码是不安全的,但就是不说,除非你问它。ChatGPT 拒绝生成攻击性代码,但却会生成有漏洞的代码,这在道德上是不一致的。
过去九年,27 岁的肯尼亚人 Collins 靠给美国大学生当论文枪手谋生。他撰写的论文主题包括了心理学、社会学和经济学。他偶尔还被允许直接访问大学网站入口,递交测试和作业,参与小组讨论,使用学生身份与教授交谈。2022 年他每月的收入在 900-1200 美元。如今他的月收入降至了 500–800 美元。他认为原因是生成式 AI 如 ChatGPT 的流行。去年的这个时间他能收到 50-70 份作业,作业比较短通常只需要 150 个字;如今他只收到 30-40 份作业。在线学习平台 Study 在今年 1 月的调查发现,逾 89% 的学生表示曾用 ChatGPT 帮助完成家庭作业。近半数人承认用 ChatGPT 完成家庭测试或测验,53% 的人用它写论文,22% 写论文大纲。Collins 担心 AI 的崛起会大幅降低学生对他们这些枪手的依赖,他自己也同时也用 ChatGPT 去生成以前外包给其他枪手的内容。
分析师估计基于 GPT-3 的 AI 聊天机器人 ChatGPT 的每日运营成本超过 70 万美元,OpenAI 的最新模型 GPT-4 的运营成本会更高。训练 ChatGPT 之类的大语言模型可能需要花费数千万美元,但运营费用或推理成本将会远远超过训练成本。一家利用 AI 开发生成式文字游戏的创业公司 Latitude 透露, 运行 OpenAI 的语言模型加上 AWS 费用,每月花掉了 20 万美元。CEO Nick Walton 开玩笑的说他们公司有人类员工和 AI 员工,每个人的费用都差不多。为了降低生成式 AI 模型的运营成本,微软正在开发名为雅典娜(Athena)的 AI芯片,有逾 300 名员工参与该项目,最早可能在明年发布。
Google 重组了旗下的 AI 研究部门,将 Google 研究院的 Google Brain 团队与英国的 DeepMind 团队合并统一为 Google DeepMind。Google 在 AI 研究领域一直走在世界前列,但产品化严重滞后,将事实上的领先优势拱手让给了竞争对手。新成立的 Google DeepMind 将与 Google 的其它产品和服务紧密合作,它还将成为一个科学委员会,由 DeepMind 研究副总裁 Koray Kavukcuoglu 领导,将监督该部门的研究进展和方向。Google 研究院产品副总裁 Eli Collins 将加入 Google DeepMind 担任产品副总裁,原 Google Brain 负责人 Zoubin Ghahramani 将成为研究领导团队成员,向 Kavukcuoglu 汇报。
OpenAI 的 ChatGPT 和 Google 的 Bard 都将 Reddit 作为其训练语料的来源。Reddit 是 BBS 论坛风格的社交新闻和聚合讨论网站,包含了大量主题事无巨细的文字讨论。截至 2023 年 2 月其访问量排在全球第十位,在美国排在第六位。Reddit 联合创始人兼 CEO Steve Huffman 称该平台的语料库非常有价值,他们不再想将其免费提供给科技巨头。Reddit 修改了 API 访问政策,它的 API 对开发机器人程序等工具的独立开发者,以及学术和非盈利项目的研究员仍然是免费的,但对通过 API 使用其语料库训练 AI 将要开始收费,具体金额将在未来几周公布。免费 API 访问也将限制速率。