奇客Solidot | 澳大利亚政府研究发现 AI 在概述上的表现比人类差

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 7070 次

澳大利亚政府研究发现 AI 在概述上的表现比人类差

Wilson (42865)发表于 2024年09月06日 00时38分星期五

来自方舟

大模型能比人类更快的概述一篇长文，因此很多用户和企业尝试用它去概述冗长的文档以方便阅读。澳大利亚证券和投资委员会(ASIC)对此展开了研究，他们测试了开源大模型 Llama2-70B，发现它提供的概述相比人类提供的差很多。Llama2-70B 不是目前最先进的大模型，这一结果不太能够推广到最先进大模型的概述能力。尽管如此，研究表明，大型组织在将大模型的输出集成到现有工作流前需要三思。ASIC 发现，大模型生成的概述太笼统，还常常包含不正确的信息，语法正确，但幻觉无法避免。对比测试发现，AI 的平均得分为 7/15，而人类是 12.2/15。

https://arstechnica.com/ai/2024/09/australian-government-trial-finds-ai-is-much-worse-than-humans-at-summarizing/

所谓科学的论辩，从总体上来说则是没有多大效果的，更不用说论辩几乎总是各持己见的这个事实。——弗洛伊德

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn