奇客Solidot | AI 只能完成高等数学新测试问题的不到 2%

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 6014 次

AI 只能完成高等数学新测试问题的不到 2%

Wilson (42865)发表于 2024年11月14日 22时44分星期四

来自十二魔

基于大模型的 AI 系统如 GPT-4 和 Gemini 1.5 Pro 能以九成以上的正确率完成传统数学测试问题。但如果设计出一种全新的、大模型不可能训练过的数学难题呢？包括菲尔兹奖得主陶哲轩和 Timothy Gowers 在内的 60 多名数学家合作编写了数百道原创研究级数学难题，推出了新的高等数学基准测试 FrontierMath。这些问题非常具有挑战性，陶哲轩称需要相关领域研究生级别的专业人士合作才能完成。问题被设计为防猜测，如果没有正确的数学推理能力，它们是不可能解出的。顶级的 AI 系统只能完成不到 2% 的 FrontierMath 问题，显示它们的推理能力有局限性。

https://venturebeat.com/ai/ais-math-problem-frontiermath-benchmark-shows-how-far-technology-still-has-to-go/
https://epochai.org/frontiermath

世间最庄严的问题是：我能做什么好事？

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn