奇客Solidot | LLaMA 在 CPU 上的运行速度显著改进

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 4423 次

LLaMA 在 CPU 上的运行速度显著改进

Wilson (42865)发表于 2024年04月01日 15时21分星期一

来自记忆残留

大模型如 LLaMA 通常需要高端 GPU 才能流畅运行。Mozilla 支持的 llamafile 项目旨在本地运行大模型。开发者刚刚为 llamafile 编写了 84 个新的矩阵乘法内核，显著改进了 CPU 运行性能，让普通 CPU 流畅运行大模型成为可能。ARMv8.2+（如 Raspberry Pi 5）、英特尔 CPU 以及支持 AVX512 指令集的 AMD Zen 4 CPU 上的运行速度增幅最为突出。

https://justine.lol/matmul/

任何人均有其价值

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn