奇客Solidot | 压缩算法为大模型“瘦身”

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 6177 次

压缩算法为大模型“瘦身”

Wilson (42865)发表于 2024年11月22日 22时26分星期五

来自人猿泰山之英雄归来

普林斯顿大学和斯坦福大学团队开发出一种新压缩算法 CALDERA，能精简大模型（LLM）的海量数据，为 LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本，还能推动 LLM 在手机和笔记本电脑上高效使用。团队举例称，当人们使用 ChatGP T时，请求会被发送到 OpenAI 公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大，通常还很慢。如果用户想要使用消费级图形处理单元运行 LLM，就需要对这些 LLM 进行压缩。 CALDERA 算法通过减少 LLM 冗余并降低信息层的精度来发挥作用。“瘦身”后的 LLM 更加精简，可在手机或笔记本电脑等设备上存储和访问，同时提供了与未压缩版本几乎一样准确而微妙的性能。虽然 CALDERA 并非首个压缩LLM的算法，但其独特之处在于兼具“低精度”和“低排序”两种特性。其中，“低精度”减少了比特数，加快了数据存储和处理速度。而“低排序”则降低了 LLM 数据中的冗余。

https://github.com/pilancilab/caldera
https://news.sciencenet.cn/htmlnews/2024/11/534486.shtm

所谓爱国心，是指你既生为这个国家的国民，对于这个国家，当比对其他一切的国家信仰得高贵优越。--萧伯纳

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn