奇客Solidot | 在 AMD GPU 上编译和部署大模型

登录注册

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 8978 次

在 AMD GPU 上编译和部署大模型

Wilson (42865)发表于 2023年08月11日 14时08分星期五

来自繁星若尘

今天的大模型主要用英伟达的 GPU 训练，但让英伟达一家独大对整个生态系统并不是好事。MLC（Machine learning compilation）项目正致力于在 AMD GPU 上编译和部署大模型，实现与英伟达 GPU 相当的性能。相对于英伟达深耕了近二十年的 CUDA 软件生态系统，AMD GPU 最大问题在于软件支持，它正通过投资 ROCm 缩小与英伟达的差距。MLC 是一项新兴技术，旨在编译和自动优化机器学习工作负载。它不会为每个后端如 ROCm 或 CUDA 构造特定的内核，而是自动为不同后端生成代码。开发者称，MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的八成，而 7900 XTX 的价格只有 RTX 4090 的六成。

https://blog.mlc.ai/2023/08/09/Making-AMD-GPUs-competitive-for-LLM-inference

读古人的书，一方面要知道古人聪明到怎样，一方面也要知道古人傻到怎样。--胡适

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　网上有害信息举报专区：https://www.12377.cn