solidot新版网站常见问题,请点击这里查看。

DeepSeek 的 R2 模型因华为芯片问题推迟发布

人工智能
Edwards (42866)发表于 2025年08月14日 21时02分 星期四

来自迷失的世界
金融时报报道,杭州深度探索公司 DeepSeek 在使用华为芯片训练新模型 R2 失败后,已推迟该模型的发布。DeepSeek 在今年 1 月释出了引发广泛关注的 R1 模型,之后它开始了 R2 模型的训练,在有关部门的鼓励下它使用了华为昇腾(Ascend)处理器而不是更成熟也更先进的英伟达 AI 芯片。但在使用昇腾芯片训练 R2 模型的过程中 DeepSeek 持续遭遇技术问题,因此转而使用英伟达芯片训练,使用华为芯片推理。


FT:DeepSeek新模型因华为芯片问题推迟发布