DeepSeek主要使用的算力芯片是华为升腾芯片,其适配的升腾910B在性能与成本等多方面表现出色,为模型运行提供了有力支持。
DeepSeek在算力芯片的选择上有涉及不同的产品。最初报道称DeepSeek部分服务如R1/V3推理服务是基于华为升腾AI芯片运行,使用的是升腾910B3芯片,该芯片在适配后提升了模型推理效率并降低了部署成本。昇腾910B集群在FP16精度下算力达512 PetaFLOPS,芯片利用率高达82%,性能接近英伟达A100的91% ,还让国产芯片首次承载万亿参数模型,其计算密度逼近英伟达A100且后续的910C进一步缩小差距,开源的FP8 GEMM加速库能让国产芯片原生运行FP8模型。
不过,此前也有报道称DeepSeek使用大约2000个英伟达的H800芯片进行训练,还有拥有约5万个H100芯片。并且DeepSeek需要的芯片数量规模较大,例如有提到其使用情况涉及到5万个H100芯片。不过随着后续发展,华为升腾芯片在其体系中发挥了重要作用并成为重要的算力支撑。
总体而言,DeepSeek在算力芯片的选用上,前期有英伟达相关芯片,但在发展过程中,华为升腾芯片逐渐占据重要地位,为DeepSeek的模型运行等提供了关键的算力保障。