中国算力芯片正快速崛起,国产阵营覆盖云端训练、推理及边缘终端场景,寒武纪、华为昇腾、海光信息、壁仞科技等企业形成多层次布局,部分产品在算力、能效、生态兼容性方面实现突破。
中国算力芯片主要分为云端、边缘和终端三大方向,云端以AI训练和推理为主,边缘及终端侧重实时推理。寒武纪推出思元290(云端训练,512TOPS INT8)、思元370(训推一体,256TOPS INT8)等芯片,7nm制程与chiplet技术强化性能;华为昇腾的910B芯片对标英伟达A100,FP32/FP16算力与兼容性突出;海光信息的深算一号DCU基于“类CUDA”生态,实现A100约90%的FP16算力,并广泛应用于互联网行业。壁仞科技的BR100以1000+TFLOPS 16位浮点算力冲击高端市场,天数智芯的Big Island芯片则以295TOPS INT8算力填补训推空白。
技术路径上,国产芯片通过CUDA兼容(如海光DCU的HIP编译器、华为CANN的API桥接)加速生态适配,同时发力原生创新(如华为MindSpore端云协同、摩尔线程MUSA的异构融合),在金融、能源等领域渗透率提升。政策与资本的双重驱动下,国家大基金与地方政府投入超2000亿元,推动“东数西算”工程中算力国产化占比超50%,行业应用从安防、智能驾驶向大模型训练延伸。
性能差距与生态壁垒仍存:英伟达H100的FP8精度算力领先国产20%,开发者工具链完整性不足。未来需突破类脑计算、存算一体架构,强化跨框架生态融合。国产算力芯片已从单一产品竞争转向全栈解决方案,机遇与挑战并存。