华为盘古大模型首次发布于2021年4月,历经多次迭代升级,最新5.0版本于2024年6月正式推出,重点提升多模态能力和行业应用深度,适配多样化业务场景并全面领跑中国市场。
华为盘古大模型于2021年4月首次发布,包含NLP、CV及科学计算三大基础模型,标志着华为在AI大模型领域的正式布局。该版本通过40TB文本数据训练,推出时即以千亿参数规模实现中文预训练大模型的性能突破,并在CLUE打榜中取得领先地位。2023年7月,华为发布面向行业的盘古大模型3.0,首次明确“为行业而生”的定位,推出L0-L2三层架构,覆盖基础模型、行业模型及细化场景模型,重点服务于政务、金融、制造等领域。2024年6月,华为开发者大会HDC 2024上,盘古大模型5.0亮相,新增全系列模型覆盖(从10亿到1.2万亿参数)、多模态能力升级(STCG时空生成技术)及强思维特性(数学推理与任务规划能力),并在30多个行业的400余场景落地,涵盖自动驾驶、建筑设计、医药研发等,成为行业大模型领域的领导者。
此次升级中,盘古大模型5.0通过分级部署与多模态能力扩展,显著提升了工业场景的实用性,如钢铁行业中宝钢利用其将合金研发周期压缩75%、成本降低12%;高速铁路领域通过智能巡检机器人提升故障识别准确率。其技术核心在于结合昇腾AI算力底座与MindSpore框架,实现从训练到推理的全栈自主优化。盘古大模型与鸿蒙生态(HarmonyOS NEXT)、麒麟芯片等华为技术体系的协同效应,进一步强化其在国产化算力体系中的战略地位,助力千行百业智能化转型。