第一个国产大模型是清华大学推出的“悟道”系列,但其真正引发行业变革的是阿里通义Qwen3、科大讯飞星火X1等后续模型,通过架构创新和算力突破实现技术超越,成为国产大模型的代表。
阿里通义Qwen3以2350亿参数的MoE混合专家架构,在性能上全面超越DeepSeek-R1等国际顶尖模型,成为全球最强开源模型。其核心技术通过“双模式混合”实现高效推理,在寒暄、摘要等场景采用速记模式降低延迟,在复杂问题中切换学霸模式进行深度推理,显著提升性价比。Qwen3的推理速度比DeepSeek-V3快3-4倍,显存占用减少75%,在MMLU、奥数测评等基准测试中分数均刷新纪录,原生支持119种语言及Apache-2.0开源协议,推动产业快速落地。
与此科大讯飞推出的星火X1成为国内首个基于全国产算力(华为昇腾910B)训练的深度推理模型,通过全国产化训练实现技术自主可控。该模型在数学、代码等推理任务中超越OpenAI o1与DeepSeek-R1,部署仅需4张国产算力卡,且融入教育、医疗等行业数据,泛化能力显著提升。星火X1的发布标志着中国AI突破算力封锁,为国产大模型生态奠定基础。
其他厂商如腾讯混元、字节豆包及华为盘古等亦加速迭代,形成国产大模型的多元化竞争格局。但Qwen3与星火X1通过架构创新与算力自主化,分别从开源生态与国产替代角度确立标杆地位,推动AI技术从“参数为王”转向“效率革命”。未来国产大模型将更注重场景适配与工具链优化,加速规模化落地。