截至2025年5月1日,DeepSeek的最新版本为V3-0324,于2025年3月24日发布。此次更新聚焦编程能力突破、数学推理优化及用户体验提升,参数规模小幅增至6850亿,并采用更宽松的MIT开源协议。新版本在生成复杂代码、多轮对话理解等场景表现接近行业顶尖模型Claude 3.7,同时支持4比特量化技术,降低本地部署门槛。
-
核心升级亮点
- 编程能力:前端代码生成效率显著提升,可快速完成动态电商网站等复杂任务,多语言编程基准得分达55%。
- 数学与逻辑:优化了数学题解答准确性,在AIME等竞赛题库测试中接近Claude 3.7水平。
- 架构效率:引入多头潜在注意力(MLA)和多Token预测(MTP)技术,生成速度提升80%,4比特量化后模型体积压缩至352GB。
-
用户体验改进
默认关闭“深度思考”模式以加速响应,多轮对话的意图捕捉更精准,知识库更新至2024年7月。Function Calling功能稳定性增强,API接口适配性优化。 -
开源与商业化
采用MIT许可协议,允许免费商用;通过动态GPU资源调度和错峰折扣策略,夜间API价格降至50%,兼顾成本与性能平衡。
此次更新被视为DeepSeek-R2推理模型的前奏,未来版本或进一步强化多语言与复杂任务处理能力。开发者可优先体验其开源版本或通过官方App直接调用新模型。