DeepSeek目前共有20多个版本,主要分为三大类:核心版本系列(如V2、V3、R1等)、参数规模变体(如全量版、蒸馏版、量化版)以及功能特化版(如Coder、Math、VL等)。 这些版本覆盖了从基础文本处理到复杂推理、多模态交互的全场景需求,用户可根据算力资源、任务类型和部署成本灵活选择。
-
核心版本系列
- V系列:包括V1(2024年1月发布)、V2(2024年上半年)、V2.5(2024年9月升级联网搜索与数学能力)、V3(2024年12月发布,671B参数混合专家架构)。
- R系列:主打推理优化,如R1(2025年1月发布,对标OpenAI o1)及其子版本R1-Zero(纯强化学习训练)。
-
参数规模变体
- 全量版:如V3或R1的671B参数版本,性能最优但需高算力支持。
- 蒸馏版:参数压缩至1.5B-70B,适合边缘设备部署。
- 量化版:通过降低精度(如INT4)减少资源占用,牺牲部分精度换取效率。
-
功能特化版
- DeepSeek Coder:专为代码生成优化,支持338种编程语言。
- DeepSeek Math:强化数学推导能力。
- 多模态版(VL):支持图像与文本联合任务。