DeepSeek于2023年7月17日正式成立并发布首个模型,后续持续迭代发布多款创新产品,其中DeepSeek-V3于2024年12月26日发布,DeepSeek-R1于2025年1月20日发布,Prover-V2-671B于2025年4月30日发布。
DeepSeek由杭州深度求索人工智能基础技术研究有限公司开发,该公司成立于2023年7月17日,依托幻方量化的资源支持,专注于大语言模型(LLM)及AI技术的研发。成立当月,DeepSeek便发布了首个670亿参数的大语言模型DeepSeek LLM,凭借2万亿token的训练数据和中英双语能力迅速崭露头角。2024年5月,DeepSeek推出MoE架构的DeepSeek V2,以低价高性能对比GPT-4 Turbo引发关注,同期还发布了垂直领域模型如DeepSeek-Coder和DeepSeekMath。同年12月,DeepSeek发布DeepSeek-V3,进一步提升数学推理与多模态能力,生成速度达60TPS,性能对标OpenAI旗舰模型。
2025年,DeepSeek加速创新:1月20日发布DeepSeek-R1,强化推理能力并在全球AI性能排名中位居前三;4月24日发布DeepSeek-VL2提升视觉语言任务表现;4月30日,DeepSeek推出Prover-V2-671B,专为数学定理证明领域设计,参数量升级至6710亿,性能显著提升。
DeepSeek以开源策略和普惠技术路线打破传统大模型发展壁垒,通过轻量化和本地化部署赋能多行业,被广泛应用于汽车、手机、政务等领域,并逐步在全球AI竞争中占据关键地位。