DeepSeek的发布时间节点展现了其快速迭代的技术突破与全球影响力,核心里程碑包括:2023年11月首推代码模型、2024年12月开源V3引爆学术圈、2025年1月R1发布后席卷多国应用市场,以及2025年3月R2提前发布引发行业震动。
-
早期探索与技术奠基(2023年)
2023年7月公司成立后,11月迅速推出首个开源代码模型DeepSeek-Coder,支持多语言编程任务,奠定技术普惠基调。同年11月29日发布670亿参数的通用大模型DeepSeek-LLM,性能超越Llama2 70B,标志其在基础模型领域的竞争力。 -
架构创新与开源爆发(2024年)
2024年5月推出MoE架构的DeepSeek-V2,成本仅为GPT-4的1%,获称“AI届拼多多”;12月26日开源6710亿参数的V3模型,仅用2048块H800 GPU训练55天,以557万美元低成本实现性能比肩GPT-4o,推动全球学术与工业界采用。 -
现象级破圈与市场颠覆(2025年1月)
2025年1月20日发布的R1模型凭借“成本10%、性能对标GPT-4”标签,7天内用户破亿,登顶中美等15国应用商店榜首。1月27日美股AI概念股暴跌与中概股逆涨,印证其行业冲击力。同期APP周下载量环比激增2700%,日活用户突破3000万。 -
持续进化与生态扩展(2025年至今)
原定5月发布的R2模型提前至3月,强化编程与多语言能力,传闻成本再降70%-97.3%。V4模型研发同步推进,聚焦AGI长期目标。开源周活动与技术融合案例(如车企、政务)加速生态落地。
DeepSeek的每个关键节点都精准踩中技术需求与市场空白,其开源策略与成本优势持续重塑AI行业格局。未来版本迭代与全球化布局值得持续关注。