DeepSeek是一家成立于2023年7月17日的人工智能公司,凭借开源大模型技术迅速崛起,仅用不到两年时间便推出多款性能媲美GPT-4的尖端产品,其核心模型DeepSeek-V3以极低成本实现行业领先水平。
-
初创与早期发展(2023年)
- 公司成立后,同年11月发布首个开源代码模型DeepSeek Coder,支持多语言编程任务;月底推出670亿参数的通用大模型DeepSeek LLM,奠定技术基础。
-
技术爆发期(2024年)
- 1月推出专精代码生成的DeepSeek-Coder,5月发布混合专家模型DeepSeek-V2,推理成本降至百万token/1元人民币;12月推出6710亿参数的DeepSeek-V3,训练成本仅557.6万美元,性能比肩国际顶尖模型。
-
成熟与开源生态(2025年)
- 1月发布推理模型DeepSeek-R1,完全开源且性能对标OpenAI O1,标志其技术进入稳定输出阶段,形成覆盖编程、数学、视觉等多领域的AI产品矩阵。
DeepSeek的快速发展印证了开源AI的潜力,其高效研发模式为行业树立了新标杆。