DeepSeek(深度求索)成立于2023年7月17日,是中国AI领域迅速崛起的明星企业,2024年1月发布首个大模型DeepSeek LLM,2025年1月20日推出性能比肩OpenAI O1的DeepSeek-R1,并凭借开源策略和超高性价比成为全球AI市场的焦点。
-
成立与早期发展(2023年)
由幻方量化创立,专注于大语言模型研发,初期依托万张A100 GPU算力资源,奠定技术基础。 -
技术突破与开源(2024年)
- 1月:发布670亿参数的DeepSeek LLM,中英文训练数据达2万亿token。
- 5月:开源第二代MoE模型DeepSeek-V2,性能对标GPT-4 Turbo,成本仅1%。
- 12月:推出DeepSeek-V3,推理速度提升3倍,训练成本仅550万美元。
-
全球爆火(2025年)
- 1月20日:DeepSeek-R1发布,登顶多国应用商店榜首,引发“DeepSeek时刻”热潮。
- 4月30日:推出数学专用模型Prover-V2-671B,进一步拓展垂直领域。
- 5月(预计):R2版本将支持文生视频等多模态能力,持续推动技术边界。
DeepSeek的快速迭代印证了中国AI的创新力,未来或进一步重塑全球AI格局。建议关注其官网或官方动态,获取最新进展。