DeepSeek(深度求索)成立于2023年7月17日,由中国量化投资巨头幻方量化孵化,专注于大语言模型(LLM)研发。关键亮点包括:依托万张A100芯片算力、2年内推出多款开源高性能模型、2025年以R1模型引爆全球AI市场,成为首个登顶140国应用商店的中国AI产品。
-
初创与技术奠基(2023年)
公司注册于杭州,创始团队来自浙江大学等高校,初期依托幻方量化的“萤火超算”资源(万张A100 GPU)。同年11月发布首个开源模型DeepSeek Coder,支持多语言编程,性能超越CodeLlama,奠定技术口碑。 -
架构突破与生态扩张(2024年)
2024年5月推出MoE架构的DeepSeek-V2,性能对标GPT-4 Turbo,成本仅1%;12月发布V3模型,训练成本550万美元(行业1/10),开源后评测成绩超越Meta LLaMA 3.1。同年与华为昇腾、国家超算平台合作,推动国产算力适配。 -
全球爆发与商业化(2025年)
2025年1月发布的DeepSeek-R1以开源推理模型震撼硅谷,数学能力比肩OpenAI o1,训练成本560万美元(美国同类1/30)。2月用户破1.1亿,接入200+企业,引发英伟达股价暴跌,成为中美AI竞赛标志性事件。
提示:DeepSeek以“技术普惠”为核心,通过开源与低成本策略快速崛起,未来或进一步挑战闭源生态垄断。