DeepSeek背后的核心团队以年轻本土人才为主,创始人梁文锋来自浙江大学,团队成员多毕业于清华、北大等国内高校,平均年龄28岁,核心技术岗位偏向应届生,依靠创新算法实现高性价比大模型。
DeepSeek团队的核心人物包括创始人梁文锋,他曾在浙江大学攻读信息与通信工程硕士,后创立幻方量化并进军AI领域,主导推出DeepSeek-V2、V3等低成本模型。团队中的高华佐和曾旺丁分别在北大物理系和北邮人工智能学院完成学业,在MLA架构创新中发挥关键作用。清华大学博士生邵智宏主导了DeepSeek-Math、DeepSeek-Coder-v2等项目,并参与GRPO算法研发,该算法显著降低了训练成本。朱琪豪作为北大计算机博士,基于其深度代码学习研究领导开发了DeepSeek-Coder-V1,代达劢则从V1到V3持续参与模型迭代,赵成钢以其在超算领域的经验负责基础架构,而北航博士吴俣则优化了训练与推理效率。
团队平均年龄28岁,海归比例不足5%,绝大多数成员来自国内顶尖高校,具备交叉学科背景。相比国际同行,DeepSeek更注重基础能力与创造力的匹配,而非经验年限。其低成本大模型通过算法创新与本土化人才策略实现高效开发,例如V2模型的推理成本仅为国际竞品的1/70。这一团队不仅推动了AI技术的普惠化,也体现了中国本土AI人才培养的潜力。
作为中国大模型领域的新兴力量,DeepSeek凭借独特的团队构成与技术路径,正逐步改变行业格局,其发展模式或将成为本土AI企业的重要参考。