DeepSeek的研发团队是中国AI领域的顶尖力量,以年轻化、高学历、本土化为核心特征,凭借高效协作与技术创新,在低成本训练和开源模型领域实现全球突破。 团队成员平均年龄仅28岁,90后占比超75%,95后达50%以上,85%拥有硕士及以上学历,40%为博士,几乎全部毕业于清华、北大、浙大等国内顶尖高校。团队规模不足140人,却主导研发了DeepSeek-V2、DeepSeek-Math等里程碑式模型,其MLA架构和GRPO算法将训练成本降至行业1/10,例如DeepSeek-V3仅耗资557.6万美元,性能对标GPT-4 Turbo。
-
创始人梁文锋的跨界领导力:作为幻方量化创始人,梁文锋从金融领域转向AGI研发,秉持“看能力不看经验”的招聘原则,吸引大批应届高潜人才。他本人深度参与技术研发,日常读论文、写代码,推动团队以开源策略挑战闭源巨头。
-
年轻学霸的极致创新:团队核心成员如北大博士朱琪豪(主导DeepSeek-Coder)、清华博士邵智宏(参与Math/V3研发)等,均在顶会发表多篇论文。扁平化管理激发创造力,例如95后“AI才女”罗福莉在MoE架构中贡献关键思路,拒绝千万年薪坚守团队。
-
本土化技术突围:团队海归比例不足5%,却通过自主创新打破算力壁垒。例如潘梓正放弃英伟达offer回国,主导多模态模型研发;赵成钢搭建的高效训练架构,用600万美元预算实现GPT-4级性能。
-
工程师文化驱动AGI使命:团队拒绝短期商业化,专注通用人工智能。成员多为“技术理想主义者”,例如梁文锋强调“工程师而非商人”定位,将幻方量化的算力资源(万张A100显卡)投入基础研究。
DeepSeek的成功证明,中国本土培养的年轻科学家能以原创架构和极致效率重塑AI竞争格局。这支团队的故事,仍在加速书写中。