DeepSeek团队是一支由顶尖高校精英组成的年轻化AI研发团队,以高效低成本的模型架构和开源策略迅速崛起,成为全球AI领域的重要参与者。其核心成员多来自清华、北大等名校,创始人梁文锋作为幻方量化创始人转型AI的典型案例,带领团队在短短两年内实现技术突破,推出多项创新成果如MLA注意力机制和GRPO强化学习算法,并登上《新闻联播》展示国产AI实力。
-
团队背景与创始人
团队脱胎于知名量化投资机构幻方量化,创始人梁文锋凭借数学天赋和跨界经验,从千亿级资管领域转向AGI研发。成员平均年龄不足35岁,140人规模中90%为工程师,清北毕业生占比超60%,形成“高密度人才+扁平化管理”的特色。 -
技术突破与行业影响
独创的MoE架构模型训练成本仅为行业平均1/10,开源模型DeepSeek-V3性能比肩GPT-4o。关键创新如MLA注意力机制节省50%显存,GRPO算法放弃Critic模型设计,显著降低训练资源需求,被阿里Qwen等竞品采纳。 -
年轻化研发模式
采用“应届生主导+硬件协同”模式,核心成果多由在读博士或毕业1-2年的成员完成。例如北大博士生朱琪豪将博士论文成果转化为DeepSeek-Coder代码模型,清华超算冠军赵成钢优化万卡集群能效。 -
产品与生态布局
企业端提供金融、医疗等行业定制模型,消费端智能助手DeepSeek Chat登顶140国应用商店。通过开放MoE架构代码库和API平台,构建开发者生态,2025年计划推出“AI Agent应用商店”。
提示:该团队近期正拓展东南亚市场,技术白皮书与开源社区是了解其技术细节的一手渠道。