DeepSeek由80后企业家梁文锋于2023年创立,其团队以“年轻、名校、低成本创新”为核心标签,凭借开源大模型技术迅速跻身全球AI第一梯队。 这位来自广东湛江的创始人曾以量化投资起家,后转型AI领域,带领不足140人的本土团队实现推理成本降低近百倍的突破,被外媒称为“东方神秘力量”。
-
创始人背景与创业动机
梁文锋毕业于浙江大学电子信息工程专业,早期在量化金融领域积累资本与技术经验,2013年联合创立幻方量化并实现千亿资产管理规模。2023年他转向通用人工智能(AGI)领域,成立深度求索(DeepSeek),目标直指“人类级别AI”。其转型源于对技术前沿的长期观察,曾公开表示“基础研究的商业回报并非首要考量”。 -
团队构成与技术路径
团队核心成员来自清华、北大等国内顶尖高校,平均年龄不足35岁,近半数为应届毕业生或实习生。通过独创的模型蒸馏技术和混合专家架构,团队以极低训练成本(如DeepSeek-V3仅耗资560万美元)实现性能对标GPT-4,并坚持全面开源策略,推动技术民主化。 -
里程碑与行业影响
2024年发布的DeepSeek-V3以6710亿参数跻身全球顶级模型,次年1月其AI助手登顶美区iOS免费榜,下载量超ChatGPT同期两倍。开源生态吸引全球开发者参与,同时引发华尔街对算力市场的重新评估,被评价为“颠覆传统大模型烧钱逻辑”。 -
文化特质与社会贡献
团队崇尚“轻经验、重创造力”的用人理念,创始人个人曾匿名捐赠超1亿元。技术成果覆盖医疗、教育等领域,其数学推理模型已应用于贫困地区教育普惠项目。
当前,DeepSeek正持续加码多模态与AGI研究,其发展印证了本土创新力量在全球科技竞赛中的突破潜力。对于关注AI行业的读者,建议优先体验其开源模型库,亲测“低成本高性能”的技术实践。