DeepSeek由杭州深度求索人工智能基础技术研究有限公司提出,该公司由梁文锋于2023年7月创立,其核心目标是通过技术创新大幅降低AI模型研发成本并提升性能,代表性成果如DeepSeek-R1以低至行业平均1/10的成本实现了对标GPT - 4o的性能。
DeepSeek创始人梁文锋的经历奠定了公司技术路径的独特性。他1985年出生于广东湛江,2002年以高考状元身份考入浙江大学电子信息工程专业,2010年在信息与通信工程硕士毕业后投身量化投资领域。凭借对AI技术的长期关注,他在2021年幻方量化管理规模突破千亿后,于2023年7月创立DeepSeek,专注通用人工智能(AGI)研发。
DeepSeek的核心竞争力源于技术突破与资源整合能力。其团队以本土工程师为主,采用MoE混合专家架构模型,并通过优化训练数据效率降低成本。例如,DeepSeek-V3在仅2048张H800 GPU的算力支持下,耗时两个月、花费557.6万美元完成训练,参数规模达671B且激活37B,性能逼近GPT - 4o的顶级闭源模型。其开源模型DeepSeek-R1更以行业1%的成本实现与OpenAI o1相似的效果,生成速度达60 TPS(V2.5的3倍),被业界称为“AI界的拼多多”。
DeepSeek的技术路线凸显低成本与高效能的结合。从2023年11月发布首个代码生成模型DeepSeek Coder,到2024年5月推出混合专家架构DeepSeek - V2,再到后续版本持续升级推理能力与联网搜索功能,最终在2025年1月发布的DeepSeek - R1达到行业标杆水平。其定价策略同样激进,API调用成本仅为GPT - 4 Turbo的百分之一,显著降低了企业客户使用门槛。
作为中国AI领域的重要参与者,DeepSeek通过本土化创新与开源战略重塑了行业竞争格局。其发展历程表明,通过算法优化、算力资源的有效配置以及专注垂直领域需求,后发企业具备挑战传统巨头的潜力,为中国AI产业在全球范围内争取了更多话语权。