DeepSeek背后的公司是杭州深度求索人工智能基础技术研究有限公司,由量化投资巨头幻方量化于2023年7月创立,专注于大语言模型(LLM)研发,并以低成本、高性能的开源模型(如DeepSeek-V3、R1)迅速崛起,成为全球AI领域的重要参与者。
-
公司背景与创立
深度求索由幻方量化创始人梁文锋主导成立,依托母公司强大的算力资源(如万张A100显卡)和量化金融领域的技术积累,快速切入AGI赛道。公司成立仅半年便发布首个大模型DeepSeek LLM,后续迭代的V3和R1模型在数学、代码等任务上比肩OpenAI,但训练成本仅为后者的几十分之一。 -
技术突破与开源策略
公司以混合专家(MoE)架构和强化学习技术为核心,显著降低推理成本(如DeepSeek-V2的KV缓存减少93.3%),同时坚持开源路线,推动技术普惠。其模型已适配AMD、海光DCU等硬件,并登陆国家超算互联网平台。 -
市场影响与生态合作
DeepSeek应用曾登顶中美iOS免费榜,日活用户突破3000万,并与腾讯云、吉利汽车、三大运营商等达成深度合作。其API定价仅为GPT-4 Turbo的1%,进一步加速行业应用落地。 -
创始人愿景与长期布局
梁文锋强调“用最长期的眼光回答AI本质问题”,公司长期投入AGI基础研究,同时通过慈善捐赠(如4亿元助学计划)回馈社会,体现技术与社会价值并重的理念。
DeepSeek的崛起证明了中国企业在AI领域的创新能力,其技术路线和商业模式为全球AI生态提供了新范式。未来,随着多模态和行业应用的深化,深度求索或将成为AGI时代的关键力量。