深度求索(DeepSeek)是一家专注于通用人工智能(AGI)研发的中国科技公司,成立于2023年7月,总部位于杭州。它以低成本、高性能的大语言模型(LLM)技术闻名,其开源模型如DeepSeek-V3和R1在数学、代码、自然语言推理等任务上媲美国际顶尖模型,同时训练成本仅为行业巨头的几十分之一。公司凭借创新的算法架构和普惠的开源策略,迅速成为全球AI领域的“黑马”,并入选2025年杭州独角兽企业榜单。
深度求索由量化投资领域资深人士梁文锋创立,核心团队汇聚了来自全球顶尖高校和科技公司的AI专家。公司成立仅一年多,便凭借DeepSeek-V3和R1等模型引发行业震动,其技术特点包括:
- 混合专家(MoE)架构:通过动态路由机制提升计算效率,如DeepSeek-V3总参数量达6710亿,但每个token仅激活370亿参数,显著降低推理成本。
- 长上下文处理能力:支持128k tokens的超长文本连贯对话,在代码补全和文档分析场景中准确率提升40%。
- 开源生态建设:公开模型权重和技术细节,推动全球开发者协作,开源模型下载量超300万次。
深度求索的产品覆盖消费级与企业级市场,包括智能对话助手DeepSeek Chat、代码生成工具DeepSeek-Coder,以及面向金融、教育、医疗等行业的定制化解决方案。其商业化落地能力强劲,已与腾讯、百度、京东等互联网巨头达成合作,并在上海交大、湖南大学等高校实现本地化部署。
未来,深度求索计划进一步扩大算力网络和行业应用,目标在2025年前推出万亿参数级AGI原型系统。作为中国AI创新的代表,它正以技术突破和开源共享重塑全球AI竞争格局。