DeepSeek是一家专注于大语言模型(LLM)开发的AI公司,成立于2023年7月17日,并于2025年1月15日发布官方App,旗下DeepSeek-R1模型在性能与价格方面引发全球AI领域关注。
DeepSeek由梁文锋创立,总部位于中国杭州,核心业务是研发先进的大语言模型及相关技术。2023年11月,该公司推出首款模型DeepSeek Coder并完全开源;11月29日,发布参数规模670亿的DeepSeek LLM,性能接近GPT-4;2024年5月,升级版DeepSeek-V2性能追平GPT-4 Turbo,但价格仅为其1%;12月底,DeepSeek-V3问世,训练成本降至国际顶尖模型的十分之一。
2025年1月,DeepSeek-R1的推出成为行业焦点:该模型在数学与代码任务上性能比肩OpenAI的GPT-o1,但API价格显著更低(输入1元/百万tokens、输出6元,GPT-o1为55元和438元)。其技术优势推动多个国际巨头合作,包括英伟达NIM微服务、微软Azure AI Foundry及亚马逊云科技均宣布接入。
同期,DeepSeek的品牌商标在美国遭遇校友公司抢注,纠纷对其海外市场拓展增添不确定性。即便如此,DeepSeek的全球化布局仍在加速:其官方App上线后迅速登顶多国下载榜,日活跃用户数突破3000万,累计下载量超1.1亿次。该公司计划通过“开源周”开放多个代码库,持续强化技术共享策略,凸显其在AI基础技术领域的竞争力。
随着DeepSeek-R1的技术突破与商业进展,其高性价比模型正在改变大语言模型市场格局,同时引发对模型训练成本及专利保护的深度讨论。用户在关注其性能迭代时,需留意潜在合作限制及法律风险。