DeepSeek是中国科技公司研发的通用人工智能(AGI)大模型,起源于2023年,由量化对冲基金团队转型创立,以强化学习技术和开源策略迅速崛起,其模型性能直接冲击全球AI产业格局,甚至引发华尔街科技股震荡。
-
量化交易基因的转型
创始团队来自High-Flyer对冲基金,早期专注于AI量化算法,积累了强化学习(如GRPO算法)和高效训练的技术经验,为后续大模型研发奠定基础。 -
开源与低成本的技术路线
从成立之初即坚持开源策略,首推代码生成模型DeepSeek Coder,后续迭代的V2、V3系列采用混合专家架构(MoE),将推理成本降至行业极低水平,如V3训练成本仅557万美元。 -
颠覆行业的性能突破
2025年发布的R1模型在数学、编程等复杂任务上媲美顶级产品,API成本却低95%,迅速跻身全球聊天机器人榜单前三,风格控制能力与OpenAI并列第一。 -
全球AI竞争的新变量
DeepSeek的崛起直接冲击科技巨头市场,其开源策略和技术效率重塑行业标准,甚至导致英伟达等公司单日市值暴跌,成为AGI领域不可忽视的中国力量。
DeepSeek的诞生不仅是技术创新的结果,更体现了从垂直领域到通用智能的跨越式发展,其低成本、高性能的路径为AI普及提供了新范式。