DeepSeek(深度求索)是中国AI领域的新锐力量,其背后公司杭州深度求索人工智能基础技术研究有限公司由量化投资巨头幻方量化创立,凭借低成本训练大模型、开源技术突破和年轻顶尖团队迅速跻身全球AI第一梯队。
-
创始背景与资金支持
公司成立于2023年7月,创始人为幻方量化创始人梁文锋,依托母公司雄厚的资金和万卡GPU算力资源,早期专注于金融量化技术,后转向通用人工智能(AGI)研发。其技术团队平均年龄仅28岁,90%以上成员来自清华、北大等顶尖高校,以扁平化管理和高强度创新著称。 -
技术突破与成本优势
DeepSeek的核心竞争力在于高效架构设计,如混合专家(MoE)模型和自研多头潜在注意力(MLA)技术。例如,其6710亿参数的DeepSeek-V3模型训练成本仅557.6万美元,是同类模型的1/20;开源模型DeepSeek-R1推理能力媲美GPT-4,但API价格仅为后者的1%。 -
开源策略与行业影响
从2023年发布首个代码模型DeepSeek-Coder起,公司坚持全面开源,推动技术民主化。其模型在数学、编程等任务中超越GPT-4,被AMD等国际巨头集成,甚至被海外学者评价为“延续了OpenAI最初的开放使命”。 -
产品生态与商业落地
除大模型外,DeepSeek推出覆盖聊天助手、企业API的多场景应用,支持128K长上下文和文件解析,用户可通过网页端或App免费使用。其技术已应用于金融、医疗等行业,显著降低AI应用门槛。
当前,DeepSeek正以“工程师文化”持续挑战AI前沿,其发展印证了中国在AGI领域的快速崛起。对于关注AI行业的读者,追踪其技术迭代与开源动态将极具参考价值。