DeepSeek(深度求索)于2023年5月由浙江大学毕业生梁文锋创立,并获得量化对冲基金幻方量化的支持,专注于开源大语言模型(LLM)的研发。其首款模型DeepSeek Coder于同年11月发布,标志着这一AI新星的正式崛起。此后,DeepSeek通过混合专家架构(MoE)、强化学习等技术迭代,迅速成为全球AI领域的重要参与者。
- 创立背景:DeepSeek的诞生源于2023年AI大模型热潮,创始团队结合金融领域的量化经验与AI技术,以低成本、高效率为目标,挑战OpenAI等巨头的技术垄断。
- 技术里程碑:2023年11月推出编程专用模型DeepSeek Coder,随后发布通用模型DeepSeek LLM;2024年5月发布的DeepSeek-V2以MoE架构实现性能飞跃;2025年1月推出的DeepSeek-R1推理模型性能比肩GPT-4,成本仅为同类10%。
- 行业影响:从金融、汽车到医疗,DeepSeek模型已渗透多个领域,如浦发银行、吉利汽车等企业均采用其技术,显著降低AI应用门槛。
DeepSeek的快速发展印证了技术创新与开源策略的潜力,其未来或将继续重塑AI行业的竞争格局。