DeepSeek由杭州深度求索人工智能公司于2023年7月成立并开始开发,该公司由幻方量化创立,具备强大技术实力,DeepSeek发展迅速,成果显著。
DeepSeek成立于2023年7月,由杭州深度求索人工智能公司负责开发,该公司与知名量化资管巨头幻方量化关系密切,依托幻方量化的强大资源和技术支持,为后续发展奠定了坚实基础。成立不久后,2023年11月2日,DeepSeek发布了首个开源代码大模型DeepSeekCoder,展现出在代码生成、调试和数据分析等领域的潜力。同年11月29日,参数规模达670亿的通用大模型DeepSeek LLM推出,包含7B和67B的base及chat版本,进一步丰富了其产品线。在技术不断迭代下,2024年5月7日,第二代开源混合专家(MoE)模型DeepSeek - V2发布,总参数达2360亿,推理成本大幅降至每百万token仅1元人民币,体现了其在成本控制和模型性能上的优秀平衡能力。2024年12月26日,DeepSeek - V3发布,参数规模达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元,还通过混合专家架构选择性激活参数以及动态冗余策略等创新技术,在性能和效率上取得显著突破。2025年1月20日,新一代推理模型DeepSeek - R1正式发布并开源,性能比肩OpenAI的o1正式版,在数学、代码和推理任务上表现出色,还登顶了美区App Store免费榜等,获得了广泛关注。