DeepSeek于2025年1月15日正式上线,其核心亮点包括:以1/11的算力成本实现超越GPT-4o的性能,开源模型DeepSeek-R1以3%的成本比肩OpenAI最强模型,核心技术融合FP8混合精度训练与MoE架构,已在教育、广告、工业等领域实现落地应用。
DeepSeek由杭州深度求索人工智能基础技术研究有限公司于2023年7月创立,2024年12月26日发布DeepSeek-V3模型引发行业瞩目,其训练成本仅557.6万美元,较GPT-4o节省超10倍,同年11月率先推出的DeepSeek Coder模型已开源供商业使用。2025年1月15日,DeepSeek App登陆全球应用市场,首日即登顶中国区免费榜,次周美区下载量超越微软Copilot等头部产品,周活用户峰值突破9700万,其核心模型DeepSeek-R1凭借77.5%的数学准确率与GPT-o1正面对标,代码生成能力在Codeforces评测中达2441分,领先行业基准。技术层面,DeepSeek通过动态稀疏MoE架构仅激活370亿参数处理单次任务,结合多头潜在注意力压缩技术减少内存占用,配合无辅助损失负载均衡策略实现资源最优化调度,相较传统“堆算力”模式效率提升显著。商业化方面,DeepSeek已与英伟达、微软、亚马逊达成云服务深度集成,同时接入黄河水利委员会、上海数据交易所等机构系统,并在教育领域为新东方在线、电商场景为京东等提供智能解决方案。2025年2月,其开源计划再升级,推出代码并行优化策略及五个代码库,持续扩展技术生态边界。作为新兴AI势力,DeepSeek以技术颠覆与市场渗透双重驱动,已成为全球大模型格局中的关键变量。