DeepSeek(深度求索)是一家专注于通用人工智能(AGI)研发的中国科技公司,总部位于杭州,以低成本、高性能的大语言模型(LLM)技术闻名全球。其核心亮点包括:开源生态、超强推理能力、中英文混合处理优势,以及仅用1/10算力实现对标国际顶尖模型的突破性表现。
DeepSeek由量化资管巨头幻方量化孵化,成立于2023年7月17日,短短两年内迅速崛起为AI领域的“现象级”企业。公司通过创新的混合专家架构(MoE)和强化学习技术,开发出DeepSeek-V3、DeepSeek-R1等模型,在数学、代码生成等任务上比肩OpenAI的GPT-4o,而训练成本仅为后者的5%。例如,DeepSeek-V3仅用2000块GPU和557.6万美元成本,性能却超越耗费1亿美元的GPT-4o,被海外媒体称为“大模型界的拼多多”。
DeepSeek的竞争力还体现在开源策略上。其模型权重和训练细节全面公开,开发者可自由下载部署,甚至支持手机端运行。这种透明性推动了技术社区共建,同时降低了企业使用门槛。2025年1月,DeepSeek-R1开源后,迅速登陆英伟达NIM平台,并被亚马逊、微软等巨头接入服务。
应用层面,DeepSeek已覆盖智能客服、金融分析、医疗辅助等场景,与比亚迪、阿里云等70余家企业合作。其App全球下载量超1.1亿次,曾登顶中美应用商店榜首,用户可通过联网搜索、文件解析等功能实现高效办公。创始人梁文锋作为80后技术极客,带领不足140人的团队,以“代码驱动”的极客文化持续突破AGI边界。
当前,DeepSeek正加速多模态研发,其文生图模型Janus-Pro已超越DALL-E 3。尽管面临国际竞争和恶意攻击,公司仍坚持“AI平权”使命,通过国家超算互联网等平台普惠技术。未来,随着AGI技术迭代,DeepSeek或将成为中国参与全球AI竞赛的关键力量。