杭州深度求索公司(DeepSeek):专注于大语言模型(LLM)和通用人工智能(AGI)研发的创新型科技企业
杭州深度求索人工智能基础技术研究有限公司(DeepSeek)是一家由知名量化资管巨头幻方量化孕育而生的创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
公司背景
- 成立时间:2023年7月17日
- 总部地点:浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室
- 公司类型:其他有限责任公司
- 法定代表人:裴湉
- 经营范围:技术服务、技术开发、软件开发等
发展历程
- 2023年7月17日:公司成立,专注于大语言模型(LLM)和相关技术的研发。
- 2024年1月5日:发布DeepSeek LLM,这是深度求索的第一个大模型。
- 2024年1月25日:发布DeepSeek-Coder。
- 2024年2月5日:发布DeepSeekMath。
- 2024年3月11日:发布DeepSeek-VL。
- 2024年5月7日:发布MoE架构的DeepSeek V2。
- 2024年6月17日:发布DeepSeek-Coder-V2。
- 2024年9月5日:合并DeepSeek Coder V2和DeepSeek V2 Chat,推出DeepSeek V2.5。
- 2024年12月13日:发布DeepSeek-VL2。
- 2024年12月26日:正式上线DeepSeek-V3首个版本并同步开源。
- 2025年1月31日:英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM。
- 2025年2月5日:DeepSeek-R1、V3、Coder等系列模型,已陆续上线国家超算互联网平台。
- 2025年2月6日:澳大利亚政府以所谓“担心安全风险”为由,已禁止在所有政府设备中使用DeepSeek。
- 2025年2月8日:DeepSeek正式登陆苏州,并在苏州市公共算力服务平台上完成部署上线。
技术实力与创新
- 快速迭代能力:团队在较短时间内多次发布开源大模型,性能不断突破。
- 创新的架构设计:从混合专家模型(MoE)到多头延迟注意力机制(MLA),均取得重要技术突破。
- 高效的训练方法论:采用FP8混合精度、多令牌预测等先进方案,大幅提升了训练和推理效率。
资源优势
- 充足的资金支持:依托创始人量化金融背景以及投资机构的注资,资金实力雄厚。
- 强大的硬件支持:作为大厂外唯一一家储备万张A100芯片的公司,幻方量化为DeepSeek的技术研发提供了强大的硬件支持。
合作与生态
- 股权关联方:浙江东方、华金资本等通过基金参投DeepSeek的天使轮和Pre-A轮融资。
- 算力基础设施供应商:浪潮信息、中科曙光等为DeepSeek提供AI服务器集群和液冷系统。
- 垂直领域合作方:拓尔思、科大讯飞、金山办公等与DeepSeek在金融、教育、办公等领域开展合作。
- 技术合作潜力股:飞利信、南威软件、航锦科技等与DeepSeek在技术方向上存在协同潜力。
- 数据与生态合作伙伴:每日互动、卓创资讯等为DeepSeek提供数据支持和生态合作。
总结
杭州深度求索公司(DeepSeek)作为一家专注于大语言模型(LLM)和通用人工智能(AGI)研发的创新型科技企业,凭借其深厚的学术背景、强大的科研实力和开源生态策略,在AI领域迅速崛起,成为行业内的新锐力量。未来,随着技术的不断创新和合作的深入开展,DeepSeek有望在人工智能领域取得更大的突破和成就。