DeepSeek语料库由杭州深度求索人工智能基础技术研究有限公司(DeepSeek Inc.)开发,其母公司为国内量化投资巨头幻方量化,专注于大语言模型及相关技术的创新研究。
-
公司背景与成立
DeepSeek成立于2023年7月,依托幻方量化的资金与技术资源,迅速成长为AI领域的重要竞争者。其定位为人工智能基础技术研究企业,聚焦Transformer架构和深度神经网络模型的自主研发。 -
技术方向与成果
公司以开发高性能通用AI模型为核心,已推出DeepSeek-LLM、DeepSeek-Coder等百亿级参数大模型,并在推理、编码、中文理解等任务中达到业界先进水平。2024年还开源了国内首个MoE架构模型,推动技术共享。 -
语料库关联争议
尽管部分上市公司被误传与DeepSeek存在合作关系,但***息显示,其语料库建设及模型训练均由深度求索团队独立完成,未涉及外部企业直接参与。
作为中国AI行业的新锐力量,DeepSeek通过技术创新与开源策略持续扩大影响力,其语料库的构建也体现了公司在数据与算法层面的自主研发能力。