DeepSeek的基础开源模型包括:
- DeepSeek-V3 :
-
DeepSeek-V3是DeepSeek推出的全新系列模型,首个版本于2024年12月26日上线并同步开源。
-
该模型是自研的MoE模型,拥有671B参数,激活函数为37B,在14.8T token上进行了预训练。
-
DeepSeek-V3在多项评测中成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上与世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
-
论文链接:
- DeepSeek-R1 :
-
DeepSeek-R1是DeepSeek在2025年1月20日开源的推理模型。
-
该模型在发布后彻底撼动了全球AI市场。
这些模型的开源使得开发者能够更灵活地使用DeepSeek的技术,并根据需求进行定制优化。蒸馏后的模型可以通过AnythingLLM和Ollama等工具实现PC本地部署,这不仅保护了数据隐私,还提供了更高的灵活性和性能。
本文《deepseek的基础开源模型》系
辅导客考试网原创,未经许可,禁止转载!合作方转载必需注明出处:https://www.fudaoke.com/exam/161142.html