DeepSeek近期取得显著进展,包括模型更新、应用拓展等多方面成果,其模型能力提升且被广泛应用于多领域。
DeepSeek在2025年3月24日晚发布了DeepSeek-V3-0324更新,此次并非V4或R2,开源版本已上HuggingFace,参数达6850亿,其V3编码能力接近Claude3.7,数学能力提升,此前V3因高性价比闻名,多项评测成绩出色。DeepSeek于2025年1月发布DeepSeek-R1,后训练阶段大规模用强化学习技术,在极少标注数据下提升推理能力,该模型成本价格低廉,性能与OpenAI相当,引发硅谷震惊和Meta恐慌,还被英伟达作为NIM微服务预览版提供,且已应用于苹果App、华为鸿蒙等多个平台。此前还有DeepSeek-V3在2024年12月以高性价比著称多项评测成绩超其他开源闭源模型;2025年2月长安汽车完成Deepseek深度融合,北京市多区及杭州文旅等多领域应用DeepSeek技术,Gitee AI上线四个较小尺寸DeepSeek模型等。
DeepSeek在模型更新迭代与多领域应用落地上成果颇丰,未来其发展值得持续关注。