根据权威信息源综合分析,DeepSeek V3在多个场景中被以下模型击败:
-
开源模型Llama 4系列
-
Llama 4 Scout :在多模态能力、长上下文处理(支持1000万上下文)及编程、数学等基准测试中击败OpenAI模型,LMSYS排行榜位列第一。
-
Llama 4 Maverick :仅用4000亿参数(DeepSeek V3-0324的一半),在推理编码、多语言、长查询等场景中与DeepSeek V3-0324实力相当,但未明确击败。
-
-
其他竞争模型
-
Grok 3 :虽在数学、科学等基准测试中全面超越DeepSeek V3,但未明确提及与DeepSeek V3的直接对抗。
-
谷歌GPT-4o :在多语言、创意写作等场景中被Llama 4系列超越。
-
总结 :当前开源模型中,Llama 4系列(尤其是Scout)是DeepSeek V3的主要竞争对手,尤其在多模态和长上下文处理能力上表现突出。