DeepSeek-V3
当前国内最强的AI大模型是 DeepSeek-V3 ,由幻方量化研发。这款模型在性能上与国际顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不相上下,甚至在数学能力方面大幅超过了所有开源闭源模型。DeepSeek-V3是一款自研的MoE模型,其生成速度相比上一代V2.5模型实现了3倍提升,尽管目前暂不支持多模态输入输出。在多项基准测试中,DeepSeek-V3的成绩超越了Qwen2.5-72 B和Llama-3.1-405 B等其他开源模型。
此外,阿里云通义千问(Qwen2-72B)在SuperCLUE基准测试中得分最高,超过众多国内外闭源模型,引领全球的开源生态。华为盘古大模型凭借其强大的技术能力和行业应用得到广泛认可。百度文心一言(ERNIEBot)专注于自然语言理解与生成,适用于文本创作、智能问答等场景。科大讯飞星火大模型支持对话、写作、编程等功能,还能提供语音交互方式。字节跳动豆包(Doubao-Pro)在客观评测中以75.96分排名第二,得分最高的国产大模型。智谱清言(GLM-4)在数据和算法方面有一定优势,其模型能够较好地处理各种复杂的语言任务。百川智能Baichuan4在国内大模型中排名第一,其文科、理科能力较为均衡。MiniMax abab6.5大模型创业公司的代表,超过70分的表现,位列国内大模型第一梯队。零一万物Yi系列模型在多项评测中表现出色,位于行业前列。月之暗面Kimi(Moonshot-v1)在处理长文本内容方面具有一定优势,能很好地理解和处理长篇文档、会议纪要等。
这些模型在各自的研究领域和应用场景中都有出色的表现,但DeepSeek-V3在整体性能和国际对比中表现尤为突出,可以被认为是当前国内最强的AI大模型。