国内通用大模型排名如下:
-
GPT-4o :在中文测试环境下,国内头部大模型达到96%以上水平,综合得分82.55分,持续领跑榜单。
-
Qwen2.5-72B :在中文环境下,能力表现达到GPT-4o的99%分位水平,超过Claude3.5和GPT-4-Turbo。
-
Qwen2.5-32B :跻身榜单前六,能力表现稳定。
-
Deepseek-V2 :整体能力显著提升,跃升至榜单前八。
-
百川智能Baichuan4 :在国内大模型中排名第一,文科和理科能力较为均衡。
-
科大讯飞星火大模型 :支持对话、写作、编程等功能,并提供语音交互方式。
-
百度文心一言(ERNIEBot) :专注于自然语言理解与生成,适用于文本创作、智能问答等场景。
-
字节跳动豆包(Doubao-Pro) :在客观评测中以75.96分排名第二,得分最高的国产大模型。
-
智谱清言(GLM-4) :在数据和算法方面有一定优势,处理复杂语言任务表现较好。
-
MiniMax abab6.5 :大模型创业公司的代表,超过70分的表现,位列国内大模型第一梯队。
建议:
-
选择适合的大模型 :根据具体应用场景选择合适的大模型,例如文本创作、智能问答、编程等。
-
关注模型性能 :综合考虑模型的中文处理能力、知识百科、指令遵循、长文本处理等维度。
-
考虑性价比 :如Qwen2.5-72B虽然性能优异,但价格较高,需根据预算进行选择。
-
关注安全性 :在需要高安全性的场景下,选择通过安全评测的模型,如360智脑。