国内大模型参数排名如下:
-
百川智能Baichuan4 :在多个评测中表现均衡,文科和理科能力较为出色。
-
科大讯飞星火大模型 :在多项评测中表现优异,具备文本生成、语言理解、知识问答等核心能力。
-
阿里云通义千问(Qwen2-72B) :在SuperCLUE基准测试中得分最高,超过众多国内外闭源模型。
-
百度文心一言(ERNIEBot) :专注于自然语言理解与生成,适用于文本创作、智能问答等场景。
-
字节跳动豆包(Doubao-Pro) :在客观评测中以75.96分排名第二,得分最高的国产大模型。
-
智谱清言(GLM-4) :在数据和算法方面有一定优势,处理复杂语言任务表现较好。
-
零一万物Yi系列 :在多项评测中表现出色,位于行业前列。
-
月之暗面Kimi(Moonshot-v1) :在处理长文本内容方面具有优势,能理解和处理长篇文档、会议纪要等。
-
智源研究院旗下的Baichuan3 :在多个评测中表现优异,文科和理科能力较为均衡。
-
腾讯混元大模型 :在基础和场景应用上均处于领先位置,各项能力较为均衡。
建议:
-
百川智能Baichuan4 和 科大讯飞星火大模型 在多个评测中表现优异,适合需要均衡文科和理科能力的应用场景。
-
阿里云通义千问(Qwen2-72B) 在SuperCLUE基准测试中得分最高,适合需要强大语言理解和生成能力的场景。
-
百度文心一言(ERNIEBot) 和 字节跳动豆包(Doubao-Pro) 在自然语言处理和生成方面表现出色,适合文本创作和智能问答等场景。
-
智谱清言(GLM-4) 和 零一万物Yi系列 在复杂语言任务处理方面表现较好,适合需要高效处理语言数据的场景。
-
月之暗面Kimi(Moonshot-v1) 在长文本内容处理方面具有优势,适合需要处理长篇文档和会议纪要的场景。
-
腾讯混元大模型 在基础和场景应用上均处于领先位置,适合需要全面能力的大模型应用。