根据权威信息源,当前主流的大模型可分为以下几类,涵盖自然语言处理、多模态、推理等方向:
一、自然语言处理(NLP)领域
-
GPT系列
-
GPT-4.5 :OpenAI开发,参数量达2025亿,支持代码生成、逻辑推理等任务。
-
GPT-4 :OpenAI最新版本,参数量1750亿,广泛用于文本生成、问答等。
-
-
BERT及其衍生模型
- BERT :Google开发,参数量110亿,擅长上下文理解,衍生出RoBERTa、ALBERT等模型。
二、多模态大模型
-
Claude
-
Claude Sonnet 3.7 :参数量20亿,支持多模态交互(文本+图像)。
-
Moonlight-16B-A3B :参数量160亿,由MoonshotAI开发,专注多模态推理。
-
-
CLIP
- 结合文本和图像,支持图像识别与文本描述关联,参数量未明确标注。
三、推理与数学领域
-
Grok-3
- 参数量突破1400亿,数学、科学、代码推理能力超越现有模型,首次达到1400分基准测试。
-
OroraTech
- 通过AI预测野火,参数量未明确标注,侧重实际应用场景。
四、开源与国产代表
-
阶跃星辰开源模型
-
Step-Video-T2V :全球最大开源视频生成模型,参数量未明确标注。
-
Step-Audio :首款开源语音交互模型,参数量未明确标注。
-
五、其他领域
-
Diffusion模型 :生成式图像模型,擅长从噪声生成高质量图像。
-
T5 :文本到文本转换器,参数量未明确标注。
总结 :当前大模型以GPT系列、BERT及其衍生模型为核心,多模态领域涌现Claude、CLIP等新势力,推理能力方面Grok-3实现重大突破。开源生态持续扩展,国内企业如阶跃星辰、阿里等推出多模态开源模型。