国内主流的LLM大模型主要包括通用基础模型(如百度文心一言、阿里通义千问、科大讯飞星火)和垂直领域模型(如金融、工业、科研等),其中参数规模从数十亿到千亿级不等,部分模型支持多语言、长文本处理等特性。以下是具体分类和代表模型:
-
通用大模型
- 文心一言(百度):具备多模态理解与生成能力,支持跨场景应用。
- 通义千问(阿里云):开源7B参数模型Qwen-7B,擅长中英双语任务。
- 星火(科大讯飞):聚焦教育、办公场景,提供API和APP服务。
-
垂直领域模型
- 金融/工业:达观数据“曹植”专注于文本分析与决策支持,华为“盘古”系列覆盖气象、工业仿真。
- 科研:清华大学ChatGLM系列开源6B参数模型,复旦大学MOSS支持学术研究。
-
技术特色
部分模型如CodeFuse-13B专攻代码生成,支持40+编程语言;小米MiLM-6B在中文评测中表现优异,参数规模64亿。
这些模型通过开源或商业化服务推动AI落地,用户可根据需求选择试用或集成。