中国移动研发的多模态大模型名为“九天善智”,其核心亮点包括全栈国产化技术、128K超长文本处理、全双工语音交互以及跨行业结构化数据分析能力,目前已应用于政务、医疗等30多个领域,并在多项国际评测中位列前茅。
-
技术架构与国产化突破
九天善智基于万卡国产算力集群训练,适配17款国产芯片,实现从算法到硬件的全栈自主可控。独创的JTVLM架构融合多模态表征与自回归优化,支持文生图、文生视频等高复杂度任务,例如仅需“广州早茶”等简单指令即可生成专业级视觉内容。 -
多模态交互能力
模型支持边听边说的自然对话,用户打断时仍能保持上下文连贯,并实现语音指令实时联网搜索与总结。在视觉领域,其光线构图与细节捕捉能力接近专业摄影水平,例如生成的“小猫小狗玩耍”图像在指令遵循和美学表达上超越同类模型。 -
行业赋能与实践
通过结构化数据深度分析,九天善智可分钟级处理通信、能源等领域的流量预测与异常检测,零样本迁移能力显著。例如,为长沙橘子洲头通信数据提供趋势预测,并落地黑龙江政务搜索平台与协和医院医疗辅助系统。
当前,九天善智正推动AI与实体经济的深度融合,未来将持续扩展至更多垂直场景,为“AI+”时代提供底层技术支撑。