人工智能大模型是基于人工神经网络构建、参数量巨大(达百亿、千亿甚至万亿)、通过自监督或半监督学习在海量数据预训练,并经指令微调等优化,具有解决通用任务、遵循人类指令和复杂推理能力的智能模型,主要有大语言、视觉、多模态等类型,广泛应用于多领域。
人工智能大模型起源于语言模型发展,2017年Transformer架构奠定基础。它通过模仿人类语言智能和数据驱动的知识模型,完成多样化任务,核心是“模仿学习+交互式学习”。我国发展快,需聚焦技术创新。但存在技术、伦理、制度等安全挑战,需加强价值对齐、改进技术、稳定就业、构建国际秩序。