最早的AI大模型是 LeNet-5 ,由Yann LeCun等人在1989年提出。以下是关键信息整合:
-
历史背景
-
1956年,约翰·麦卡锡在达特茅斯会议上首次提出“人工智能”概念。
-
1980年代,卷积神经网络(CNN)雏形出现,1998年LeNet-5模型诞生,标志着深度学习进入主流。
-
-
LeNet-5的核心特点
-
采用卷积层、池化层和全连接层结构,是现代卷积神经网络的基础。
-
在手写数字识别任务中取得突破性成果,推动计算机视觉领域发展。
-
-
技术演进
-
早期AI侧重符号主义(逻辑推理)和专家系统,受限于知识库规模。
-
深度学习技术成熟后,模型参数规模从数十亿增长至数千亿,形成GPT、BERT等大模型。
-
总结 :LeNet-5作为最早的深度学习大模型,为后续AI大模型发展奠定了基础,而真正的“大模型”概念(如GPT-3)则出现在21世纪。