大模型幻觉的例子主要体现在生成内容与事实不符、逻辑矛盾或数据错误等方面,以下是具体案例:
-
历史事件时间错误
当被问及“人类首次登月时间”时,模型可能将1969年误写为1968年,或提供其他错误年份。这种错误源于训练数据中历史事件描述的不统一或噪声。
-
虚构文学场景
例如要求模型描述“林黛玉倒拔垂杨柳”,模型会生成语法正确但内容荒谬的情节,因缺乏对现实逻辑的把控,直接从海量文本拼接出不符合事实的描述。
-
医疗诊断误判
在识别罕见疾病时,模型可能因训练数据样本不足,错误地将非肺癌病例判断为肺癌,导致治疗方案失误,甚至浪费医疗资源。
-
工业革命标志性事件错误
模型可能将珍妮纺纱机的发明归因于“哈格里夫斯踢翻妻子纺纱机”的虚构场景,而实际发明者是詹姆斯·哈格里夫斯,且该事件与“倒地后纺锭竖立”无关。
-
金融合规风险
在产品定价或条款解释中,模型可能生成不符合监管要求的回答,例如错误计算利率或忽略法律条款,引发合规风险。
总结 :大模型幻觉源于训练数据的不一致性、算法对概率的过度依赖以及缺乏事实验证机制,需通过数据清洗、验证链等技术手段降低其影响。