生成式模型和判别式模型是机器学习中两大核心建模方法,核心区别在于:生成式模型学习数据的联合概率分布(即“数据如何生成”),可生成新样本;判别式模型则直接学习决策边界(即“如何分类/预测”),专注于输入与输出的映射关系。
-
生成式模型
- 核心思想:通过建模输入数据 和标签 的联合概率 ,推导出数据生成过程。例如,朴素贝叶斯、高斯混合模型(GMM)和生成对抗网络(GAN)均属此类。
- 优势:能生成逼真新数据(如图像、文本),适用于数据稀缺时合成样本;可处理隐变量学习(如VAE)。
- 局限:对数据分布假设较强(如高斯分布),计算复杂度高,且生成结果可能无关任务目标。
-
判别式模型
- 核心思想:直接建模条件概率 ,关注输入特征到输出的映射。逻辑回归、支持向量机(SVM)和深度学习分类器(如CNN)是典型代表。
- 优势:计算效率高,对数据分布假设更灵活;在分类、回归等任务中通常表现更优。
- 局限:无法生成数据,且依赖大量标注样本。
-
关键选择场景
- 需生成数据(如艺术创作、数据增强)→ 优先生成式模型;
- 需高精度分类/预测(如垃圾邮件识别)→ 选择判别式模型;
- 两者可结合(如生成式模型预训练+判别式模型微调)。
实际应用中,模型选择需权衡任务目标、数据规模与计算资源。生成式模型更“全能”但复杂,判别式模型更“专注”且高效。