误判率(False Positive Rate)是衡量模型将负样本错误判定为正样本的概率,计算公式为FPR=FP/(FP+TN),其中FP为假正例数量,TN为真负例数量。 该指标直接影响模型可靠性,尤其在医疗诊断、金融风控等高风险领域需严格把控。
-
核心公式解析:误判率的分母为实际负样本总量(FP+TN),分子为被误判的正样本数(FP)。比值越小,代表模型对负样本的误判越少。例如,若100个健康人中模型误判5人为患者,误判率即为5%。
-
与召回率的区别:误判率聚焦负样本错误率,而召回率(Recall)关注正样本的漏检率,两者评估维度不同。高召回率模型可能伴随高误判率,需根据场景权衡。
-
应用场景影响:在垃圾邮件过滤中,高误判率会导致正常邮件被拦截;但在癌症筛查中,宁可提高误判率也要确保不漏诊,此时需结合其他指标综合优化。
-
降低误判率的方法:调整分类阈值、使用更精准的特征工程或引入集成学习技术(如随机森林),均可减少假正例。但需注意,过度降低误判率可能导致漏检风险上升。
理解误判率有助于优化模型性能,但需结合精确率、F1分数等指标全面评估,避免单一指标导致的决策偏差。