判断一个分布是否为正态分布,可通过以下方法综合分析:
一、图形法
-
直方图
观察数据是否呈对称的钟形曲线,峰值位于均值处,数据集中在均值附近,两侧逐渐减少。
-
QQ图(Quantile-Quantile Plot)
将样本数据与标准正态分布的分位数对比,若点大致在一条直线上,则符合正态分布。直线斜率为标准差,截距为均值。
-
箱线图
检查数据是否存在异常值及拖尾现象,异常值或偏斜的尾部可能提示非正态分布。
二、统计检验法
-
Kolmogorov-Smirnov检验(K-S检验)
比较样本分布与理论正态分布的累积分布函数,p值>0.05通常认为数据符合正态分布。
-
Anderson-Darling检验(A-D检验)
适用于小样本,对正态性拟合度更高,p值越小越符合正态分布。
-
Shapiro-Wilk检验
常用于小样本,p值>0.05表示数据符合正态分布。
三、经验法则(68-95-99.7法则)
-
68% 数据落在均值±1个标准差范围内;
-
95% 数据落在均值±2个标准差范围内;
-
99.7% 数据落在均值±3个标准差范围内。
若数据显著偏离此规律,可能非正态。
四、偏度与峰度检验
-
偏度 :接近0表示对称分布;
-
峰度 :接近0表示钟形曲线。
结合Z评分判断(如|偏度|/标准误<1.96,|峰度|/标准误<1.96)。
总结 :优先使用图形法(直方图、QQ图)和统计检验法(K-S、A-D、Shapiro-Wilk),结合经验法则和偏度峰度检验综合判断。若多种方法均支持正态性,则可认为数据符合正态分布。