判断总体是否服从正态分布可通过以下方法实现,结合了统计检验与图形化手段:
一、统计检验方法
-
偏度-峰度检验
-
偏度检验 :检验数据在偏度方向(左/右偏)的偏离程度,原假设为数据服从正态分布。若偏度接近0,可认为数据对称且符合正态分布。
-
峰度检验 :衡量数据分布峰值的陡峭程度,标准正态分布峰度为3。若峰度接近3,说明数据分布接近正态分布。
-
联合检验 :同时考虑偏度和峰度,当两者均接近理论值时,可判定为正态分布。
-
-
夏皮罗-威尔克检验(Shapiro-Wilk)
- 适用于小样本(n<50)的正态性检验,原假设为数据服从正态分布。若P值≥0.05,接受原假设,认为数据符合正态分布。
-
Kolmogorov-Smirnov检验
- 可检验数据是否服从特定分布(包括正态分布),原假设为数据来自正态分布。P值≥0.05时接受原假设。
-
J-B检验
- 基于数据的偏度和峰度计算Z评分,判断是否显著偏离正态分布。若Z评分在±1.96范围内,可认为数据符合正态分布。
二、图形化方法
-
直方图
- 正态分布呈钟形曲线,数据集中在均值附近且对称。若直方图接近钟形且无极端异常值,可初步判断为正态分布。
-
QQ图(分位数图)
- 通过比较数据分位数与标准正态分布分位数,若数据点基本在直线(y=x)上,说明数据服从正态分布。
-
箱线图
- 箱线图显示四分位数和异常值,正态分布的箱体呈钟形且异常值较少。
三、其他注意事项
-
样本量影响 :小样本(n<50)建议使用偏度-峰度联合检验或夏皮罗-威尔克检验;大样本(n≥50)可考虑Kolmogorov-Smirnov检验。
-
实际应用 :即使检验通过,数据仍可能因样本量不足而存在偏差。可结合图形化方法(如QQ图)进一步验证。
通过以上方法,可综合判断数据是否服从正态分布。