数据服从正态分布需满足以下核心条件:连续型数值、对称钟形曲线、均值/中位数/众数重合,且符合68-95-99.7法则。实际应用中,完全理想的正态分布较少,但通过统计检验和图形分析可判断近似程度。
-
基本数学特征
正态分布由均值和标准差唯一确定,概率密度函数为:
其曲线关于对称,越小数据越集中。标准正态分布()是特例。 -
实际判断方法
- 图形法:直方图呈钟形、Q-Q图数据点接近对角线。
- 统计检验:Shapiro-Wilk检验(P>0.05)、偏度/峰度值接近0(绝对值<1.96可接受)。
- 经验法则:约68%数据落在内,95%在内,99.7%在内。
-
理论支撑
中心极限定理指出,独立随机变量和的分布随样本量增大趋近正态。自然现象(如身高、测量误差)常因此近似正态。
提示:若数据非正态,可通过对数变换或Box-Cox转换优化分析。实践中结合多种方法综合评估更可靠。