样本方差服从卡方分布的证明主要基于正态分布的性质和卡方分布的定义,具体步骤如下:
一、核心结论
若总体服从正态分布 $N(\mu, \sigma^2)$,则样本方差 $s^2$ 经过标准化后,$\frac{(n-1)s^2}{\sigma^2}$ 服从自由度为 $n-1$ 的卡方分布,即 $\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)$。
二、证明步骤
-
样本均值与方差的定义
样本均值 $\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i$,样本方差 $s^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2$。
-
正态分布的性质
由于 $X_i \sim N(\mu, \sigma^2)$,则 $\frac{X_i - \mu}{\sigma} \sim N(0,1)$。样本均值 $\bar{X}$ 也服从正态分布 $\bar{X} \sim N(\mu, \frac{\sigma^2}{n})$。
-
构造卡方分布
将样本方差标准化: $$ \frac{(n-1)s^2}{\sigma^2} = \sum_{i=1}^n \left(\frac{X_i - \bar{X}}{\sigma}\right)^2 $$
该式为 $n$ 个独立标准正态随机变量的平方和,其中 $n-1$ 个变量来自样本数据,最后一个变量由总体均值和样本均值确定,因此自由度为 $n-1$。
-
独立性证明
样本均值 $\bar{X}$ 与样本方差 $s^2$ 相互独立,这是卡方分布的关键条件之一。
三、注意事项
-
若使用未修正的样本方差公式 $s^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2$,则 $\frac{n s^2}{\sigma^2}$ 服从 $\chi^2(n-1)$ 分布。
-
该结论仅适用于正态总体,对于非正态分布需通过中心极限定理等工具近似处理。
四、应用意义
该定理是统计学中无偏估计的基础,用于计算总体方差时需使用 $n-1$ 作为分母(Bessel's correction),避免样本量增大时方差的系统性低估。