在概率论与统计学中,有一个重要的结论:如果从一个正态分布总体中随机抽取一个样本,那么该样本的方差(记为 $s^2$)乘以 $(n-1)$ 除以总体方差(记为 $\sigma^2$)将服从自由度为 $n-1$ 的卡方分布。即,$\frac{(n-1)s^2}{\sigma^2}$ 服从自由度为 $n-1$ 的卡方分布,记作 $\chi^2(n-1)$。
这个结论的证明基于正态分布的性质和卡方分布的定义。以下是简要的证明思路:
-
假设:设 $X_1, X_2, \ldots, X_n$ 是来自正态分布 $N(\mu, \sigma^2)$ 的一个样本,样本均值 $\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i$,样本方差 $s^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2$。
-
标准化:定义新的随机变量 $Z_i = \frac{X_i - \mu}{\sigma}$,则 $Z_i$ 服从标准正态分布 $N(0, 1)$。
-
构造卡方分布:考虑统计量 $\sum_{i=1}^n Z_i^2$,由于 $Z_i$ 服从标准正态分布,根据卡方分布的定义,$\sum_{i=1}^n Z_i^2$ 服从自由度为 $n$ 的卡方分布,即 $\sum_{i=1}^n Z_i^2 \sim \chi^2(n)$。
-
替换:用样本方差 $s^2$ 和样本均值 $\bar{X}$ 表达 $\sum_{i=1}^n Z_i^2$: $$ \sum_{i=1}^n Z_i^2 = \sum_{i=1}^n \left( \frac{X_i - \mu}{\sigma} \right)^2 = \frac{1}{\sigma^2} \sum_{i=1}^n (X_i - \mu)^2 = \frac{(n-1)s^2}{\sigma^2} $$
-
结论:$\frac{(n-1)s^2}{\sigma^2}$ 服从自由度为 $n-1$ 的卡方分布,即 $\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)$。
这个证明过程展示了如何通过正态分布的标准化和卡方分布的定义,得出样本方差的标准化形式服从卡方分布的结论。