正态总体的卡方分布证明主要基于样本方差的标准化。以下是关键步骤和结论:
一、核心结论
若 $X_1, X_2, \cdots, X_n$ 是来自正态总体 $N(\mu, \sigma^2)$ 的样本,则统计量 $\frac{(n-1)s^2}{\sigma^2}$ 服从自由度为 $n-1$ 的卡方分布,即 $\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)$。
二、证明步骤
-
样本均值与方差的独立性
根据正态分布的性质,样本均值 $\bar{X}$ 和样本方差 $S^2$ 是独立的统计量。
-
标准化样本方差
样本方差 $S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2$,标准化后得到 $\frac{(n-1)s^2}{\sigma^2}$。
-
构造标准正态变量
通过线性变换将 $X_i$ 表示为标准正态分布的线性组合,确保组合后的变量均值为0、方差为1且相互独立。具体地,设 $Y_i = \frac{X_i - \mu}{\sigma}$,则 $Y_i \sim N(0,1)$。
-
平方和服从卡方分布
由于 $Y_i$ 独立且服从标准正态分布,其平方和 $\sum_{i=1}^n Y_i^2 = \frac{(n-1)s^2}{\sigma^2}$ 服从自由度为 $n-1$ 的卡方分布。
三、应用与性质
-
样本方差的分布 :$\frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1)$,用于总体方差的估计和检验。
-
渐近正态性 :当自由度 $n$ 足够大时,卡方分布近似为正态分布,便于计算。
四、注意事项
-
证明中需严格处理线性组合的独立性条件,确保 $Y_i$ 的正交性。
-
卡方分布的偏斜度随自由度降低而增大,自由度为1时呈L型。