卡方分布检验的核心公式为:
卡方统计量计算公式 $$ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} $$
其中:
-
$O_i$ 为实际观测频数(Observed Frequency)
-
$E_i$ 为理论期望频数(Expected Frequency)
-
$\sum$ 表示对所有类别求和
补充说明
-
期望频数计算 $$ E_i = \frac{(\text{行总计} \times \text{列总计})}{\text{总样本数}} $$
适用于列联表(如四格表)的情境。
-
自由度确定
自由度 $df = (行数 - 1) \times (列数 - 1)$,用于查找临界值或计算 p 值。
-
检验步骤
-
提出零假设(如独立性检验)
-
计算卡方统计量
-
将统计量与临界值比较,或通过 p 值判断差异显著性。
-
应用场景
常见于分类数据的关联性分析(如列联表)、拟合优度检验等,例如检验两个变量是否独立。