四格表卡方检验的计算公式及相关说明如下:
一、基本公式
四格表卡方值的计算公式为: $$ \chi^2 = \frac{(ad - bc)^2}{n(ad + bc)(a + c)(b + d)} $$
其中:
-
$a, b, c, d$ 分别为四格表中的观测频数(如真阳性TP、假阳性FP、假阴性FN、真阴性TN);
-
$n$ 为总样本量。
二、公式推导说明
-
理论频数计算
在零假设(即分类无差异)下,每个格子的理论频数计算公式为:
$$ E_{ij} = \frac{(R_i + C_j)}{n} $$其中 $R_i$ 和 $C_j$ 分别为第 $i$ 行和第 $j$ 列的合计。
-
卡方值定义
卡方值衡量观测频数与理论频数的偏离程度,计算公式为: $$ \chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}} $$
对于四格表,可简化为专用公式。
三、应用条件
-
样本量要求:$n \geq 40$,且每个格子的理论频数 $E \geq 5$;
-
校正要求:当样本量 $n \geq 40$ 但存在理论频数 $E < 5$ 时,需采用校正公式或确切概率法。
四、自由度
四格表自由度为 $(行数-1) \times (列数-1)$,对于四格表恒为1。
五、示例计算
假设有如下四格表:
阳性 | 阴性 | 总计 | |
---|---|---|---|
实际阳性 | 30 | 5 | 35 |
实际阴性 | 20 | 15 | 35 |
-
计算理论频数:
-
$E_{11} = \frac{(35 \times 35)}{70} = 17.5$
-
$E_{12} = \frac{(35 \times 15)}{70} = 7.5$
-
$E_{21} = \frac{(35 \times 35)}{70} = 17.5$
-
$E_{22} = \frac{(35 \times 15)}{70} = 7.5$
-
-
计算卡方值: $$ \chi^2 = \frac{(30-17.5)^2}{35 \times 5} + \frac{(5-7.5)^2}{35 \times 15} + \frac{(20-17.5)^2}{35 \times 35} + \frac{(15-7.5)^2}{35 \times 35} = 2.25 $$
-
判断结果:
查卡方分布表,$\chi^2_{0.05}(1) = 3.84$,由于 $2.25 < 3.84$,接受零假设,认为分类无显著差异。