卡方检验的P值计算公式及关键要点如下:
一、核心公式
卡方检验的P值计算公式为: $$ P = \frac{n1(n1+1)}{n2(n2+1)} \cdot \frac{(m1-m2)^2}{n1+n2-2} $$
其中:
-
n1 和 n2 :分别表示正反两组的数据个数;
-
m1 和 m2 :分别表示正反两组的期望频数。
二、补充说明
-
自由度
自由度计算公式为: $$ df = n1 + n2 - 2 $$
该值用于确定卡方分布的临界值。
-
应用条件
需满足每个格子的理论频数(T)≥5,或≤总格子数的1/5,否则需采用校正方法。
-
与标准正态分布的关系
在大样本情况下,卡方分布可近似为正态分布,此时P值可通过标准正态分布函数计算: $$ P = 1 - \Phi\left(\frac{x^2}{df}\right) $$
其中 x² 为卡方统计量, Φ 为标准正态分布累积分布函数。
三、注意事项
-
卡方检验主要用于分类变量独立性检验或拟合优度检验;
-
P值越小,拒绝原假设的证据越强,通常以0.05为显著性水平。