卡方检验四格表公式是统计学中用于分析两个分类变量间关联性的核心工具,其核心公式为,通过比较观测频数与理论频数的差异,判断变量是否独立。
-
公式原理与应用场景
四格表(2×2列联表)适用于医学、社会科学等领域,例如分析吸烟与患病率的关系。理论频数基于边际总和计算(如),卡方值越大,变量关联性越强。 -
计算步骤与条件
- 步骤:整理观测值(a/b/c/d)→计算理论频数→代入公式求→查卡方分布表判断显著性(自由度=1)。
- 条件:样本量需>40且理论频数≥5,否则需校正或改用确切概率法。
-
实际案例演示
若A组发癌52例(未发19例),B组发癌39例(未发3例),通过公式计算后,若>3.841(α=0.05),则拒绝原假设,认为两组发癌率差异显著。
提示:使用统计软件(如Excel的CHITEST
函数)可快速验证结果,但需严格满足应用条件以确保结论可靠性。