卡方检验的计算公式为 χ² = Σ[(O-E)²/E],其中 O为观测值,E为期望值,核心是通过比较实际数据与理论分布的差异来判断变量间的相关性或独立性。以下是关键要点解析:
-
公式组成
- 观测值(O):实际收集到的数据频数。
- 期望值(E):假设变量独立或无关联时的理论频数,通常通过行合计×列合计/总数计算。
- 卡方值(χ²):差值平方与期望值的比值累加,反映偏离程度。
-
应用场景
- 拟合优度检验:验证样本分布是否符合预期理论分布(如掷骰子公平性)。
- 独立性检验:分析列联表中两分类变量是否相关(如吸烟与肺癌的关联性)。
- 注意事项:要求样本量足够大,且期望频数通常需≥5,否则需修正或改用Fisher精确检验。
-
结果解读
- 计算得到的χ²值与临界值(查卡方分布表,根据自由度α和显著性水平确定)对比。
- 若χ² > 临界值,拒绝原假设,认为存在显著差异或关联;反之则接受原假设。
卡方检验是统计分析中验证分类变量关系的利器,但需严格满足适用条件以确保结论可靠性。实际应用中建议结合P值或效应量综合判断。