卡方检验的卡方值反映了实际观测数据与理论预期之间的偏离程度,数值越大表明差异越显著。 关键判断依据包括:与临界值比较、结合自由度分析、关注p值是否小于显著性水平(如0.05)。若卡方值超过临界值或p值显著,则拒绝原假设,认为变量间存在关联或分布不符预期。
卡方值的计算基于公式,其中为观测频数,为期望频数。例如,性别与吸烟习惯的关联性检验中,若卡方值为10.2且自由度为1,查表得临界值7.81,因10.2>7.81,可认为两者显著相关。
自由度的确定依赖列联表结构,通常为。自由度影响卡方分布形态,需在查临界值时匹配。若自由度增加,相同显著性水平下的临界值会增大。
当单元格期望频数小于5时,卡方检验可能失真,需合并类别或改用Fisher精确检验。例如,小样本研究职业与健康关系时,若某职业期望频数为3,应调整分类或方法。
卡方值需综合自由度、临界值和实际背景解读,同时确保数据符合检验前提(如样本量、独立性)。避免仅依赖数值大小,需结合统计意义与实际问题关联性。