Σ((O-E)/E)^2
卡方计算公式是用于衡量实际观测频数与期望频数之间差异的统计量,其核心思想通过计算差异的平方和与理论频数的比值来评估数据拟合程度。以下是具体解析:
一、基本公式
卡方值计算公式为: $$ \chi^2 = \sum \frac{(O - E)^2}{E} $$
其中:
-
O :实际观测频数(观察频数)
-
E :期望频数(基于理论或假设的预期频数)
二、核心思想
通过计算每个分类的频数差异平方后与期望频数的比值,反映观测数据与理论模型的吻合程度。卡方值越大,说明偏离程度越大。
三、应用领域
-
独立性检验 :判断两个分类变量是否独立(如列联表分析)
-
拟合优度检验 :评估观测数据是否符合某种理论分布(如正态分布)
-
股票分析 :用于验证模型预测与实际数据的匹配度
四、注意事项
-
应用条件 :通常要求理论频数≥5且样本量足够(如≥40),否则需进行校正或采用其他方法
-
自由度 :独立性检验中自由度为(行数-1)×(列数-1)
五、示例
假设有以下2×2列联表:
类别1 | 类别2 | 总计 |
---|---|---|
A | a | n1 |
B | b | n2 |
总计 | c | n |
卡方值计算为: $$ \chi^2 = \frac{(a - E1)^2}{E1} + \frac{(b - E2)^2}{E2} $$
其中: $$ E1 = \frac{n1 \times c}{n}, \quad E2 = \frac{n2 \times c}{n} $$