卡方齐性检验 — AP 统计学
1. 什么是卡方齐性检验? ★★☆☆☆ ⏱ 3 min
卡方齐性检验是一种基于假设的推断方法,用于检验单个分类响应变量的分布在两个或多个独立总体或处理组中是否齐性(一致)。
它经常和AP考试中另外两种卡方检验混淆,但它的研究设计有明显区别:
- 拟合优度检验:将一个样本的分布与单个假设分布进行比较
- 独立性检验:检验来自单个总体样本的两个分类变量之间是否存在关联
- 齐性检验:从每个感兴趣总体中分别抽取独立随机样本
2. 推断的假设与条件 ★★☆☆☆ ⏱ 3 min
任何检验的第一步都是正确陈述假设并验证推断条件。对于$k$个总体和$m$个响应类别:
根据AP CED,必须满足三个条件:
- **随机性**:数据来自独立随机样本或随机化实验组
- **独立性**:个体观测相互独立;不放回抽样时满足10%条件
- **大计数**:每个单元格的期望频数至少为5
3. 检验统计量和自由度 ★★★☆☆ ⏱ 4 min
对于一个$r \times c$列联表(r = 响应类别数,c = 总体/组数),每个单元格的期望频数计算公式为:
E_{ij} = \frac{(\text{Row Total}) \times (\text{Column Total})}{\text{Grand Total}}
如果原假设为真,每行观测的总体比例对所有列都适用,因此该公式给出了$H_0$成立时期望得到的频数。卡方检验统计量为:
\chi^2 = \sum_{\text{all cells}} \frac{(O - E)^2}{E}
其中$O$是每个单元格的观测频数,$E$是期望频数。$\chi^2$越大说明观测频数和期望频数的差异越大,因此反对$H_0$的证据越强。自由度计算公式为:
df = (r - 1)(c - 1)
4. 在情境中得出结论 ★★★☆☆ ⏱ 2 min
最后一步是将你的p值与预先指定的显著性水平$\alpha$(AP考试中除非另有说明,几乎总是$\alpha = 0.05$)比较,然后得出回答原始研究问题的情境化结论。
对于卡方检验,p值是原假设$H_0$成立时,观测到检验统计量大于等于你计算值的概率。所有p值都对应卡方分布中检验统计量右侧的面积。决策规则为:
- 如果$p$-值 $< \alpha$:拒绝$H_0$
- 如果$p$-值 $\geq \alpha$:不拒绝$H_0$
5. AP风格概念检验 ★★★★☆ ⏱ 2 min
Common Pitfalls
Why: 两种检验的计算方法相同,因此学生经常混淆研究问题
Why: 学生先记住拟合优度,混淆了两个公式
Why: 学生措辞不严谨,忘记不拒绝不能证明原假设为真
Why: 学生看到“所有频数≥5”的规则,默认检查给定的观测频数
Why: 学生错误认为备择假设要求所有组都不同
Why: 学生计算匆忙,记错公式顺序