单总体比例假设检验的实施 — AP 统计学
1. 什么是单比例假设检验? ★★☆☆☆ ⏱ 3 min
针对比例的假设检验(常称为单比例z检验,简称1-prop z检验),是当你拥有一组二分类数据的单一样本时,检验未知总体比例相关声明的核心推断流程。该内容占AP考试总分的6-8%,同时出现在选择题和自由作答题部分。核心目标是:如果原假设关于总体比例的声明为真,量化你的观测样本结果的不可能程度,从而让你能对原始声明做出统计上合理的结论。
2. 陈述假设并验证推断条件 ★★☆☆☆ ⏱ 4 min
任何比例假设检验的第一步都是定义你感兴趣的参数、陈述假设,然后验证z推断满足所有条件。假设始终是关于未知总体参数 $p$ 的,而非观测样本统计量 $\hat{p}$。
- **随机性**:样本来自感兴趣总体的随机抽样,或来自随机化实验。
- **独立性**:个体观测之间相互独立。无放回抽样时,这要求满足10%条件:$n < 0.10N$,其中 $N$ 是总体大小。
- **正态/大计数条件**:原假设下 $\hat{p}$ 的抽样分布近似正态。这要求 $np_0 \geq 10$ 和 $n(1-p_0) \geq 10$ — 我们这里使用 $p_0$ 而非 $\hat{p}$,因为我们假设 $H_0$ 为真。
Exam tip: 在FRQ中绝对不要跳过列出全部三个条件——AP阅卷员要求你明确检查每个条件才能获得该题满分,即使某个条件看起来显而易见。
3. 计算检验统计量和p值 ★★★☆☆ ⏱ 4 min
在陈述完假设并确认条件满足后,下一步就是计算你的观测样本结果与假设值的距离,单位是 $H_0$ 下抽样分布的标准差。这个标准化值就是z检验统计量。
z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}
直觉:分子衡量我们在样本中观测到的结果($\hat{p}$)和原假设为真时期望的结果($p_0$)之间的差距。分母是 $H_0$ 为真时 $\hat{p}$ 抽样分布的标准差,因此它告诉我们 $p_0$ 附近天然存在多少抽样变异。我们在分母中使用 $p_0$(而非 $\hat{p}$),因为我们所有概率计算都是在 $H_0$ 为真的假设下进行的。
计算出 $z$ 后,我们就能得到p值:在 $H_0$ 为真时,得到与我们观测结果同样极端或更极端的样本结果的概率。p值的计算取决于备择假设:
- 单侧,$H_a: p < p_0$: p-value = $P(Z < z)$ (标准正态分布中 $z$ 左侧的面积)
- 单侧,$H_a: p > p_0$: p-value = $P(Z > z)$ (z 右侧的面积)
- 双侧,$H_a: p \neq p_0$: p-value = $2P(Z > |z|)$ (翻倍尾部面积,因为极端结果可以出现在任意一侧)
Exam tip: 在AP考试中,如果你正确通过计算器得到p值,不需要展示通过z表手动计算p值的过程——只需要确保你展示了z的计算过程就能获得过程分。
4. 做出决策并写出结合情境的结论 ★★★☆☆ ⏱ 3 min
假设检验的最后一步是将你的p值与预先设定的显著性水平 $\alpha$(阿尔法)比较,做出决策,然后写出结合情境回答原始问题的结论。显著性水平 $\alpha$ 是我们拒绝 $H_0$ 要求的结果不可能程度的阈值;如果没有给出 $\alpha$,标准默认值是 $\alpha = 0.05$。
- If p-value $< \alpha$: 拒绝 $H_0$。我们拥有支持备择假设的有说服力的统计证据。
- If p-value $\geq \alpha$: 不拒绝 $H_0$。我们没有支持备择假设的有说服力的统计证据。
Exam tip: 始终将你的结论与原始问题的情境关联——只说"拒绝H0"的结论无法在FRQ中获得结论分。
Common Pitfalls
Why: 学生混淆了假设检验和置信区间,置信区间使用 $\hat{p}$ 验证正态性。
Why: 学生混淆了已知的样本统计量和我们实际检验的未知总体参数。
Why: 学生将不拒绝原假设解读为证实原假设,但我们只能排除原假设,无法证实它。
Why: 学生再次混淆了假设检验和置信区间,置信区间的标准误使用 $\hat{p}$。
Why: 学生通常只记得大计数条件,跳过独立性检查。
Why: 学生忘记双侧检验中极端结果可以出现在任意一个尾部。