单总体比例假设检验介绍 — AP 统计学
1. 陈述原假设与备择假设 ★★☆☆☆ ⏱ 3 min
所有假设检验都从关于未知总体比例 $p$ 的两个对立声明开始。**原假设**($H_0$)是默认的无效应、无差异或现状声明,按惯例始终包含等号。**备择假设**($H_a$)是我们需要寻找证据支持的研究声明,从不包含等号。
- 单侧(左尾):$H_a: p < p_0$(怀疑真实比例低于原假设声明)
- 单侧(右尾):$H_a: p > p_0$(怀疑真实比例高于原假设声明)
- 双侧:$H_a: p \neq p_0$(怀疑真实比例不同,无指定方向)
Exam tip: 书写假设前,请务必结合问题背景定义参数 $p$。即使你的假设书写正确,AP统计学阅卷员也要求完成这一步才能给满分。
2. 验证单比例Z检验的条件 ★★☆☆☆ ⏱ 3 min
进行推断前,我们必须验证三个核心条件,以确保抽样分布近似正态,从而保证p值计算准确。这三个条件可以总结为:随机性、独立性、正态性。
- **随机性**:数据来自随机样本或随机化实验,保证样本无偏。
- **独立性**:无放回抽样时,10%条件要求样本量 $n$ 小于总体大小的10%($n < 0.1N$)。这保证观测可以被视为独立的。
- **正态性(大计数条件)**:如果 $np_0 \geq 10$ 且 $n(1-p_0) \geq 10$,则 $\hat{p}$ 的抽样分布近似正态。对于假设检验,我们使用原假设中的假设值 $p_0$(而非 $\hat{p}$),因为检验时我们假设 $H_0$ 为真。
Exam tip: 如果题目没有明确说明总体大小,只要总体明显远大于样本,就可以认为10%条件满足。
3. 计算检验统计量和P值 ★★★☆☆ ⏱ 4 min
如果所有条件都满足,我们假设 $H_0$ 为真,因此 $\hat{p}$ 的抽样分布近似正态,均值为 $p_0$,标准差为 $\sqrt{\frac{p_0(1-p_0)}{n}}$,即原假设下的标准误。
z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}
**p值**是*在原假设 $H_0$ 为真的前提下*,观测到检验统计量与你的样本计算结果一样极端或更极端的概率。p值的计算取决于备择假设的形式:
- 左尾($H_a: p < p_0$):$\text{p-value} = P(Z < z)$
- 右尾($H_a: p > p_0$):$\text{p-value} = P(Z > z)$
- 双侧($H_a: p \neq p_0$):$\text{p-value} = 2P(Z > |z|)$(单侧面积翻倍)
Exam tip: 在自由作答题中,即使你用计算器得到最终结果,也必须写出z检验统计量的公式才能得满分。
4. 结合背景得出结论 ★★☆☆☆ ⏱ 2 min
计算出p值后,我们将其与预先指定的显著性水平 $\alpha$ 比较,除非题目给出其他值,否则 $\alpha$ 几乎总是取0.05。统计上正确的结论只有两种:
- 如果 $\text{p-value} < \alpha$:**拒绝 $H_0$**。结合问题背景,存在令人信服的统计证据支持备择假设 $H_a$。
- 如果 $\text{p-value} \geq \alpha$:**不拒绝 $H_0$**。结合问题背景,不存在令人信服的统计证据支持备择假设 $H_a$。
Exam tip: 如果你的结论与p值比较结果矛盾,AP阅卷员会扣分,因此务必反复检查你的决策是否与p值匹配。
5. 更多AP风格的完整例题 ★★★☆☆ ⏱ 2 min
Common Pitfalls
Why: 学生在建立检验时混淆已知样本统计量和未知总体参数。
Why: 学生记住了置信区间的大计数条件,未经调整就错误应用。
Why: 学生记住了单侧p值的计算,忽略了双侧检验中“任一方向极端”的逻辑。
Why: 学生把置信区间的标准误公式直接套用到假设检验中。
Why: 学生认为二元决策意味着某个假设被证明为真,但我们一开始就将原假设作为未被证明的假设。
Why: 学生在题目末尾赶时间,忽略了AP对结合背景解释的要求。