统计学 · 分类数据的推断：比例 · 阅读约 14 分钟 · 更新于 2026-05-11

单总体比例假设检验的实施 — AP 统计学

AP 统计学 · 分类数据的推断：比例 · 14 min read

1. 什么是单比例假设检验？ ★★☆☆☆ ⏱ 3 min

针对比例的假设检验（常称为单比例z检验，简称1-prop z检验），是当你拥有一组二分类数据的单一样本时，检验未知总体比例相关声明的核心推断流程。该内容占AP考试总分的6-8%，同时出现在选择题和自由作答题部分。核心目标是：如果原假设关于总体比例的声明为真，量化你的观测样本结果的不可能程度，从而让你能对原始声明做出统计上合理的结论。

2. 陈述假设并验证推断条件 ★★☆☆☆ ⏱ 4 min

任何比例假设检验的第一步都是定义你感兴趣的参数、陈述假设，然后验证z推断满足所有条件。假设始终是关于未知总体参数 $p$ 的，而非观测样本统计量 $\hat{p}$。

**随机性**：样本来自感兴趣总体的随机抽样，或来自随机化实验。
**独立性**：个体观测之间相互独立。无放回抽样时，这要求满足10%条件：$n < 0.10N$，其中 $N$ 是总体大小。
**正态/大计数条件**：原假设下 $\hat{p}$ 的抽样分布近似正态。这要求 $np_0 \geq 10$ 和 $n(1-p_0) \geq 10$ — 我们这里使用 $p_0$ 而非 $\hat{p}$，因为我们假设 $H_0$ 为真。

📐 Worked Example

某咖啡烘焙商声称，其烘焙前85%的咖啡豆无缺陷。质检人员怀疑真实的无缺陷比例低于85%。质检员随机抽取了120颗咖啡豆，其中96颗无缺陷。定义参数、陈述假设，并验证推断的所有条件。

1. 定义参数：令 $p$ = 该烘焙商所有烘焙前咖啡豆中，无缺陷咖啡豆的真实比例。
2. 陈述假设：
$H_0: p = 0.85, \quad H_a: p < 0.85$
这是单侧检验，符合质检员怀疑比例更低的表述。
3. 验证条件：
- 随机性：题目明确说明样本是随机的，因此该条件满足。
- 独立性：总体咖啡豆总数远大于 $10 \times 120 = 1200$，因此10%条件满足。
- 正态/大计数条件：$np_0 = 120 \times 0.85 = 102 \geq 10$，$n(1-p_0) = 120 \times 0.15 = 18 \geq 10$，因此正态条件满足。所有推断条件均满足。

Exam tip: 在FRQ中绝对不要跳过列出全部三个条件——AP阅卷员要求你明确检查每个条件才能获得该题满分，即使某个条件看起来显而易见。

3. 计算检验统计量和p值 ★★★☆☆ ⏱ 4 min

在陈述完假设并确认条件满足后，下一步就是计算你的观测样本结果与假设值的距离，单位是 $H_0$ 下抽样分布的标准差。这个标准化值就是z检验统计量。

z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}

直觉：分子衡量我们在样本中观测到的结果（$\hat{p}$）和原假设为真时期望的结果（$p_0$）之间的差距。分母是 $H_0$ 为真时 $\hat{p}$ 抽样分布的标准差，因此它告诉我们 $p_0$ 附近天然存在多少抽样变异。我们在分母中使用 $p_0$（而非 $\hat{p}$），因为我们所有概率计算都是在 $H_0$ 为真的假设下进行的。

计算出 $z$ 后，我们就能得到p值：在 $H_0$ 为真时，得到与我们观测结果同样极端或更极端的样本结果的概率。p值的计算取决于备择假设：

单侧，$H_a: p < p_0$: p-value = $P(Z < z)$ (标准正态分布中 $z$ 左侧的面积)
单侧，$H_a: p > p_0$: p-value = $P(Z > z)$ (z 右侧的面积)
双侧，$H_a: p \neq p_0$: p-value = $2P(Z > |z|)$ (翻倍尾部面积，因为极端结果可以出现在任意一侧)

Exam tip: 在AP考试中，如果你正确通过计算器得到p值，不需要展示通过z表手动计算p值的过程——只需要确保你展示了z的计算过程就能获得过程分。

4. 做出决策并写出结合情境的结论 ★★★☆☆ ⏱ 3 min

假设检验的最后一步是将你的p值与预先设定的显著性水平 $\alpha$（阿尔法）比较，做出决策，然后写出结合情境回答原始问题的结论。显著性水平 $\alpha$ 是我们拒绝 $H_0$ 要求的结果不可能程度的阈值；如果没有给出 $\alpha$，标准默认值是 $\alpha = 0.05$。

If p-value $< \alpha$: 拒绝 $H_0$。我们拥有支持备择假设的有说服力的统计证据。
If p-value $\geq \alpha$: 不拒绝 $H_0$。我们没有支持备择假设的有说服力的统计证据。

Exam tip: 始终将你的结论与原始问题的情境关联——只说"拒绝H0"的结论无法在FRQ中获得结论分。

Common Pitfalls

Why: 学生混淆了假设检验和置信区间，置信区间使用 $\hat{p}$ 验证正态性。

Why: 学生混淆了已知的样本统计量和我们实际检验的未知总体参数。

Why: 学生将不拒绝原假设解读为证实原假设，但我们只能排除原假设，无法证实它。

Why: 学生再次混淆了假设检验和置信区间，置信区间的标准误使用 $\hat{p}$。

Why: 学生通常只记得大计数条件，跳过独立性检查。

Why: 学生忘记双侧检验中极端结果可以出现在任意一个尾部。

Quick Reference Cheatsheet

← 返回章节主页

某道题卡住了？
拍照或粘贴题目 — 小欧（我们的 AI 学习助手）会一步步讲解并配示意图。
免费试用小欧 →