统计学 · 分类数据的推断：比例 · 阅读约 14 分钟 · 更新于 2026-05-11

单总体比例假设检验介绍 — AP 统计学

AP 统计学 · 分类数据的推断：比例 · 14 min read

1. 陈述原假设与备择假设 ★★☆☆☆ ⏱ 3 min

所有假设检验都从关于未知总体比例 $p$ 的两个对立声明开始。**原假设**（$H_0$）是默认的无效应、无差异或现状声明，按惯例始终包含等号。**备择假设**（$H_a$）是我们需要寻找证据支持的研究声明，从不包含等号。

Exam tip: 书写假设前，请务必结合问题背景定义参数 $p$。即使你的假设书写正确，AP统计学阅卷员也要求完成这一步才能给满分。

进行推断前，我们必须验证三个核心条件，以确保抽样分布近似正态，从而保证p值计算准确。这三个条件可以总结为：随机性、独立性、正态性。

**随机性**：数据来自随机样本或随机化实验，保证样本无偏。
**独立性**：无放回抽样时，10%条件要求样本量 $n$ 小于总体大小的10%（$n < 0.1N$）。这保证观测可以被视为独立的。
**正态性（大计数条件）**：如果 $np_0 \geq 10$ 且 $n(1-p_0) \geq 10$，则 $\hat{p}$ 的抽样分布近似正态。对于假设检验，我们使用原假设中的假设值 $p_0$（而非 $\hat{p}$），因为检验时我们假设 $H_0$ 为真。

Exam tip: 如果题目没有明确说明总体大小，只要总体明显远大于样本，就可以认为10%条件满足。

如果所有条件都满足，我们假设 $H_0$ 为真，因此 $\hat{p}$ 的抽样分布近似正态，均值为 $p_0$，标准差为 $\sqrt{\frac{p_0(1-p_0)}{n}}$，即原假设下的标准误。

z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}

**p值**是*在原假设 $H_0$ 为真的前提下*，观测到检验统计量与你的样本计算结果一样极端或更极端的概率。p值的计算取决于备择假设的形式：

Exam tip: 在自由作答题中，即使你用计算器得到最终结果，也必须写出z检验统计量的公式才能得满分。

计算出p值后，我们将其与预先指定的显著性水平 $\alpha$ 比较，除非题目给出其他值，否则 $\alpha$ 几乎总是取0.05。统计上正确的结论只有两种：

Exam tip: 如果你的结论与p值比较结果矛盾，AP阅卷员会扣分，因此务必反复检查你的决策是否与p值匹配。

📐 Worked Example

一家糖果公司声称，其所有糖果盒中有25%包含奖品。一组顾客怀疑包含奖品的盒子真实比例低于25%。他们随机抽取了120个糖果盒，其中23个包含奖品。所有推断使用 $\alpha = 0.05$。请陈述假设、验证条件、计算检验统计量和p值，并得出结论。

定义参数并陈述假设：设 $p$ = 该公司生产的所有糖果盒中包含奖品的真实比例。
$H_0: p = 0.25, \quad H_a: p < 0.25$
验证条件：1. 随机性：题目说明样本是随机的，因此条件满足。2. 10%条件：糖果盒总体远大于1200（样本量的10倍），因此独立性满足。3. 大计数：
$np_0 = 120(0.25) = 30 \geq 10, \quad n(1-p_0) = 120(0.75) = 90 \geq 10$
所有条件都满足。计算得 $\hat{p} = 23/120 ≈ 0.192$，然后计算检验统计量：
$z = \frac{0.192 - 0.25}{\sqrt{\frac{(0.25)(0.75)}{120}}} ≈ -1.47$
p-value = $P(Z < -1.47) ≈ 0.071$。与 $\alpha = 0.05$ 比较：$0.071 > 0.05$，因此我们不拒绝 $H_0$。
结论：在0.05的显著性水平下，不存在令人信服的统计证据证明，包含奖品的糖果盒真实比例低于该公司声称的25%。

Why: 学生在建立检验时混淆已知样本统计量和未知总体参数。

Why: 学生记住了置信区间的大计数条件，未经调整就错误应用。

Why: 学生记住了单侧p值的计算，忽略了双侧检验中“任一方向极端”的逻辑。

Why: 学生把置信区间的标准误公式直接套用到假设检验中。

Why: 学生认为二元决策意味着某个假设被证明为真，但我们一开始就将原假设作为未被证明的假设。

Why: 学生在题目末尾赶时间，忽略了AP对结合背景解释的要求。

某道题卡住了？
拍照或粘贴题目 — 小欧（我们的 AI 学习助手）会一步步讲解并配示意图。
免费试用小欧 →