统计学 · 定量数据的推断：均值 · 阅读约 14 分钟 · 更新于 2026-05-11

总体均值的置信区间 — AP 统计学

AP 统计学 · 定量数据的推断：均值 · 14 min read

1. 核心概念与t分布 ★★☆☆☆ ⏱ 3 min

总体均值的置信区间基于定量数据的随机样本，给出真实未知总体均值$µ$的一系列合理取值范围。我们几乎永远无法得知真实总体标准差$σ$，因此我们使用t分布而非正态（z）分布，来解释用样本标准差$s$估计$σ$带来的额外变异性。

ar{x} \pm t^* \left(\frac{s}{\sqrt{n}}\right)

$t^*\left(\frac{s}{\sqrt{n}}\right)$ 就是边际误差（$ME$），即在选定置信水平下，样本估计值与真实总体均值之间的预期最大偏差。随着自由度增加，t分布会收敛于标准正态分布。

Exam tip: 在AP考试中，当$σ$未知时，哪怕样本量很大，你使用t区间也不会扣分。

2. 有效推断的条件 ★★☆☆☆ ⏱ 3 min

在AP统计学的自由作答题（FRQ）中，你必须明确陈述并检验全部三个条件，才能获得置信区间题目的满分。三个要求条件如下：

**随机性**：数据来自目标总体的随机样本，或随机化实验。
**独立性**：个体观测值相互独立。不放回抽样时，需要满足10%条件：$n < 10\%$ 的总体总量。
**正态性/大样本**：$\bar{x}$ 的抽样分布近似正态。当 $n \geq 30$（中心极限定理）时满足；若 $n < 30$，则要求样本没有极端离群值或强偏斜。

Exam tip: 如果题目没有明确说明样本是随机的，你必须写下「我们假设样本是随机的」才能获得该条件的分数。

3. 均值差的双样本置信区间 ★★★☆☆ ⏱ 4 min

当我们从两个不同总体得到两个独立样本，想要估计两个总体真实均值的差 $µ_1 - µ_2$ 时，我们使用双样本t区间。该方法常用于比较两个组之间某个定量变量的平均值。

(\bar{x}_1 - \bar{x}_2) \pm t^* \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}

在AP考试中，保守自由度计算方法（永远可以获得满分）是 $df = \min(n_1 - 1, n_2 - 1)$。计算器近似得到的自由度会得到略窄的区间，但两种方法都是可接受的。

📐 Worked Example

一家面包店想要估计两种品牌酵母的平均发面高度差。他们测试了12份独立的A品牌酵母面团（平均发面高度=6.2 cm，$s = 0.8$ cm）和10份独立的B品牌酵母面团（平均发面高度=5.7 cm，$s = 0.7$ cm）。请构建真实平均发面高度差（$\mu_A - \mu_B$）的95%置信区间。

条件满足：两个样本都是独立随机样本，面团总体远大于各样本量的10倍，且没有记录到极端离群值。
计算样本均值差：
$\bar{x}_A - \bar{x}_B = 6.2 - 5.7 = 0.5$
计算保守自由度：
$df = \min(12-1, 10-1) = 9$
对于95%置信水平，临界 $t^* = 2.262$。
计算标准误：
$SE = \sqrt{\frac{0.8^2}{12} + \frac{0.7^2}{10}} \approx 0.32$
计算边际误差：
$ME = 2.262 * 0.32 \approx 0.72$
最终95%置信区间：
$0.5 \pm 0.72 = (-0.22, 1.22)$

Exam tip: 如果双样本均值差置信区间包含0，说明总体均值没有差异是合理结果，这是AP考官经常考察的知识点。

4. 给定目标边际误差的样本量确定 ★★★☆☆ ⏱ 3 min

收集数据之前，研究者会计算达到目标最大边际误差所需的最小样本量。由于收集数据前我们没有样本标准差$s$，我们会使用预实验或先前研究得到的$σ$的先验估计，并用z分布计算。对于该方法得到的大样本量，$t^*$和$z^*$的差异可以忽略不计。

n = \left( \frac{z^* \sigma^*}{ME} \right)^2

无论小数部分是多少，我们总是向上进一位取整。向下取整会得到大于允许最大值的边际误差。

Exam tip: 样本量计算永远不要遵循普通四舍五入规则。哪怕结果是65.1也要向上进一位到66，因为任何小数都意味着你需要多一个观测值才能满足边际误差要求。

Common Pitfalls

Why: 学生混淆了均值区间和比例区间，或认为大样本下用z就没问题。

Why: 真实均值是固定的，不是随机的；置信水平描述的是方法，而非单个区间。

Why: 学生记得随机性和正态性条件，但跳过了独立性条件。

Why: 学生使用普通四舍五入规则，而非样本量计算的特殊规则。

Why: 学生夸大了区间的结论；区间只给出合理值，不能证明相等。

Why: 学生认为没提就是随机的，但AP要求明确说明。

Quick Reference Cheatsheet

← 返回章节主页

某道题卡住了？
拍照或粘贴题目 — 小欧（我们的 AI 学习助手）会一步步讲解并配示意图。
免费试用小欧 →