统计学 · 第7单元：定量数据的推断：均值 · 阅读约 14 分钟 · 更新于 2026-05-11

两个总体均值差的推断 — AP 统计学

AP 统计学 · 第7单元：定量数据的推断：均值 · 14 min read

1. 核心概念与符号 ★★☆☆☆ ⏱ 2 min

两个总体均值差的推断（也称为均值的双样本t推断）是一组用于比较两个不同总体中定量变量真实均值的统计方法。该知识点占AP统计学考试总分的约4-5%，会同时出现在选择题和自由作答题中。

该框架仅适用于两个样本相互独立的情况，即第一组中的任何观测值都不与第二组中的特定观测值存在关联。我们几乎总是对$\mu_1 - \mu_2$（两个总体均值的真实差）进行推断。

2. 双样本推断的适用条件 ★★☆☆☆ ⏱ 3 min

在进行任何推断之前，你必须验证三个核心条件以确保结果的统计有效性。在AP自由作答题中，必须明确检查全部三个条件才能获得满分。

**随机性**：两组均是来自各自总体的独立随机样本，或是来自包含两个处理组的随机化对比实验。这保证了抽样分布是无偏的。
**独立性**：每个样本内的个体观测值相互独立。无放回抽样时，需要满足10%条件：每个样本量小于其总体规模的10%。
**正态性/大样本**：$\bar{x}_1 - \bar{x}_2$的抽样分布近似正态。满足以下任一条件即可：(1) 两个样本量都≥ 30（中心极限定理），或(2) 对于小样本，每个样本的分布都没有极端离群值或强偏斜。

📐 Worked Example

一名高中辅导员想要比较住校生和走读生每周课外活动时长的均值差异。她从学校庞大的学生群体中分别抽取了27名住校生和32名走读生的随机样本。两个样本分布都近似对称，无离群值。推断的所有条件都满足吗？

检查随机性条件：题目明确说明样本是随机的，因此该条件满足。
检查独立性（10%）条件：学校的住校生人数超过$10 \times 27 = 270$，走读生人数超过$10 \times 32 = 320$，因此10%条件成立，组内观测值相互独立。
检查正态性/大样本条件：一个样本量小于30（$n_1 = 27$），但两个分布都没有离群值且近似对称；第二个样本（$n_2 = 32$）满足中心极限定理要求，因此该条件满足。
双样本推断的所有条件都满足。

Exam tip: 在自由作答题中永远不要只写‘条件满足’。必须结合题目语境明确验证每个条件才能获得满分。

3. $\mu_1 - \mu_2$的置信区间 ★★★☆☆ ⏱ 4 min

$\mu_1 - \mu_2$的置信区间给出了两个总体均值真实差的所有合理取值范围，遵循标准的置信区间结构：$\text{点估计} \pm \text{边际误差}$。

$\mu_1 - \mu_2$的点估计是$\bar{x}_1 - \bar{x}_2$，即两个样本均值的差。AP统计学默认使用不合并方差的标准误，公式为：

SE = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}

该公式来自以下规则：两个独立随机变量之差的方差等于两个变量方差之和，因此我们始终要将方差项相加（绝不能相减）。AP考试接受两种自由度计算方法：保守方法$df = \min(n_1 - 1, n_2 - 1)$，或是计算器给出的Welch-Satterthwaite近似值，两种方法都能获得满分。最终置信区间为：

(\bar{x}_1 - \bar{x}_2) \pm t^* \times SE

📐 Worked Example

一家咖啡店老板想要估计早高峰和午高峰的平均等待时间差。随机抽取15份早高峰订单，平均等待时间为2.8分钟，标准差为0.7分钟；随机抽取12份午高峰订单，平均等待时间为2.1分钟，标准差为0.6分钟。构造平均等待时间差$\mu_{\text{morning}} - \mu_{\text{afternoon}}$的95%置信区间。

假设条件已经验证完毕，计算点估计：
$\bar{x}_1 - \bar{x}_2 = 2.8 - 2.1 = 0.7$
计算不合并方差的标准误：
$SE = \sqrt{\frac{0.7^2}{15} + \frac{0.6^2}{12}} = \sqrt{0.0327 + 0.03} = \sqrt{0.0627} \approx 0.250$
用保守方法找到自由度和t临界值：
$df = \min(15-1, 12-1) = 11, \quad t^*_{95\%, 11} = 2.201$
计算边际误差，得到最终区间：
$\text{ME} = 2.201 \times 0.250 \approx 0.55 \implies (0.15, 1.25)$
解释：我们有95%的把握认为，早高峰和午高峰平均等待时间的真实差在0.15分钟到1.25分钟之间。

Exam tip: 如果置信区间不包含0，你就可以在显著性水平$\alpha = 1 - \text{置信水平}$下拒绝‘无差异’的原假设，这是多部分自由作答题中常考的关联考点。

4. 双样本t假设检验 ★★★☆☆ ⏱ 3 min

双样本t检验用于检验关于两个总体均值差的论断。原假设几乎总是$H_0: \mu_1 - \mu_2 = 0$，即两个总体均值没有差异。根据研究问题的不同，备择假设可以是双侧、左侧或右侧的。

检验统计量遵循假设检验的标准结构：

t = \frac{(\bar{x}_1 - \bar{x}_2) - \Delta_0}{SE}

其中$\Delta_0$是原假设中的假设差值，几乎总是为0。标准误和自由度的计算方法与置信区间相同，除非题目明确要求使用合并方差，否则始终使用不合并方差的方法。

📐 Worked Example

一名研究者声称，经常冥想的成年人平均静息心率低于不冥想的成年人。随机抽取35名冥想者，平均静息心率为68次/分钟，标准差为5次/分钟；随机抽取42名非冥想者，平均静息心率为72次/分钟，标准差为6次/分钟。在$\alpha = 0.05$的显著性水平下检验该研究者的论断。

定义参数并陈述假设：设$\mu_1$=冥想者的真实平均静息心率，$\mu_2$=非冥想者的真实平均静息心率。$H_0: \mu_1 - \mu_2 = 0$，$H_a: \mu_1 - \mu_2 < 0$，$\alpha = 0.05$。
检查条件：题目说明是随机样本，两个总体都满足10%条件，且$n_1 \geq 30$，$n_2 \geq 30$，因此所有条件都满足。
计算检验统计量：
$\text{Point estimate} = 68 - 72 = -4; \quad SE = \sqrt{\frac{5^2}{35} + \frac{6^2}{42}} \approx 1.253; \quad t = \frac{-4 - 0}{1.253} \approx -3.19$
找到p值：自由度$df = \min(34, 41) = 34$，单侧p值约为0.0015。
结论：由于$0.0015 < 0.05$，我们拒绝$H_0$。在0.05的显著性水平下，有令人信服的证据表明冥想成年人的平均静息心率低于非冥想成年人。

Exam tip: 在自由作答题中书写假设时，一定要用文字定义你的参数。AP阅卷官要求这一步才能获得假设部分的满分。

5. 常考核心区分点 ★★★★☆ ⏱ 2 min

AP统计学考试中经常考察两个核心区分点，也是考生失分的常见原因，我们在下文介绍这两个区分点。

**合并方差 vs 不合并方差方法**：合并t方法假设两个总体方差相等，实践中几乎无法确认该假设成立。除非题目明确要求使用，否则AP考试从不要求使用合并方差方法，不合并方差始终是默认方法。

**独立双样本 vs 配对样本**：两个总体均值差的双样本推断仅适用于独立组，即两组观测值之间没有关联。配对数据出现在观测值成对出现的情况：例如同一受试者在处理前后的测量，或是根据年龄、性别等混杂变量匹配的受试者。对于配对数据，你需要计算每对内部的差值，然后使用单样本t方法，而不是双样本推断。

Exam tip: AP考试题目中经常会有干扰项：看起来是双样本数据，实际是配对数据。在选择推断方法之前，一定要先检查是否存在配对结构。

Common Pitfalls

Why: 学生将均值差和方差差混淆，忘记了任何独立随机变量的方差都是相加的。

Why: 学生因为有两个组就默认使用双样本，忽略了让两组不独立的配对结构。

Why: 学生忘记了两个抽样分布都需要近似正态，而不只是其中一个。

Why: 学生知道大n时t近似于z，但忘记了总体标准差仍然是未知的。

Why: 真实差值是固定值，不是随机量，因此这种解释是错误的。

Why: 一些入门课程先教授合并方法，导致学生认为这是标准方法。

Quick Reference Cheatsheet

← 返回章节主页

某道题卡住了？
拍照或粘贴题目 — 小欧（我们的 AI 学习助手）会一步步讲解并配示意图。
免费试用小欧 →

两个总体均值差的推断 — AP 统计学

1. 核心概念与符号 ★★☆☆☆ ⏱ 2 min

2. 双样本推断的适用条件 ★★☆☆☆ ⏱ 3 min

3. $\mu_1 - \mu_2$的置信区间 ★★★☆☆ ⏱ 4 min

4. 双样本t假设检验 ★★★☆☆ ⏱ 3 min

5. 常考核心区分点 ★★★★☆ ⏱ 2 min

Common Pitfalls

Quick Reference Cheatsheet

更多学习指南