| 学习指南 EN
统计学 · 第7单元:定量数据的推断:均值 · 阅读约 14 分钟 · 更新于 2026-05-11

配对数据均值差异的推断 — AP 统计学

AP 统计学 · 第7单元:定量数据的推断:均值 · 14 min read

1. 配对数据与研究设计 ★★☆☆☆ ⏱ 3 min

当我们比较的两个组中,观测值之间存在天然的一一对应匹配关系时,就得到了配对数据。两种常见场景会产生配对数据,配对可以消除组间变异,降低标准误,让推断比独立样本更有力。

  1. **重复测量**: 同一个实验单元在两种不同条件下各测量一次(例如:运动前后的心率)
  2. **匹配配对设计**: 将实验单元根据共同混淆变量匹配成对,每对中的两个单元分别接受一种处理

Exam tip: 拿不准的时候,问自己:'第一组的每个观测值,在第二组中是否都有且只有一个唯一的关联观测值?'如果是,那就是配对数据。

2. 配对t推断的条件 ★★☆☆☆ ⏱ 3 min

所有配对t步骤都需要满足三个条件,所有条件都基于差值样本(而非原始两组测量值)验证,逻辑和单样本t步骤类似。

  • **随机**: 配对是从总体中随机选取的,或者处理是在配对内随机分配的
  • **正态/大样本**: 当$n \geq 30$,或$n < 30$但差值分布没有强偏斜/异常值时,$\bar{d}$的抽样分布近似正态
  • **独立**: 差值之间相互独立;无放回抽样时,10%条件($N \geq 10n$)适用

Exam tip: 一定要基于差值验证条件,而非原始的两个组。AP考试会给在未配对原始数据上验证条件的作答扣分。

3. 总体均值差异的配对t检验 ★★★☆☆ ⏱ 4 min

配对t检验用于检验关于真实总体均值差异$\mu_d$的断言。几乎所有情况下,原假设都是$H_0: \mu_d = 0$,因为我们检验配对测量值之间是否存在差异。检验统计量是:

t = \frac{\bar{d} - \mu_{d0}}{s_d / \sqrt{n}}

其中$\mu_{d0}$是原假设的差值(几乎总是0),自由度为$df = n - 1$。

Exam tip: 在书写假设前,一定要在情境中定义$\mu_d$,明确哪一个测量值减去哪一个。这是拿满分的必要要求。

4. 总体均值差异的配对t置信区间 ★★★☆☆ ⏱ 3 min

配对t置信区间用于估计$\mu_d$的真实值,它量化了均值差异的大小,而不只是检验差值是否非零。如果区间不包含0,那么对于双侧检验,我们可以在显著性水平$\alpha = 1-C$下拒绝$H_0: \mu_d = 0$,其中C是置信水平。公式是:

\bar{d} \pm t^* \times \frac{s_d}{\sqrt{n}}

其中$t^*$是置信水平$C$、自由度$df = n-1$对应的临界t值,第二项是边际误差。

Exam tip: 解释区间时,一定要在情境中明确差值的方向(哪一组减哪一组)。模糊的解释会扣分。

5. 概念检测 ★★☆☆☆ ⏱ 1 min

Common Pitfalls

Why: 学生看到两组测量值就自动选择双样本方法,没有检查是否配对

Why: 学生忘记推断是基于差值进行的,而非原始测量值

Why: 虽然$\bar{x}_1 - \bar{x}_2 = \bar{d}$成立,但用原始标准差计算标准误是错误的

Why: 学生混淆t和z的区别,错误认为大样本可以用z方法

Why: 学生混淆了个体差值的分布和均值差异的置信区间

Why: 学生在拒绝/不拒绝$H_0$后就停止作答,没有回答原始的研究问题

Quick Reference Cheatsheet

← 返回章节主页

某道题卡住了?
拍照或粘贴题目 — 小欧(我们的 AI 学习助手)会一步步讲解并配示意图。
免费试用小欧 →