两个总体均值差的推断 — AP 统计学
1. 核心概念与符号 ★★☆☆☆ ⏱ 2 min
两个总体均值差的推断(也称为均值的双样本t推断)是一组用于比较两个不同总体中定量变量真实均值的统计方法。该知识点占AP统计学考试总分的约4-5%,会同时出现在选择题和自由作答题中。
该框架仅适用于两个样本相互独立的情况,即第一组中的任何观测值都不与第二组中的特定观测值存在关联。我们几乎总是对$\mu_1 - \mu_2$(两个总体均值的真实差)进行推断。
2. 双样本推断的适用条件 ★★☆☆☆ ⏱ 3 min
在进行任何推断之前,你必须验证三个核心条件以确保结果的统计有效性。在AP自由作答题中,必须明确检查全部三个条件才能获得满分。
- **随机性**:两组均是来自各自总体的独立随机样本,或是来自包含两个处理组的随机化对比实验。这保证了抽样分布是无偏的。
- **独立性**:每个样本内的个体观测值相互独立。无放回抽样时,需要满足10%条件:每个样本量小于其总体规模的10%。
- **正态性/大样本**:$\bar{x}_1 - \bar{x}_2$的抽样分布近似正态。满足以下任一条件即可:(1) 两个样本量都≥ 30(中心极限定理),或(2) 对于小样本,每个样本的分布都没有极端离群值或强偏斜。
Exam tip: 在自由作答题中永远不要只写‘条件满足’。必须结合题目语境明确验证每个条件才能获得满分。
3. $\mu_1 - \mu_2$的置信区间 ★★★☆☆ ⏱ 4 min
$\mu_1 - \mu_2$的置信区间给出了两个总体均值真实差的所有合理取值范围,遵循标准的置信区间结构:$\text{点估计} \pm \text{边际误差}$。
$\mu_1 - \mu_2$的点估计是$\bar{x}_1 - \bar{x}_2$,即两个样本均值的差。AP统计学默认使用不合并方差的标准误,公式为:
SE = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}
该公式来自以下规则:两个独立随机变量之差的方差等于两个变量方差之和,因此我们始终要将方差项相加(绝不能相减)。AP考试接受两种自由度计算方法:保守方法$df = \min(n_1 - 1, n_2 - 1)$,或是计算器给出的Welch-Satterthwaite近似值,两种方法都能获得满分。最终置信区间为:
(\bar{x}_1 - \bar{x}_2) \pm t^* \times SE
Exam tip: 如果置信区间不包含0,你就可以在显著性水平$\alpha = 1 - \text{置信水平}$下拒绝‘无差异’的原假设,这是多部分自由作答题中常考的关联考点。
4. 双样本t假设检验 ★★★☆☆ ⏱ 3 min
双样本t检验用于检验关于两个总体均值差的论断。原假设几乎总是$H_0: \mu_1 - \mu_2 = 0$,即两个总体均值没有差异。根据研究问题的不同,备择假设可以是双侧、左侧或右侧的。
检验统计量遵循假设检验的标准结构:
t = \frac{(\bar{x}_1 - \bar{x}_2) - \Delta_0}{SE}
其中$\Delta_0$是原假设中的假设差值,几乎总是为0。标准误和自由度的计算方法与置信区间相同,除非题目明确要求使用合并方差,否则始终使用不合并方差的方法。
Exam tip: 在自由作答题中书写假设时,一定要用文字定义你的参数。AP阅卷官要求这一步才能获得假设部分的满分。
5. 常考核心区分点 ★★★★☆ ⏱ 2 min
AP统计学考试中经常考察两个核心区分点,也是考生失分的常见原因,我们在下文介绍这两个区分点。
**合并方差 vs 不合并方差方法**:合并t方法假设两个总体方差相等,实践中几乎无法确认该假设成立。除非题目明确要求使用,否则AP考试从不要求使用合并方差方法,不合并方差始终是默认方法。
**独立双样本 vs 配对样本**:两个总体均值差的双样本推断仅适用于独立组,即两组观测值之间没有关联。配对数据出现在观测值成对出现的情况:例如同一受试者在处理前后的测量,或是根据年龄、性别等混杂变量匹配的受试者。对于配对数据,你需要计算每对内部的差值,然后使用单样本t方法,而不是双样本推断。
Exam tip: AP考试题目中经常会有干扰项:看起来是双样本数据,实际是配对数据。在选择推断方法之前,一定要先检查是否存在配对结构。
Common Pitfalls
Why: 学生将均值差和方差差混淆,忘记了任何独立随机变量的方差都是相加的。
Why: 学生因为有两个组就默认使用双样本,忽略了让两组不独立的配对结构。
Why: 学生忘记了两个抽样分布都需要近似正态,而不只是其中一个。
Why: 学生知道大n时t近似于z,但忘记了总体标准差仍然是未知的。
Why: 真实差值是固定值,不是随机量,因此这种解释是错误的。
Why: 一些入门课程先教授合并方法,导致学生认为这是标准方法。