总体均值的置信区间 — AP 统计学
1. 核心概念与t分布 ★★☆☆☆ ⏱ 3 min
总体均值的置信区间基于定量数据的随机样本,给出真实未知总体均值$µ$的一系列合理取值范围。我们几乎永远无法得知真实总体标准差$σ$,因此我们使用t分布而非正态(z)分布,来解释用样本标准差$s$估计$σ$带来的额外变异性。
ar{x} \pm t^* \left(\frac{s}{\sqrt{n}}\right)
$t^*\left(\frac{s}{\sqrt{n}}\right)$ 就是边际误差($ME$),即在选定置信水平下,样本估计值与真实总体均值之间的预期最大偏差。随着自由度增加,t分布会收敛于标准正态分布。
Exam tip: 在AP考试中,当$σ$未知时,哪怕样本量很大,你使用t区间也不会扣分。
2. 有效推断的条件 ★★☆☆☆ ⏱ 3 min
在AP统计学的自由作答题(FRQ)中,你必须明确陈述并检验全部三个条件,才能获得置信区间题目的满分。三个要求条件如下:
- **随机性**:数据来自目标总体的随机样本,或随机化实验。
- **独立性**:个体观测值相互独立。不放回抽样时,需要满足10%条件:$n < 10\%$ 的总体总量。
- **正态性/大样本**:$\bar{x}$ 的抽样分布近似正态。当 $n \geq 30$(中心极限定理)时满足;若 $n < 30$,则要求样本没有极端离群值或强偏斜。
Exam tip: 如果题目没有明确说明样本是随机的,你必须写下「我们假设样本是随机的」才能获得该条件的分数。
3. 均值差的双样本置信区间 ★★★☆☆ ⏱ 4 min
当我们从两个不同总体得到两个独立样本,想要估计两个总体真实均值的差 $µ_1 - µ_2$ 时,我们使用双样本t区间。该方法常用于比较两个组之间某个定量变量的平均值。
(\bar{x}_1 - \bar{x}_2) \pm t^* \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}
在AP考试中,保守自由度计算方法(永远可以获得满分)是 $df = \min(n_1 - 1, n_2 - 1)$。计算器近似得到的自由度会得到略窄的区间,但两种方法都是可接受的。
Exam tip: 如果双样本均值差置信区间包含0,说明总体均值没有差异是合理结果,这是AP考官经常考察的知识点。
4. 给定目标边际误差的样本量确定 ★★★☆☆ ⏱ 3 min
收集数据之前,研究者会计算达到目标最大边际误差所需的最小样本量。由于收集数据前我们没有样本标准差$s$,我们会使用预实验或先前研究得到的$σ$的先验估计,并用z分布计算。对于该方法得到的大样本量,$t^*$和$z^*$的差异可以忽略不计。
n = \left( \frac{z^* \sigma^*}{ME} \right)^2
无论小数部分是多少,我们总是向上进一位取整。向下取整会得到大于允许最大值的边际误差。
Exam tip: 样本量计算永远不要遵循普通四舍五入规则。哪怕结果是65.1也要向上进一位到66,因为任何小数都意味着你需要多一个观测值才能满足边际误差要求。
Common Pitfalls
Why: 学生混淆了均值区间和比例区间,或认为大样本下用z就没问题。
Why: 真实均值是固定的,不是随机的;置信水平描述的是方法,而非单个区间。
Why: 学生记得随机性和正态性条件,但跳过了独立性条件。
Why: 学生使用普通四舍五入规则,而非样本量计算的特殊规则。
Why: 学生夸大了区间的结论;区间只给出合理值,不能证明相等。
Why: 学生认为没提就是随机的,但AP要求明确说明。