有偏估计量与无偏估计量 — AP 统计学
AP 统计学 · 第5单元:抽样分布 · 14 min read
1. 核心概念:有偏估计量 vs 无偏估计量 ★★☆☆☆ ⏱ 3 min
估计量是用于估计未知总体参数的样本统计量。常见例子包括用样本比例$\hat{p}$估计总体比例$p$,用样本均值$\bar{x}$估计总体均值$\mu$。偏差描述了估计量抽样分布的中心距离总体真值有多远。
一个常见误区是认为偏差指单次估计的误差。实际上,偏差是整个抽样分布中心的属性,与单个样本的离散或误差无关。如果在无穷多个随机样本中,估计量的平均值等于真值,那么该估计量是无偏的;否则是有偏的。
2. 正式定义与偏差计算 ★★★☆☆ ⏱ 4 min
\text{Bias}(\hat{\theta}) = E(\hat{\theta}) - \theta
根据定义,当$E(\hat{\theta}) = \theta$时估计量无偏,即其抽样分布的均值恰好等于参数真值。正偏差估计量平均而言会高估真值,负偏差估计量平均而言会低估真值。
3. 常见的有偏与无偏估计量 ★★☆☆☆ ⏱ 3 min
AP考试要求你快速判断最常见估计量的偏差属性,不需要每道题都做完整的期望计算:
- **无偏估计量**:估计总体均值$\mu$的样本均值$\bar{x}$、估计总体比例$p$的样本比例$\hat{p}$、估计总体方差$\sigma^2$的样本方差$s^2$(除以$n-1$)
- **有偏估计量**:估计总体极差的样本极差、估计总体标准差$\sigma$的样本标准差$s$、估计总体最大值的样本最大值、估计总体方差$\sigma^2$的除以$n$的样本方差
即使样本方差是无偏的,样本标准差也是有偏的,因为平方根函数是非线性的,因此$E(\sqrt{s^2}) \neq \sqrt{E(s^2)}$。分母为$n$的样本方差存在小幅负偏差,意味着它平均而言会低估真实总体方差。
4. 有缺陷抽样方法导致的偏差 ★★★☆☆ ⏱ 4 min
偏差有两种来源:即使采用随机抽样,估计量本身也可能存在偏差;或是非随机/有缺陷抽样方法导致偏差。有偏抽样方法几乎总会产生有偏估计量,哪怕该估计量在简单随机抽样中本是无偏的。
Common Pitfalls
Why: 期望不保留平方根这类非线性变换,因此即使$s^2$无偏,$s$也不满足。
Why: 学生混淆了抽样分布中心的属性与单个样本的结果。
Why: 学生混淆了偏差(抽样分布的中心)与变异性(抽样分布的离散程度)。
Why: 学生混淆了偏差正式定义中减法的顺序。
Why: 学生记住了便利抽样有偏,但AP FRQ要求结合情境描述偏差方向才能拿满分。
Quick Reference Cheatsheet