离散随机变量 — AP 统计学
AP 统计学 · 第4单元:离散随机变量 · 14 min read
1. 什么是离散随机变量? ★☆☆☆☆ ⏱ 3 min
离散随机变量(DRV)是取可数个不同值的变量,每个取值都有对应的发生概率。与连续随机变量(在区间内取不可数无限个值)不同,离散随机变量的所有取值可以逐一列出。
离散随机变量相关题目占第4单元考试分值的10-15%,会出现在选择题和自由作答题部分。离散随机变量是AP考试中所有常见离散概率分布(包括二项分布和几何分布)的基础。
2. 概率分布(PMF与CDF) ★★☆☆☆ ⏱ 3 min
离散随机变量的概率分布称为概率质量函数(PMF)。它描述了离散随机变量的所有可能取值,以及变量取每个值的概率。对于离散随机变量$X$,PMF记为$p(x) = P(X = x)$。
一个有效的PMF必须满足两个核心要求:
- $0 \leq p(x) \leq 1$ for all possible $x$
- 所有可能$x$对应的$p(x)$之和等于1
\sum_{\text{all } x} p(x) = 1
累积分布函数(CDF)给出$X$小于等于某个特定值的概率:$F(x) = P(X \leq x)$。它简化了结果区间概率的计算:$P(a < X \leq b) = F(b) - F(a)$。
3. 期望值与方差 ★★☆☆☆ ⏱ 3 min
离散随机变量$X$的期望值(或称均值)记为$\mu_X = E(X)$,是我们无限多次重复随机过程后,预期观测到的$X$的长期平均值。期望值的公式为:
E(X) = \mu_X = \sum_{\text{all } x} x \cdot P(X=x)
方差记为$\sigma_X^2 = Var(X)$,衡量分布的离散程度,即$X$偏离均值的平均平方偏差。大多数AP考试题目使用的便于计算的公式为:
\sigma_X^2 = E(X^2) - [E(X)]^2 = \left(\sum_{\text{all } x} x^2 P(X=x)\right) - \mu_X^2
标准差$\sigma_X$是方差的平方根,它使用$X$的原始单位衡量离散程度,而方差的单位是原始单位的平方。
4. 离散随机变量的线性变换 ★★★☆☆ ⏱ 2 min
线性变换将随机变量$X$变换为新随机变量$Y = aX + b$,其中$a$和$b$是固定常数。常见例子包括单位换算,或在可变收益中增加固定费用。
- 期望值:$E(aX + b) = aE(X) + b$(恒成立)
- 方差:$Var(aX + b) = a^2 Var(X)$(恒成立)
常数$b$不影响方差,因为给所有$X$的取值加上$b$只是整体平移,分布的离散程度不变。只有乘以系数$a$会改变离散程度,且由于方差的单位是平方,因此需要对$a$取平方。
5. 组合独立离散随机变量 ★★★☆☆ ⏱ 3 min
如果已知一个随机变量的取值不会改变另一个随机变量的概率分布,则两个随机变量$X$和$Y$相互独立。我们可以组合独立离散随机变量,得到它们和或差的期望值与方差。
- 对任意常数$a, b$,$E(aX + bY) = aE(X) + bE(Y)$。该式恒成立,即使变量不独立也成立。
- 对于独立的$X$和$Y$,$Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)$。方差永远是相加的,即使计算两个变量的差也是如此:$Var(X-Y) = Var(X) + Var(Y)$。
Common Pitfalls
Why: 学生错误地将期望值的规则(期望的差等于差的期望)推广到方差。
Why: 期望值中$a$是一次方,因此学生错误地将这个规律带到方差中。
Why: 学生答题仓促,没有仔细阅读不等号。
Why: 学生混淆了长期平均值(期望值)和众数(最常见的结果)。
Why: 即使题目没有明确说明,学生也会自动假设变量独立。
Why: 学生忘记了所有概率之和为1这个基本要求。
Quick Reference Cheatsheet