AP 统计学 随机变量 — AP 统计学
1. 什么是随机变量? ★☆☆☆☆ ⏱ 2 min
随机变量(RV)是将随机过程每个可能结果映射到唯一数值的函数。将结果转换为数值让我们可以使用数学工具分析随机过程,这是所有统计推断的基础。AP统计学的约定是:大写字母($X$, $Y$)表示随机变量,小写字母($x$, $y$)表示具体观测值。遵循这个标记规则可以避免自由回答题(FRQs)中出现混淆。
2. 离散型和连续型概率分布 ★★☆☆☆ ⏱ 3 min
离散型随机变量的概率分布会列出每个可能值$x$以及对应的概率$P(X=x)$。离散分布满足以下两个条件才是有效的:(1) $0 \leq P(X=x) \leq 1$ 对所有$x$,(2) 所有概率之和等于1。
连续型随机变量使用概率密度函数(pdf)描述概率,事件的概率是感兴趣区间内pdf曲线下的面积。一个关键性质:对任意单个值$x$都有$P(X = x) = 0$,因此对任意$a < b$都有$P(a < X < b) = P(a \leq X \leq b)$。任何有效pdf的曲线下总面积都等于1。
Exam tip: 在AP自由回答题中,一定要明确陈述并验证两个有效性条件;跳过一个条件几乎一定会失分。
3. 离散随机变量的期望值和方差 ★★★☆☆ ⏱ 4 min
随机变量$X$的期望值(或均值),记为$E(X)$或$\mu_X$,是随机过程无限重复时$X$的长期平均值。对于离散随机变量,期望值计算公式为:
E(X) = \mu_X = \sum x \cdot P(X=x)
方差记为$Var(X)$或$\sigma_X^2$,衡量分布围绕期望值的离散程度。它是偏离均值平方的期望值。离散随机变量方差最简便的计算公式是:
Var(X) = \sigma_X^2 = E(X^2) - [E(X)]^2
其中$E(X^2) = \sum x^2 \cdot P(X=x)$。标准差$\sigma_X = \sqrt{Var(X)}$,单位和原随机变量相同(方差的单位是原单位的平方,和标准差不同)。AP统计学不要求手动计算连续型随机变量的$E(X)$或$Var(X)$,但你必须知道它们的含义。
Exam tip: 在自由回答题中,即使题目没有明确要求,也一定要结合背景解释期望值;这是很多学生错过的常见送分点。
4. 随机变量的线性变换 ★★★☆☆ ⏱ 3 min
线性变换将随机变量$X$转换为新随机变量$Y = aX + b$,其中$a$和$b$是固定常数。常见例子包括单位换算,或给随机收益增加固定费用。$Y$的均值和方差规则如下:
E(aX + b) = aE(X) + b
Var(aX + b) = a^2 Var(X)
\sigma_{aX + b} = |a| \sigma_X
直观理解:加上常数$b$会让$X$的所有值都移动相同幅度,因此均值也移动$b$,但不会改变离散程度。乘以$a$会让均值缩放$a$倍,方差缩放$a^2$倍,因为方差的单位是平方单位。这些规则对所有随机变量都成立,无论是离散还是连续型。
Exam tip: 千万不要把常数$b$放入方差计算中;常见错误是写成$Var(aX + b) = a^2 Var(X) + b^2$,这是错误的。
5. 组合独立随机变量 ★★★★☆ ⏱ 3 min
我们经常需要计算两个随机变量和或差的均值和方差,例如两个门店的总利润,或两个柜台等待时间的差。期望的线性性对*所有*随机变量都成立,无论是否独立:
E(X \pm Y) = E(X) \pm E(Y)
对于方差,加法规则仅当$X$和$Y$独立时成立(一个随机变量的结果不影响另一个的概率分布):
Var(X \pm Y) = Var(X) + Var(Y)
Exam tip: 当你遇到两个独立随机变量的差时,在做任何其他计算之前先写下方差相加,就能避免这个知识点最常见的错误。
Common Pitfalls
Why: 学生认为期望中的减号也适用于方差,但方差衡量的是离散程度,组合独立变量时离散程度总会增加。
Why: 学生混淆了离散和连续分布的规则,忘记了连续变量仅在区间上有非零概率。
Why: 学生混淆了期望的线性规则和方差规则。
Why: 学生赶进度做常规题,忘记了第二个必要条件。
Why: 题目不会总是明确提醒你需要独立性,因此学生默认该规则对所有随机变量都成立。