连续随机变量 — AP 统计学
AP 统计学 · 第4单元:概率、随机变量和概率分布 · 14 min read
1. 什么是连续随机变量? ★★☆☆☆ ⏱ 2 min
与只能取不同、可数值的离散随机变量不同,连续随机变量可以在一个或多个实数区间内取任意数值。常见的实际例子包括身高测量、完成任务的时间,或容器中液体的体积。
本主题约占AP统计学考试总分的3.5-5%,是选择题(MCQ)和自由作答题(FRQ)部分都会出现的正态分布和推断问题的基础。
2. 概率密度函数(PDF) ★★☆☆☆ ⏱ 3 min
对于连续随机变量,概率用概率密度函数(PDF)曲线下的面积衡量,记为$f(x)$。
- $f(x) \geq 0$ for all $x$ in the domain of $X$
- $f(x)$在整个定义域上的总面积等于1:
\int_{-\infty}^{\infty} f(x) dx = 1
要找到$X$落在$a$和$b$之间的概率,计算$f(x)$在这两个界之间的面积:
P(a \leq X \leq b) = \int_{a}^{b} f(x) dx
因为对于任意单个值$c$都有$P(X = c) = 0$,所以不等式符号不会改变结果:$P(a \leq X \leq b) = P(a < X < b)$。
Exam tip: 当被要求验证PDF是否有效时,必须明确检查两个条件(非负性和总面积 = 1)。如果你只检查总面积条件,AP阅卷老师会扣分。
3. 累积分布函数(CDFs) ★★★☆☆ ⏱ 4 min
连续随机变量$X$的累积分布函数(CDF)记为$F(x)$,它给出$X$小于等于特定值$x$的概率。
CDF简化了概率计算:对于任意$a < b$,$P(a \leq X \leq b) = F(b) - F(a)$。你也可以通过微分从CDF得到PDF:在$F(x)$可导的所有点都有$f(x) = F'(x)$。
Exam tip: 必须将CDF写成覆盖所有实数$x$的分段函数,而不仅仅是PDF非零的区间。AP阅卷老师要求写出完整定义域才能给满分。
4. 连续随机变量的期望和方差 ★★★☆☆ ⏱ 4 min
连续随机变量的期望和方差公式与离散情况类似,只是用积分代替了对离散结果的求和。
期望的线性性对连续随机变量和离散随机变量同样成立:对于任意常数$a$和$b$,$E(aX + b) = aE(X) + b$。
Exam tip: 记住口诀:'X平方的期望减去期望的平方',避免混淆方差简化公式中项的顺序。方差不可能为负,因此如果你得到负值,说明你把项的顺序弄反了。
5. 连续均匀分布 ★★☆☆☆ ⏱ 3 min
连续均匀分布是最简单的连续分布,定义域内所有长度相同的区间发生的概率相等。
Exam tip: 不要浪费时间对均匀分布概率积分。使用矩形面积的简便方法可以节省时间,避免考试中出现积分错误。
Common Pitfalls
Why: 学生将连续概率密度函数与输出为概率的离散概率质量函数混淆。
Why: 学生把处理离散随机变量的习惯带到了连续随机变量上。
Why: 学生混淆了均匀分布的离散形式和连续形式。
Why: 考试中赶时间时,学生混淆了简化公式中项的顺序。
Why: 学生只关注PDF非零的区间,忘记CDF必须对所有实数都有定义。
Quick Reference Cheatsheet