概率与随机变量 (Probability and Random Variables) — AP Statistics Stats 学习指南
适合谁:AP Statistics 参加 AP Statistics 的考生。
覆盖内容:基础概率规则、条件概率与独立性、离散与连续随机变量、随机变量的均值与标准差、二项与几何分布五大核心考点。
前置知识:Algebra 2、基础概率直觉。
关于练习题:下文「练习题」一节的所有题目均为我们按 AP Statistics 风格编写的原创题目 (original problems),仅用于教学。它们不是 College Board 真题的复制,措辞、数值或语境可能不同。请把它们当作练手用;评分细则请对照 College Board 官方 mark scheme。
1. 什么是概率与随机变量?
概率与随机变量是AP统计中量化随机现象的核心工具:概率 (probability) 是衡量不确定事件发生可能性的数值,范围在0到1之间;随机变量 (random variable) 则是将随机试验的结果映射为数值的函数,让你可以用代数方法分析随机现象。本单元对应AP Statistics CED第四单元,占考试总分的10%-20%,是后续抽样分布、置信区间、假设检验等统计推断内容的核心基础,选择题和自由问答题(FRQ)均会涉及。
2. 基础概率规则 (Basic Probability Rules)
首先明确三个核心定义:随机试验 (random experiment) 是可重复、结果不确定的操作(如掷骰子、抽卡片);样本空间 (sample space, S) 是随机试验所有可能结果的集合;事件 (event) 是样本空间的子集。 概率的三大公理是所有推导的基础:
- 非负性:任意事件A的概率
- 规范性:样本空间的概率
- 可加性:若A、B为互斥事件 (mutually exclusive event)(不可能同时发生),则 由公理可推导两个常用规则:
- 补集规则:事件A不发生的概率
- 一般加法规则:对任意两个事件, 范例:掷一枚公平骰子,事件A为掷出偶数(概率),事件B为掷出大于3的数(概率),两者交集为掷出4、6,概率,因此至少满足一个条件的概率 。
3. 条件概率与独立性 (Conditional Probability and Independence)
条件概率 (conditional probability) 是已知某事件B发生的前提下,另一事件A发生的概率,公式为: 独立事件 (independent event) 指一个事件的发生不影响另一个事件的发生概率,满足两个等价条件: 或 。 ⚠️ 考官常考辨析:互斥事件≠独立事件。互斥事件满足,除非或,否则不可能同时满足独立事件的条件,二者是完全不同的概念。 范例:从52张扑克牌中不放回抽2张,第一张抽中红桃的概率为,若第一张已经抽中红桃,第二张抽中红桃的概率为,因此两次抽牌结果不独立;若抽完放回,则两次抽牌独立,第二次抽中红桃的概率始终为。
4. 随机变量:离散与连续 (Random Variables — Discrete and Continuous)
随机变量通常用大写字母(如X、Y)表示,按取值类型分为两类:
- 离散随机变量 (discrete random variable):取值为有限个或可数无穷个孤立的数值,如掷骰子的点数、一小时内进店的顾客数,每个取值对应一个非零的概率,用概率分布表 (probability distribution table) 描述。
- 连续随机变量 (continuous random variable):取值为某一区间内的所有实数,如人的身高、公交车的等待时间,单个取值的概率为0,用概率密度函数 (probability density function, PDF) 计算区间内的概率,即PDF曲线下对应区间的面积。 范例:设X为掷两次骰子的点数和,取值为2到12的整数,属于离散随机变量;设Y为某地铁站的乘客等待时间,取值为0到15分钟的任意实数,属于连续随机变量。
5. 随机变量的均值与标准差 (Mean and SD of a Random Variable)
随机变量的均值 (mean) 也叫期望 (expectation, E(X)),是随机变量长期重复试验的平均取值:
- 离散随机变量的期望:,其中为X的所有可能取值,为对应概率。 方差 (variance, Var(X)) 衡量随机变量取值的离散程度,公式为: 其中,标准差 (standard deviation, SD(X)) 为方差的正平方根,即。 线性变换规则(考官高频考点):若a、b为常数,则: 注意:常数b不改变方差和标准差,只有系数a会放大/缩小离散程度。 范例:已知离散随机变量X的分布为,则,,,。
6. 二项分布与几何分布 (Binomial and Geometric Distributions)
这两类是AP统计中最常考的离散概率分布,需牢记适用条件和公式:
二项分布 (Binomial Distribution)
满足4个条件:①固定试验次数n;②每次试验独立;③每次只有两种结果(成功/失败);④每次成功的概率p固定。记为,其中X为n次试验中成功的总次数。 核心公式:
- 概率公式:,其中为组合数
- 期望:
- 方差:
几何分布 (Geometric Distribution)
满足条件:独立重复试验,直到第一次成功为止,记为,其中X为第一次成功时的总试验次数(AP统计统一采用该计数定义,不要和“第一次成功前的失败次数”混淆)。 核心公式:
- 概率公式:
- 期望:
- 方差: 范例:某射击运动员命中率为0.7,①射击10次,命中次数,期望,;②射击到第一次命中为止,总次数,,期望次。
7. 常见陷阱 (Common Pitfalls)
- 错误做法:认为互斥事件就是独立事件。原因:混淆两类事件的定义,误以为“不相关”就是“独立”。正确做法:互斥事件不能同时发生(),独立事件互不影响概率,除非某事件概率为0,否则二者不可能同时成立。
- 错误做法:计算连续随机变量的单个点概率。原因:把离散变量的计算逻辑套用到连续变量上。正确做法:连续变量单个点的概率为0,仅计算区间概率。
- 错误做法:线性变换时直接给标准差加常数,即。原因:忘记标准差衡量离散程度,常数不改变数据的离散度。正确做法:,常数b无影响。
- 错误做法:几何分布计数时把失败次数当成总次数,用计算期望。原因:不同教材几何分布定义不同,未记住AP的统一规则。正确做法:AP统计中几何分布X是第一次成功的总试验次数,期望为。
- 错误做法:计算条件概率时忽略的前提,分母为0仍代入公式。原因:只记公式忽略适用条件。正确做法:条件概率仅在已知事件B的概率大于0时有意义。
8. 练习题 (AP Statistics 风格)
习题1
某高中高二共200名学生,其中80人选修微积分,60人选修统计,25人同时选修两门课。 (1) 随机选1名学生,求至少选修一门课的概率; (2) 已知该学生选修了统计,求他也选修微积分的概率。
解答
(1) 用一般加法规则: (2) 用条件概率公式:
习题2
已知离散随机变量X的概率分布为,求和。
解答
先算X的期望和方差: , 用线性变换规则:
习题3
某咖啡店消费满额抽奖的中奖率为0.15,(1) 某顾客买4杯咖啡,求恰好中1次奖的概率;(2) 某顾客连续抽奖直到第一次中奖,求他抽了至少3次的概率。
解答
(1) 中奖次数: (2) 第一次中奖的总次数,抽至少3次等价于前2次都没中奖:
9. 速查表 (Quick Reference Cheatsheet)
| 类别 | 核心公式/规则 |
|---|---|
| 基础概率 | 补集: 一般加法: 互斥事件: |
| 条件概率与独立 | $P(A |
| 数字特征 | 离散期望: 方差: 线性变换: |
| 二项分布 | |
| 几何分布 |
10. 接下来怎么学
本单元是AP统计后续内容的核心基础,你接下来会学到的抽样分布、置信区间、假设检验等统计推断模块,全部依赖本单元的概率规则推导结论,掌握好本单元的公式和逻辑,能帮你大幅降低后续内容的学习难度。本单元考点在选择题中常考概念辨析和简单计算,在FRQ中常和统计推断结合出题,建议你多练不同场景的分布应用题。 如果在练习过程中遇到任何疑问,或者需要更多针对性的真题训练,随时可以到小欧主页提问,我们会为你提供个性化的辅导。