统计与概率 (Statistics and Probability) — IB Math AA SL AA SL 学习指南
适合谁:IB Math AA SL 参加 IB Math: Analysis & Approaches SL 的考生。
覆盖内容:覆盖描述性统计、条件与独立概率、二项与正态分布基础、线性回归与相关性四大考纲要求子主题
前置知识:IGCSE / pre-DP 数学。
关于练习题:下文「练习题」一节的所有题目均为我们按 IB Math AA SL 风格编写的原创题目 (original problems),仅用于教学。它们不是 IBO 真题的复制,措辞、数值或语境可能不同。请把它们当作练手用;评分细则请对照 IBO 官方 mark scheme。
1. 什么是统计与概率?
统计与概率是IB AA SL中偏向应用的核心板块,占paper1、paper2总分的20%-25%,多以情景应用题形式出现,得分性价比极高。其中统计(statistics)是通过收集、整理、分析样本数据,推断总体特征的方法;概率(probability)是量化随机事件发生可能性的数学工具,二者结合解决实际生活中的不确定性问题。本板块考题对计算能力要求不高,核心是概念辨析和GDC(图形计算器)操作的熟练度。
2. 描述性统计 (Descriptive Statistics)
描述性统计是对原始数据的特征提取方法,核心分为集中趋势和离散程度两类指标,考官常考异常值判定和分组数据计算。
- 集中趋势指标:平均数(mean, )、中位数(median, 排序后中间位置的数值)、众数(mode, 出现频率最高的数值);分组数据均值公式为,其中是组频数,是组中点。
- 离散程度指标:四分位数间距(interquartile range, ,为下四分位数、为上四分位数)、方差(variance, )、标准差(standard deviation, )。
- 异常值(outlier)判定规则:数值小于,或大于即可判定为异常值,统计分析时可酌情剔除。
范例:数据组,,,,异常值边界为和,因此该组无异常值,均值为。
3. 概率:条件概率与独立事件 (Probability — Conditional, Independent)
本章节核心是概率的基本运算规则,常结合树状图考应用题。
- 基础概率:事件的概率,为样本空间总事件数,。
- 条件概率(conditional probability):已知事件发生的前提下,事件发生的概率,公式为:
- 独立事件(independent events):事件发生与否不影响的发生概率,满足,等价于、。
- 加法公式:,互斥事件满足。
范例:袋中有3红2蓝共5个球,不放回抽2次,求第一次抽红球的前提下第二次也抽红球的概率。设为第一次抽红,为第二次抽红,,,因此,符合直观:第一次抽走红球后剩余2红2蓝,抽红概率为。
4. 二项分布与正态分布 (Basics)
本章节是统计的核心考点,IB允许用GDC直接计算概率,无需手动套公式,重点是掌握分布记号和适用场景。
- 二项分布(binomial distribution):适用于次独立重复的伯努利试验,每次成功概率为,成功次数服从,核心公式: 其中为期望,为方差。
- 正态分布(normal distribution):连续型对称钟形分布,记为,为均值,为方差,标准化公式为,为标准正态变量。常用的68-95-99.7法则:约68%的数据落在区间,95%落在区间,99.7%落在区间。
范例:已知,求。计算得,直接用GDC的二项累积分布功能可快速得到结果。
5. 线性回归与相关性 (Linear Regression and Correlation)
本章节考察两个连续变量的线性关系,常出现在paper2的大题第一问。
- 皮尔逊积矩相关系数(Pearson's product-moment correlation coefficient, ):衡量两个变量线性相关的强度和方向,取值范围为:为强正线性相关,为强负线性相关,为无线性相关(可能存在曲线相关)。
- 对的线性回归方程(linear regression line of y on x):,其中为斜率,为截距,仅当足够大(通常)时,用该方程预测才有效,且不能外推超出样本的取值范围。
范例:学习时长(小时)和测验分数的相关系数,回归方程为,则学习4小时的预测分数为分。
6. 常见陷阱 (Common Pitfalls)
- 错误:混淆和,直接用作为条件概率的分子。原因:记混条件概率定义,误将所有事件默认独立。正确做法:永远先写条件概率公式,分子是两个事件的交集概率,分母是条件事件的概率。
- 错误:正态分布记号写错,将写成。原因:混淆方差和标准差的记号。正确做法:正态分布第二个参数是方差,写的时候注意带平方,计算Z值时用标准差做分母。
- 错误:二项分布计算时,直接用GDC算再用1减。原因:搞反离散分布累积概率的不等号方向。正确做法:离散分布中,选GDC功能时注意上下限的设置。
- 错误:相关系数时直接判定两个变量无关联。原因:混淆线性相关和广义关联。正确做法:接近0仅说明没有线性相关,可能存在二次、指数等曲线关联,不能直接下无关结论。
7. 练习题 (IB Math AA SL 风格)
题1
某班15名学生的数学测验分数为:45, 52, 58, 62, 65, 67, 71, 73, 75, 77, 80, 82, 86, 91, 95。 (a) 求该组数据的中位数、、和; (b) 判断是否存在异常值。 解答: (a) ,中位数为排序后第8个值:73;为前7个数的中位数(第4个):62;为后7个数的中位数(第12个):82;。 (b) 异常值下边界:,上边界:,所有数据均在边界范围内,无异常值。
题2
已知事件和满足,,。 (a) 求; (b) 判断和是否为独立事件。 解答: (a) 由加法公式:,代入得,解得。 (b) 独立事件满足,因此和是独立事件。
题3
成年男性身高服从正态分布(单位:cm)。 (a) 求随机抽取1名成年男性身高超过180cm的概率; (b) 求身高落在169cm到181cm之间的概率。 解答: 方差,因此标准差。 (a) 标准化得,。 (b) 169的Z值为,181的Z值为,因此,符合68-95-99.7法则。
8. 速查表 (Quick Reference Cheatsheet)
| 类别 | 核心公式/规则 |
|---|---|
| 描述性统计 | 分组均值;;异常值:或 |
| 概率 | 条件概率$P(A |
| 二项分布 | ;; |
| 正态分布 | ;标准化;68-95-99.7法则 |
| 回归与相关 | ;对回归方程,仅$ |
9. 接下来怎么学
本板块是IB AA SL中少有的低门槛高得分板块,后续你会在paper2的综合题中遇到它和函数、数列结合的考法,只要理清概念、熟练GDC操作就能拿到80%以上的分数。建议学完本指南后,刷近3年的IB统计概率真题,重点练GDC的分布计算功能,提升做题速度。 如果你在刷题过程中遇到任何考点疑问、真题不会解,都可以随时到小欧提问,我们会为你提供针对性的讲解和练习资源。