统计与概率 (Statistics and Probability) — IB Math AA HL AA HL 学习指南
适合谁:IB Math AA HL 参加 IB Math: Analysis & Approaches HL 的考生。
覆盖内容:覆盖描述性统计中心与离散程度度量、条件概率与独立事件、离散与连续分布(二项、正态)、HL专属贝叶斯定理、假设检验核心逻辑五大子主题。
前置知识:IGCSE / pre-DP 数学,熟悉证明与代数推导。
关于练习题:下文「练习题」一节的所有题目均为我们按 IB Math AA HL 风格编写的原创题目 (original problems),仅用于教学。它们不是 IBO 真题的复制,措辞、数值或语境可能不同。请把它们当作练手用;评分细则请对照 IBO 官方 mark scheme。
1. 什么是统计与概率?
统计与概率是量化随机现象、分析数据规律的数学分支,在IB AA HL考试中占总分的20%-25%,Paper1、2、3均有涉及,既有基础计算也有HL专属的应用题。核心分为两大模块:统计学聚焦数据的收集、描述、解读,概率学聚焦随机事件发生可能性的量化推导,二者结合构成了后续拓展统计方法的基础。
2. 描述性统计:中心与离散程度度量
描述性统计是统计分析的基础,核心分为**中心度量(measures of centre)和离散程度度量(measures of spread)**两类:
- 中心度量包含:众数(mode,出现频率最高的数值)、中位数(median,数据从小到大排列后中间位置的数值)、平均数(mean,所有数值的算术平均)。偏态数据优先用中位数,因为均值易受异常值影响,是考官常考的概念辨析点。
- 离散程度度量包含:极差(range,最大值减最小值)、四分位距(interquartile range, IQR,上四分位数减下四分位数)、方差(variance,)、标准差(standard deviation,方差的算术平方根)。
- 异常值(outlier)判断规则:小于或大于的数值。
范例:一组数据为[3,5,7,8,10,12,15],,,,则异常值阈值为和,该组数据无异常值。
3. 概率核心概念:条件概率与独立事件
核心定义首次出现标注英文:
- 样本空间(sample space):随机事件所有可能结果的集合;事件(event):样本空间的子集。
- 条件概率(conditional probability):事件B发生的前提下事件A发生的概率,公式为:
- 独立事件(independent events):两个事件的发生互不影响,满足,等价于。注意互斥事件(mutually exclusive events,)一定不独立(除非其中一个事件概率为0),是高频易错点。
范例:抛2枚公平硬币,A为“第一枚正面”,B为“第二枚正面”,,,,因此A、B为独立事件。
4. 离散与连续分布:二项分布、正态分布
随机变量分为离散型(取值可列)和连续型(取值为区间)两类,IB AA HL基础阶段要求掌握两种核心分布:
- 二项分布(binomial distribution,离散型):记为,n为独立重复试验次数,p为单次试验成功概率。期望,方差,取特定值的概率为。
- 正态分布(normal distribution,连续型):记为,为均值,为方差。标准化为标准正态分布的公式为: 考官常考正态分布的概率计算,需要熟练使用计算器的正态分布功能。
范例:已知,则。
5. HL专属:贝叶斯定理
贝叶斯定理(Bayes' theorem)是HL必考内容,用于计算“后验概率”,即已知结果反推原因的概率,公式基于条件概率和全概率公式推导而来: 其中是样本空间的一个划分,分母为全概率公式计算的。
范例:某疾病发病率为1%,患者检测阳性的概率为95%,健康人检测假阳性的概率为5%,则检测阳性时真患病的概率为:
6. 假设检验核心逻辑
假设检验(hypothesis testing)是用样本数据验证总体参数假设的统计方法,核心逻辑是“小概率事件反证法”:
- 设定零假设(null hypothesis, ,默认成立的假设)和备择假设(alternative hypothesis, ,要验证的假设)。
- 显著性水平(significance level, )是人为设定的小概率阈值,通常取5%、1%。
- p值(p-value)是成立时,得到观测结果或更极端结果的概率。若则拒绝,否则没有足够证据拒绝。
范例:工厂称产品合格率为99%,抽取100件产品有3件不合格,。,,计算得p值为,因此没有足够证据拒绝工厂的说法。
7. 常见陷阱 (Common Pitfalls)
- 错误:正态分布标准化时将方差直接代入公式,忘记开平方得到标准差。原因:记混正态分布记号,第二个参数是方差不是标准差。正确做法:代入前先对开平方,再计算。
- 错误:认为互斥事件就是独立事件。原因:混淆两个概念的定义。正确做法:互斥事件满足,独立事件满足,除非其中一个事件概率为0,否则互斥事件一定不独立。
- 错误:贝叶斯定理计算时只保留分子项作为分母,漏掉全概率的其他求和项。原因:忘记分母是所有可能原因导致B发生的概率之和。正确做法:先列全样本空间的所有划分,再分别计算每个划分对应的求和作为分母。
- 错误:拒绝就直接判定绝对成立。原因:误解假设检验的概率属性。正确做法:拒绝仅说明在当前显著性水平下有足够证据支持,不是100%成立,表述时要符合统计规范。
8. 练习题 (IB Math AA HL 风格)
题1
题干:已知一组学生考试分数的,,最高分为98,判断98是否为异常值。 解答:第一步计算四分位距;第二步计算上异常值阈值;第三步比较:98<112,因此98不是异常值。
题2
题干:三个抽屉,A抽屉有2支黑笔3支红笔,B抽屉有3支黑笔1支红笔,C抽屉有1支黑笔4支红笔,随机选一个抽屉(每个抽屉被选中的概率相等),再随机抽一支笔是黑笔,求选中的是A抽屉的概率。 解答:用贝叶斯定理: 代入数值:,,,,约掉公共项得:
题3
题干:某品牌手机续航时间服从正态分布,标称均值为20小时,随机抽取1台手机续航为12小时,在的单侧检验下,是否有足够证据说明标称均值偏高? 解答:第一步设定假设:,;第二步标准化:;第三步计算p值:;第四步结论:拒绝,有足够证据说明标称均值偏高。
9. 速查表 (Quick Reference Cheatsheet)
| 类别 | 核心公式/规则 | 备注 |
|---|---|---|
| 条件概率 | $P(A | B)=\frac{P(A \cap B)}{P(B)}$ |
| 独立事件 | 等价于$P(A | |
| 贝叶斯定理 | $P(A_i | B)=\frac{P(B |
| 二项分布 | 离散分布 | |
| 正态标准化 | ,第二个参数为方差 | |
| 假设检验 | 时拒绝 | 为显著性水平 |
10. 接下来怎么学
本章节是IB AA HL统计模块的基础,后续你还会学习泊松分布、t检验、卡方检验、线性回归等HL拓展内容,这些内容都建立在本次讲解的概率逻辑、分布性质、假设检验思路之上,占Paper3总分的近40%,需要熟练掌握核心公式和解题逻辑。 如果你在练习真题、梳理考点时有任何疑问,都可以随时到小欧提问,我们会为你提供个性化的解题思路和考点讲解。