Further Statistics (Further Statistics) — A-Level Further Mathematics 学习指南

适合谁：A-Level Further Mathematics 参加 Further Mathematics 的考生。

覆盖内容：连续随机变量与概率密度函数、均值的置信区间与假设检验、卡方拟合优度与列联表检验、非参数检验、概率生成函数五大核心考纲考点。

前置知识：扎实的 A-Level Mathematics Pure Mathematics 1, 2, 3 基础。

关于练习题：下文「练习题」一节的所有题目均为我们按 A-Level Further Mathematics 风格编写的原创题目 (original problems)，仅用于教学。它们不是 Cambridge International 真题的复制，措辞、数值或语境可能不同。请把它们当作练手用；评分细则请对照 Cambridge 官方 mark scheme。

1. 什么是进阶统计（Further Statistics）？

进阶统计是A-Level Further Mathematics进阶数学的统计核心板块，难度高于普通A Level数学（A-Level Mathematics）的统计内容，主要教授面向实际场景的高级统计推断方法，为大学数理、商科、社科的专业统计课程打基础。本板块在进阶数学试卷中占比约25%，通常以2-3道大题的形式出现，要求你既能掌握公式推导，也能灵活应用方法解决真实数据问题。

2. 连续随机变量与概率密度函数（Continuous random variables and PDFs）

连续随机变量（continuous random variable, CRV）指取值落在某一连续区间的随机变量，不能用离散的概率质量函数描述，而是通过概率密度函数（probability density function, PDF） 描述分布规律，记为 $f (x)$ ，需满足三个核心性质：

对所有 $x$ ， $f (x) \geq 0$ （PDF取值非负）
全区间积分和为1： $\int_{- \infty}^{\infty} f (x) d x = 1$
区间概率等于区间积分： $P (a < X < b) = \int_{a}^{b} f (x) d x$

衍生统计量计算公式：期望 $E (X) = \int_{- \infty}^{\infty} x f (x) d x$ ，方差 $V a r (X) = E (X^{2}) - [E (X)]^{2} = \int_{- \infty}^{\infty} x^{2} f (x) d x - (\int_{- \infty}^{\infty} x f (x) d x)^{2}$

范例：已知连续随机变量 $X$ 的PDF为 $f (x) = k x (2 - x), 0 \leq x \leq 2$ ，其余区间为0，求参数 $k$ 。代入全区间积分等于1： $\int_{0}^{2} k (2 x - x^{2}) d x = k [x^{2} - \frac{x ^{3}}{3}]_{0}^{2} = k (4 - \frac{8}{3}) = \frac{4 k}{3} = 1 ⟹ k = \frac{3}{4}$

3. 推断：均值的置信区间与假设检验（Inference — confidence intervals and tests for the mean）

本考点核心是用样本数据推断总体均值的取值范围或验证关于均值的假设，分两类场景：

总体方差 $σ^{2}$ 已知：使用Z检验，检验统计量为 $Z = \frac{x ˉ - μ _{0}}{σ / n}$ ， $100 (1 - α) %$ 置信区间为： $\overset{x}{ˉ} \pm z_{α /2} \frac{σ}{n}$ 其中 $z_{α /2}$ 是标准正态分布的双侧临界值，比如95%置信度下 $z_{α /2} = 1.96$ 。
总体方差未知：大样本（ $n \geq 30$ ）用样本方差 $s$ 近似 $σ$ ，仍用Z检验；小样本需使用t检验，自由度 $df = n - 1$ ，检验统计量为 $t = \frac{x ˉ - μ _{0}}{s / n}$ ，置信区间为： $\overset{x}{ˉ} \pm t_{n - 1, α /2} \frac{s}{n}$ 考官常考场景判断，你需要优先看总体方差是否已知，再看样本量大小，选择对应方法。

4. 卡方检验：拟合优度与列联表（Chi-squared tests — goodness-of-fit and contingency）

卡方检验（chi-squared test）是检验观测数据与理论预期是否一致的非参数方法，A-Level考两类应用：

拟合优度检验：验证样本是否服从某一已知分布（二项、泊松、正态等）
列联表检验：验证两个分类变量是否相互独立

两类检验的核心统计量均为： $χ^{2} = \sum \frac{( O - E ) ^{2}}{E}$ 其中 $O$ 是观测频数， $E$ 是理论预期频数。自由度规则：拟合优度检验自由度为 $k - m - 1$ （ $k$ 是类别数， $m$ 是从样本估计的参数个数）；列联表自由度为 $(r - 1) (c - 1)$ （ $r$ 是行数， $c$ 是列数）。注意高频考点：如果某一类别预期频数 $E < 5$ ，必须与相邻类别合并，否则检验结果无效，合并后需重新计算自由度。

5. 非参数检验（Non-parametric tests）

非参数检验不需要假设总体服从特定分布，适合小样本、不满足正态分布的场景，A-Level要求掌握两类：

符号检验（sign test）：仅考虑配对差值的正负符号，检验中位数是否等于给定值，适用于差值大小不可靠的场景
威尔科克森符号秩检验（Wilcoxon signed-rank test）：同时考虑差值的大小和符号，检验效率高于符号检验

两类检验的逻辑一致：计算检验统计量后与对应显著性水平的临界值比较，若统计量小于临界值则拒绝原假设。

6. 概率生成函数（Probability generating functions）

概率生成函数（probability generating function, PGF）是描述离散随机变量分布的工具，定义为： $G_{X} (t) = E (t^{X}) = x \sum P (X = x) t^{x}$ 核心性质：

$G_{X} (1) = 1$ （所有概率和为1）
期望： $E (X) = G_{X}^{'} (1)$ （一阶导数在 $t = 1$ 处的取值）
方差： $V a r (X) = G_{X}^{''} (1) + G_{X}^{'} (1) - [G_{X}^{'} (1)]^{2}$
独立随机变量和的PGF等于各自PGF的乘积： $G_{X + Y} (t) = G_{X} (t) G_{Y} (t)$

范例：泊松分布 $X \sim P o (λ)$ 的PGF为 $G (t) = e^{λ (t - 1)}$ ，求期望： $G^{'} (t) = λ e^{λ (t - 1)}$ ，代入 $t = 1$ 得 $E (X) = λ$ ，与已知结论一致。

7. 常见陷阱（Common Pitfalls）

错误：直接将PDF的取值 $f (x)$ 当作概率，或者用 $f (x)$ 乘区间长度近似概率。原因：混淆了连续变量PDF和离散变量PMF的定义，PDF的取值可以大于1，只有积分结果是概率。正确做法：所有连续变量的区间概率必须用积分计算。
错误：卡方检验时不合并 $E < 5$ 的类别，直接计算统计量。原因：未记住卡方检验的适用条件， $E$ 过小会导致统计量偏离卡方分布，结果失效。正确做法：所有 $E < 5$ 的类别与相邻类别合并后再计算，同步调整自由度。
错误：小样本t检验的自由度取 $n$ 而不是 $n - 1$ 。原因：混淆了Z检验和t检验的自由度规则，样本方差用 $n$ 个数据估计，损失了1个自由度。正确做法：方差未知的小样本均值检验，自由度始终为 $n - 1$ 。
错误：用PGF计算方差时漏掉 $G_{X}^{'} (1)$ 项。原因：记错方差公式， $E (X^{2}) = G_{X}^{''} (1) + G_{X}^{'} (1)$ ，不是仅等于二阶导数。正确做法：牢记方差公式为 $V a r (X) = G^{''} (1) + G^{'} (1) - [G^{'} (1)]^{2}$ 。

8. 练习题（A-Level Further Mathematics风格）

题1

连续随机变量 $X$ 的PDF为 $f (x) = \frac{3}{8} (x^{2} + 1), 0 \leq x \leq 2$ ，其余区间为0，求 $P (0.5 < X < 1.5)$ 。解答：直接计算区间积分： $\int_{0.5}^{1.5} \frac{3}{8} (x^{2} + 1) d x = \frac{3}{8} [\frac{x ^{3}}{3} + x]_{0.5}^{1.5} = \frac{3}{8} [(1.125 + 1.5) - (0.0417 + 0.5)] = \frac{25}{32} \approx 0.781$

题2

随机抽取10名学生的数学成绩，样本均值为78分，样本标准差为6分，假设成绩服从正态分布，求总体均值的95%置信区间。解答：总体方差未知、小样本，使用t检验，自由度 $df = 9$ ，95%双侧临界值 $t_{9, 0.025} = 2.262$ ，置信区间为： $78 \pm 2.262 \times \frac{6}{10} \approx 78 \pm 4.27 ⟹ (73.7, 82.3)$

题3

几何分布 $X \sim G eo (p)$ 的PGF为 $G (t) = \frac{pt}{1 - ( 1 - p ) t}$ ，用PGF求 $E (X)$ 。解答：对PGF求一阶导数： $G^{'} (t) = p \cdot \frac{( 1 - ( 1 - p ) t ) + t ( 1 - p )}{[ 1 - ( 1 - p ) t ] ^{2}} = \frac{p}{[ 1 - ( 1 - p ) t ] ^{2}}$ 代入 $t = 1$ 得 $E (X) = G^{'} (1) = \frac{p}{p ^{2}} = \frac{1}{p}$ ，与已知结论一致。

9. 速查表（Quick Reference Cheatsheet）

考点	核心规则与公式
连续随机变量PDF	$f (x) \geq 0, \int_{- \infty}^{\infty} f (x) d x = 1, P (a < X < b) = \int_{a}^{b} f (x) d x$ $E (X) = \int x f (x) d x, V a r (X) = \int x^{2} f (x) d x - [E (X)]^{2}$
均值推断	方差已知： $Z = \frac{x ˉ - μ}{σ / n}$ ，置信区间 $\overset{x}{ˉ} \pm z_{α /2} \frac{σ}{n}$ 方差未知小样本： $t = \frac{x ˉ - μ}{s / n}, df = n - 1$
卡方检验	$χ^{2} = \sum \frac{( O - E ) ^{2}}{E}$ ，拟合优度 $df = k - m - 1$ ，列联表 $df = (r - 1) (c - 1)$ ， $E < 5$ 需合并
非参数检验	符号检验仅看差值正负，Wilcoxon检验同时考虑差值大小与秩，无分布假设
概率生成函数	$G_{X} (t) = E (t^{X}), G (1) = 1, E (X) = G^{'} (1), V a r (X) = G^{''} (1) + G^{'} (1) - [G^{'} (1)]^{2}$ 独立变量和： $G_{X + Y} (t) = G_{X} (t) G_{Y} (t)$

10. 接下来怎么学

本板块是A-Level Further Mathematics进阶统计的核心基础，后续你如果接触更复杂的回归分析、多元统计等内容，本章节的推断逻辑、分布工具都是核心前置知识。考试中本板块通常占15-20分的大题，你需要重点练习不同方法的场景判断、计算步骤的完整性，避免低级错误。如果你在刷题过程中遇到任何考点疑问、真题不会解，都可以随时到小欧提问，我们会给你针对性的讲解和配套练习。

本指南内容对齐 CIE 剑桥国际 AS & A Level 进阶数学 9231 考纲。OwlsAi 与 Cambridge Assessment International Education 无附属关系。