| 学习指南 EN
统计学 · 探索单变量数据 · 阅读约 14 分钟 · 更新于 2026-05-11

定量数据的汇总统计 — AP 统计学

AP 统计学 · 探索单变量数据 · 14 min read

1. 汇总统计核心概述 ★★☆☆☆ ⏱ 3 min

汇总统计是用于浓缩单变量定量分布关键特征的数值,无需展示全部原始数据。本主题属于AP统计学第一单元,该单元占AP考试总分的15-20%,本子主题占总分的4-6%。

2. 中心测度 ★★☆☆☆ ⏱ 4 min

中心测度描述定量分布的典型或中心数值。AP考试中最常考查的三种中心测度是众数、中位数和均值。

\text{Sample Mean: } \bar{x} = \frac{\sum_{i=1}^n x_i}{n} \quad \quad \text{Population Mean: } \mu = \frac{\sum_{i=1}^N x_i}{N}

直观来说,均值是分布的平衡点,而中位数是将排序后数据分为相等两部分的第50百分位数。对于没有异常值的对称分布,优先选择均值;对于偏态分布或存在异常值的分布,优先选择具有耐抗性的中位数。

3. 离散测度 ★★★☆☆ ⏱ 5 min

离散测度(也称为变异性测度)描述定量分布中数值围绕中心的分散程度。AP考试中常考的离散测度有全距(极差)、四分位距(IQR)、方差和标准差。

全距计算公式为$\text{Range} = \text{Max} - \text{Min}$;计算简单但对异常值不具有耐抗性。IQR是排序后中间50%数据的离散程度,计算公式为$IQR = Q_3 - Q_1$,其中$Q_1$是第25百分位数(第一四分位数),$Q_3$是第75百分位数(第三四分位数)。IQR对异常值具有耐抗性,因此偏态数据中它与中位数搭配使用。

\text{Population Variance: } \sigma^2 = \frac{\sum_{i=1}^N (x_i - \mu)^2}{N} \quad \quad \text{Sample Variance: } s^2 = \frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}

样本方差中的$n-1$就是贝塞尔校正,它可以减少从样本估计总体方差时的偏差。标准差是方差的平方根,将单位转换回原始数据的单位。直观来说,标准差描述观测值距离均值的典型距离。它不具有耐抗性,因此在没有异常值的对称分布中与均值搭配使用。

4. 五数概括与异常值检测 ★★★☆☆ ⏱ 4 min

五数概括是一组包含五个汇总值的集合,描述了分布的全范围和中心:$\text{Minimum}, Q_1, \text{Median}, Q_3, \text{Maximum}$。它是箱线图和AP标准异常值检测方法(1.5×IQR法则)的基础。

1.5×IQR法则定义了两个异常值边界:任何小于$Q_1 - 1.5 \times IQR$或大于$Q_3 + 1.5 \times IQR$的数值都被归类为潜在异常值。除非题目明确指定其他方法,否则这是AP考试唯一接受的异常值检测方法。

Common Pitfalls

Why: 学生混淆了总体和样本公式,忘记无偏样本统计量需要贝塞尔校正。

Why: 学生答题仓促,直接使用题目给出的未排序顺序。

Why: 学生默认使用更熟悉的均值/标准差,没有检查分布形状。

Why: 四分位数有多种计算方法,但AP使用排除中位数法,包含中位数会得到错误的IQR。

Why: 学生默认任何极端值自动就是异常值。

Quick Reference Cheatsheet

← 返回章节主页

某道题卡住了?
拍照或粘贴题目 — 小欧(我们的 AI 学习助手)会一步步讲解并配示意图。
免费试用小欧 →