双变量定量数据的表示 — AP 统计学
1. 双变量定量数据概述 ★☆☆☆☆ ⏱ 3 min
双变量定量数据由在同一观测单位上收集的两个不同定量变量的配对测量值组成。图形表示的核心目标是可视化两个变量之间的任何关联:一个变量的变化是否通常对应另一个变量的可预测变化?
这个基础主题属于AP统计学第2单元,占AP考试总分的5-7%,会同时出现在选择题(MCQ)和自由作答题(FRQ)部分。与聚焦单个变量分布的单变量数据不同,双变量表示法专门研究两个变量之间的关系。
2. 解释变量与响应变量 ★★☆☆☆ ⏱ 3 min
表示双变量定量数据的第一个关键步骤是根据两个变量在研究问题中的角色正确分类。角色由研究目标决定,而非变量本身。
Exam tip: 如果你不确定变量角色,寻找类似'用A预测B'的表述——A永远是解释变量,B永远是响应变量。
3. 散点图的绘制与解读 ★★☆☆☆ ⏱ 4 min
散点图是双变量定量数据的标准图形表示。每个观测单位由一个点表示,该点位于其$x$(解释变量)和$y$(响应变量)值的交点处。
- 用变量名称及其单位标记两个坐标轴
- 使用一致、合适的刻度以容纳所有数据点
- 准确绘制每个点
- 不要用线连接点(连线仅用于时间序列图,不适用于独立观测单位的标准散点图)
- *方向*:正方向 = $x$增大时,$y$通常增大;负方向 = $x$增大时,$y$通常减小;无方向 = 没有明确关联。
- *形状*:最常见的是线性或非线性(曲线形)。
- *强度*:强关联 = 点靠近整体模式;弱关联 = 点偏离整体模式,分布分散。
- *异常值*:任何远偏离关联整体模式的点。
Exam tip: 即使没有异常值,你也必须明确说明'没有明显异常值'才能在AP FRQ的描述题中获得满分。
4. 线性关联与非线性关联 ★★★☆☆ ⏱ 4 min
表示双变量数据时最重要的任务之一是区分线性和非线性关联,因为你后续学到的所有简单线性回归方法仅对线性关联产生有效结果。
你在考试中可能遇到的常见非线性模式包括:增速递增(凹向上,例如细菌种群随时间的增长)、增速递减(凹向下,例如作物产量随施肥量增加,在高施肥量时趋于平稳),以及U型或倒U型曲线。
Exam tip: 不要因为关联是正的就假设它是线性的。永远要检查趋势是否为直线,而不只是看它上升还是下降。
5. 概念检测 ★★☆☆☆ ⏱ 2 min
Common Pitfalls
Why: 学生认为任何变量都可以放在任何轴上,没有将坐标轴分配与研究问题关联起来。
Why: 学生将散点图与代数课的折线图或时间序列图混淆。
Why: 学生记得方向和强度,但忘记说明形状或明确指出没有异常值。
Why: 学生将极端值与偏离关联模式的异常值混淆。
Why: 学生将"非线性"与"变量之间无关系"混淆。
Why: 学生标记了变量但省略了单位,而单位是获得满分的必要条件。