| 学习指南 EN
统计学 · 探索双变量数据 · 阅读约 14 分钟 · 更新于 2026-05-11

AP统计学 相关性 — AP 统计学

AP 统计学 · 探索双变量数据 · 14 min read

1. 什么是相关性? ★★☆☆☆ ⏱ 3 min

相关性衡量两个定量变量之间线性关系的强度和方向。该内容占AP统计学考试总分的5-7%,会出现在选择题(MCQ)和自由问答题(FRQ)中,常以独立选择题形式考查,或是作为更长回归自由问答题的基础。

与回归斜率不同,$r$没有单位,因此任一变量改变单位或缩放都不会影响$r$的值。AP统计学大纲中本专题几乎只考查样本相关系数$r$。

2. 计算相关系数 ★★★☆☆ ⏱ 4 min

样本相关系数$r$有两种等价的常用公式,在AP考试中你都可能需要使用。

Z分数形式更直观:相关性是两个变量标准化Z分数乘积的平均值。

r = \frac{1}{n-1} \sum_{i=1}^n z_{x_i} z_{y_i}

适合自由问答题手动计算的等价离差形式为:

r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{(n-1)s_x s_y}

其中$\bar{x}, \bar{y}$是样本均值,$s_x, s_y$是样本标准差。分子捕捉了$x$和$y$偏离均值的同向性:如果两个变量都高于或都低于各自的均值,乘积为正,会拉高$r$;如果一个高于均值一个低于均值,乘积为负,会拉低$r$。

3. 相关系数的核心性质 ★★☆☆☆ ⏱ 3 min

AP统计学大多数相关性选择题都考查对这些核心性质的掌握,这些性质是得满分的关键:

  1. **取值范围**: $r$始终介于-1和1之间($-1 \leq r \leq 1$)。$r=1$是完全正线性关系,$r=-1$是完全负线性关系,$r=0$表示不存在线性关联。
  2. **线性变换不变性**: $r$不受给任一变量加常数或乘正常数的影响。改变单位永远不会改变$r$。
  3. **对称性**: x对y的相关系数等于y对x的相关系数,这一点和回归斜率不同。
  4. **仅衡量线性关系**: $r$仅衡量线性关联。即使两个变量之间存在强非线性关系,$r$也可以接近0。
  5. **对异常值敏感**: $r$对极端异常值非常敏感。单个异常值就可以让$r$大幅向0偏移或远离0。

4. 结合背景解读相关性 ★★★☆☆ ⏱ 3 min

AP自由问答题几乎总是要求你结合背景解读$r$的值,评分标准对满分有严格要求。要拿到所有分数,你的解读必须包含三个核心要素:(1) 关系的方向,(2) *线性*关系的强度,(3) 明确命名两个变量的背景。你必须明确提及线性关联才能避免扣分。

AP考试认可的强度划分通用标准为:$|r| > 0.7$ = 强,$0.3 < |r| < 0.7$ = 中等,$|r| < 0.3$ = 弱。

5. AP风格概念检测 ★★★☆☆ ⏱ 3 min

Common Pitfalls

Why: 学生混淆了"没有线性关联"和"完全没有关联"。强非线性关系的相关系数也可以是$r=0$。

Why: 观测性研究得到的相关性可以由潜在的第三变量解释。

Why: 学生混淆了相关性和分类数据的关联度量。相关性仅对定量变量有定义。

Why: 学生混淆了相关性和回归斜率,交换变量后回归斜率确实会改变。

Why: 相关性不是强度的线性尺度;从0到0.4的距离不等同于从0.4到0.8的距离。

Why: 学生忘记了$r$对极端异常值高度敏感,异常值可以大幅改变其值。

Quick Reference Cheatsheet

← 返回章节主页

某道题卡住了?
拍照或粘贴题目 — 小欧(我们的 AI 学习助手)会一步步讲解并配示意图。
免费试用小欧 →