| 学习指南 EN
统计学 · 阅读约 45 分钟 · 更新于 2026-05-13

斜率推断入门 — AP 统计学

AP 统计学 · AP 统计学 2019 CED · 45 min read

1. 总体斜率 vs 样本斜率 ★★☆☆☆ ⏱ 10 min

我们几乎永远无法获得整个总体所有$(x,y)$对的数据。我们收集随机样本,计算样本斜率$b_1$,并用它对未知的总体斜率$\beta_1$进行推断。我们通过考虑$b_1$的抽样变异性来得出关于总体的结论。

2. 斜率推断的条件 ★★★☆☆ ⏱ 15 min

斜率推断依赖于四个核心条件,必须在分析前进行验证。这些条件确保样本斜率的抽样分布服从我们用于推断的t分布。

  • **线性(Linear)**: $x$和$y$之间的真实关系是线性的(可通过残差图检查是否无曲线趋势)。
  • **独立(Independent)**: 观测值之间相互独立(不放回抽样时需满足样本量$n < 10\%$总体大小)。
  • **正态(Normal)**: 残差在回归线附近近似服从正态分布(可通过残差的正态概率图检查,或确认无强偏态/离群点)。
  • **等方差(Equal Variance)**: 所有$x$取值对应的残差离散程度恒定(可通过残差图检查是否无扇形扩散趋势)。

3. 斜率推断的假设 ★★★☆☆ ⏱ 12 min

我们几乎总是检验原假设:总体中$x$和$y$之间*不存在线性关系*,对应总体斜率为零。备择假设可以是双侧(不指定方向)或单侧(有方向的论断)。

H_0: \beta_1 = 0 \\ H_a: \beta_1 \neq 0 \quad (\text{two-sided}) \\ H_a: \beta_1 > 0 \text{ or } \beta_1 < 0 \quad (\text{one-sided})

4. 样本斜率的抽样分布 ★★★★☆ ⏱ 15 min

当四个LINE条件都满足时,样本斜率$b_1$的抽样分布近似正态,中心为真实总体斜率$\beta_1$。该分布的标准差由斜率的标准误$SE_{b_1}$估计,而标准误几乎总是由统计软件计算得到。

Common Pitfalls

Why: 回归线建模的是给定$x$时$y$的均值,而非$y$的个体值。

Why: $b_1$是从样本计算得到的已知值,我们不需要对已知值进行假设检验。假设永远是关于未知总体参数的。

Why: 斜率为零仅说明$x$和$y$之间不存在*线性*关系,仍然可能存在强曲线关系。

Why: 如果样本量超过总体的10%,观测值就不独立,标准误估计会不准确。

Quick Reference Cheatsheet

← 返回章节主页

某道题卡住了?
拍照或粘贴题目 — 小欧(我们的 AI 学习助手)会一步步讲解并配示意图。
免费试用小欧 →