AP 统计学 变量 — AP 统计学
1. 什么是变量?核心记号 ★☆☆☆☆ ⏱ 3 min
在统计学中,变量是指可以针对研究总体或样本中的每个个体或单位进行测量或记录的任何特征、数量或属性,其值在不同单位之间变化。掌握变量分类是基础,因为变量类型决定了哪些图表和汇总统计量适用于分析。
X, Y \text{ (generic variable)}, \quad x_i \text{ (}i\text{-th observed value)}
本主题是 AP 统计学 CED 中的学习目标 1.1,占第 1 单元权重的约 12%,而第 1 单元占你 AP 考试总分的 15-23%。变量分类问题既会出现在选择题中,也会作为简答题的开篇步骤出现。
2. 分类变量 vs 定量变量 ★★☆☆☆ ⏱ 4 min
最基础的变量分类将变量分为两种核心类型:
- **分类(定性):** 根据属性将单位分到不同组,不测量有意义的数值。
- **定量:** 以数值测量,数值代表计数或测量,算术运算(如求平均)会得到有意义的结果。
Exam tip: 当 AP 考试给你一个以数字记录的变量时,在将其分类为定量变量之前,一定要进行「有意义均值」检验。90% 的陷阱分类题都考察数值型分类变量。
3. 离散 vs 连续 定量变量 ★★☆☆☆ ⏱ 3 min
将变量分类为定量后,你必须进一步将其分为离散或连续,因为这会影响你后续课程中使用的概率模型和图表。
Exam tip: 即使连续变量被四舍五入为整数,它仍然是连续变量。例如,四舍五入到最近年份的年龄仍然是连续变量。
4. 测量水平 ★★★☆☆ ⏱ 3 min
测量水平是基于变量值的统计性质进一步分类,它决定了哪些运算有效。AP 选择题中偶尔会考察四种水平:
- **名义(Nominal):** 类别之间没有固有顺序的分类变量。例子:眼睛颜色、饮品类型。
- **顺序(Ordinal):** 有明确固有顺序,但相邻类别之间的间隔不相等的分类/排序变量。例子:1-5星电影评分、教育水平。
- **区间(Interval):** 差值有意义,但没有真实零点的定量变量(零不代表该量不存在)。例子:摄氏度或华氏度温度。
- **比率(Ratio):** 有真实零点的定量变量,因此值的比率是有意义的。大多数定量变量都是比率水平。
Exam tip: 你在 AP 考试中会遇到的唯一常见区间水平变量是摄氏度或华氏度的温度。所有其他定量变量几乎都是比率水平;如果你不确定,比率是最可能的正确答案。
5. AP 风格概念检测 ★★☆☆☆ ⏱ 2 min
Common Pitfalls
Why: 学生假设所有数字都是定量的,忘记分类取决于数字测量的内容,而不是它的书写形式。
Why: 学生混淆了变量的记录方式和变量的本质属性。
Why: 学生忘记比率水平要求真实零点,假设所有定量变量自动都是比率水平。
Why: 许多调查使用1-5评分,因此学生假设评分之间的间隔相等并计算均值。顺序变量没有相等间隔,因此均值在统计上没有意义。
Why: 顺序变量会被分配数字表示排名,因此学生误认为它们是定量变量。