什么是统计学? — AP 统计学
AP 统计学 · 探索单变量数据 · 14 min read
1. 统计学的核心定义 ★☆☆☆☆ ⏱ 3 min
统计学是在自然变异存在的情况下,通过收集、整理、分析、解读和呈现数据来回答问题并做出决策的科学。与通常处理固定、确定值的纯数学不同,统计学本质上需要考虑不确定性和变异,因此所有结论都需要结合情境并考虑误差。本主题是AP统计学第一单元的基础,第一单元占AP考试总分的15-20%,其相关概念几乎出现在每一道考题中。
2. 总体、样本、参数和统计量 ★★☆☆☆ ⏱ 4 min
几乎所有统计工作的核心目标都是:在不测量大群体中每个个体的情况下,了解该群体的信息。AP统计学遵循严格的符号约定,这在考试中会反复考察。
Exam tip: 如果自由作答题(FRQ)要求你用正确符号识别参数或统计量,混淆希腊/拉丁字母或不对$\hat{p}$添加hat记号都会失分。一定要先确认你的数值描述的是整个总体还是仅为样本。
3. 数据分类:分类数据 vs 定量数据 ★★☆☆☆ ⏱ 4 min
识别总体和样本后,下一个关键步骤是对数据类型分类,因为不同数据类型需要不同的图表、汇总方法和分析方式。有一个简单的检验可以解决大多数分类困惑。
Exam tip: 如果你在对有序数据分类时卡住了,请记住:即使有顺序,有序数据也始终是分类数据。只有当变量是你所研究特征的直接计数或测量时,才将其分类为定量数据。
4. 个体与变量 ★☆☆☆☆ ⏱ 3 min
每个数据集都由两个核心组成部分构成,正确识别它们是任何统计分析的第一步。AP考试题目经常考察这项技能,以确认你理解研究情境。
单变量数据(第一单元的核心)指我们对每个个体恰好测量一个变量,我们只研究该变量的分布(它取哪些值,各取值的频率)。双变量数据对每个个体测量两个变量,以研究两个变量之间的关系,这在后面的单元中讲解。
Exam tip: 当题目问数据集是单变量还是双变量时,统计每个个体测量了多少个特征。一个特征就是单变量,两个特征就是双变量,和个体数量无关。
Common Pitfalls
Why: 学生认为所有数值都是定量的,忽略了算术运算必须得到有意义结果这个要求
Why: 学生忘记了希腊字母对应总体、拉丁字母对应样本的规则,混淆了数值描述的群体
Why: 学生混淆了数据的来源和研究想要了解的群体
Why: 学生混淆了顺序和数值测量,认为任何有序特征都是定量的
Why: 在练习题中使用给定的参数,会导致学生对实际研究产生错误的假设
Quick Reference Cheatsheet