卡方检验 (Chi-Squared Tests) — AP Statistics Stats 学习指南
适合谁:AP Statistics 参加 AP Statistics 的考生。
覆盖内容:卡方拟合优度检验、独立性与同质性检验、检验适用条件、卡方统计量与p值解读四大核心考点
前置知识:Algebra 2、基础概率直觉。
关于练习题:下文「练习题」一节的所有题目均为我们按 AP Statistics 风格编写的原创题目 (original problems),仅用于教学。它们不是 College Board 真题的复制,措辞、数值或语境可能不同。请把它们当作练手用;评分细则请对照 College Board 官方 mark scheme。
1. 什么是卡方检验?
卡方检验是一种非参数假设检验方法,核心逻辑是比较分类变量的观测频数与理论期望频数的差异,判断差异是否由随机误差导致,进而验证假设是否成立。检验采用的统计量服从分布,因此得名。
卡方检验是AP统计第8单元的核心内容,占卷面总分的10%~15%,选择题和自由回答题(FRQ)均会必考,通常会出现1道完整的FRQ大题。
2. 拟合优度检验(Goodness-of-fit test)
拟合优度检验用于验证单分类变量的观测分布是否符合某一预设的理论分布,比如检验骰子是否公平、某类商品的销量分布是否符合商家声称的比例等。
核心规则与公式
- 零假设:分类变量的分布符合理论分布;备择假设:不符合理论分布
- 自由度计算:,其中为分类数量,为检验前从样本中估计的参数数量(如检验正态分布时需估计均值和方差,,无参数估计时)
- 卡方统计量公式: 其中为观测频数(observed frequency),为期望频数(expected frequency),=总样本量×对应分类的理论比例。
小范例
掷一枚骰子60次,观测到6个面的次数分别为8、13、9、11、10、9,检验骰子是否公平():
- :骰子公平,每个面的概率为;:骰子不公平
- 每个分类的,
- 计算得
- 查表得>0.05,不拒绝,没有充分证据证明骰子不公平。
3. 独立性与同质性检验(Test of independence and homogeneity)
这两类检验均基于列联表(contingency table)计算,公式完全一致,仅适用场景不同:
- 独立性检验:验证同一总体的两个分类变量是否存在关联,比如检验学生性别和选课偏好是否相关
- 同质性检验:验证不同总体的同一分类变量分布是否一致,比如检验3个不同学校的学生选课偏好分布是否相同
核心规则与公式
- 自由度计算:,其中为列联表的行数,为列数
- 期望频数计算:每个单元格的
- 卡方统计量公式与拟合优度检验完全一致。
小范例
调查200名学生的性别和选课偏好,列联表如下:
| 选理科 | 选文科 | 行合计 | |
|---|---|---|---|
| 男 | 30 | 10 | 40 |
| 女 | 20 | 40 | 60 |
| 列合计 | 50 | 50 | 100 |
| 检验性别和选课是否独立(): |
- :性别与选课独立;:两者有关联
- ,男选理科的,同理其他单元格分别为20、30、30
- 计算得
- ,拒绝,有充分证据证明性别与选课偏好有关联。
4. 卡方检验的适用条件(Conditions for chi-squared)
只有满足以下三个条件时,卡方检验的结果才有效,考官会在FRQ中专门考察条件验证:
- 随机条件:数据来自随机抽样,或随机分组的对照实验,避免选择偏差
- 独立条件:观测值之间相互独立,若为不放回抽样,样本量不能超过总体的10%(10%条件)
- 大样本条件:所有单元格的期望频数,若存在的单元格,需合并相邻分类后再检验。
5. 卡方统计量与p值的解读(Interpreting test statistic and p-value)
- 卡方统计量的大小反映观测值与理论值的差异程度:统计量越大,差异越显著,越有理由拒绝零假设
- p值的含义:在零假设成立的前提下,得到当前或更大卡方统计量的概率。卡方检验均为右侧检验,只有差异足够大时才会拒绝零假设
- 判定规则:若(通常),则拒绝零假设;否则不拒绝零假设
考官常考误区:卡方检验无法证明零假设成立,只能说“没有充分证据拒绝零假设”,不要写“接受零假设”。
6. 常见陷阱 (Common Pitfalls)
- 错误:计算卡方统计量时分母用观测频数而不是期望频数。原因:记混公式结构。正确做法:牢记差异是相对于期望的偏离,分母一定是。
- 错误:独立性/同质性检验自由度取,和拟合优度检验混淆。原因:不理解自由度的来源。正确做法:两类列联表检验的自由度固定为。
- 错误:拟合优度检验自由度直接取,忽略估计的参数数量。原因:对考纲延伸考点不熟悉。正确做法:若用样本估计了正态分布的均值、方差等参数,要在基础上减去估计的参数数量。
- 错误:期望频数小于5时依然直接检验。原因:忽略大样本条件。正确做法:合并相邻的同类分类,确保所有单元格后再计算。
7. 练习题 (AP Statistics 风格)
习题1(拟合优度检验)
题干:某咖啡店声称四季饮品销量占比为春20%、夏40%、秋25%、冬15%,今年全年总销量为800杯,各季销量分别为春140、夏360、秋180、冬120。在的显著性水平下,检验商家的声称是否属实。 解答:
- :销量分布符合商家声称的比例;:不符合
- 计算各季期望频数:,,,,,所有,条件满足
- 计算卡方统计量:
- 查表得,拒绝,有充分证据证明商家的声称不属实。
习题2(独立性检验)
题干:调查300名高中生的手机使用习惯和近视情况,重度手机使用者中120人近视、30人不近视;非重度使用者中90人近视、60人不近视。检验手机使用习惯和近视是否独立()。 解答:
- :两者独立;:两者有关联
- ,计算各单元格:重度近视,其余分别为45、105、45,所有
- 计算得
- ,拒绝,有充分证据证明重度使用手机和近视有关联。
习题3(适用条件)
题干:某拟合优度检验有5个分类,其中1个分类的期望频数为3,其余均≥5,能否直接进行检验?如果不能该如何处理? 解答:不能直接检验,因为违反了大样本条件(所有)。可以将该分类与相邻的同类分类合并,合并后重新计算期望频数,确保所有后再进行检验。
8. 速查表 (Quick Reference Cheatsheet)
| 检验类型 | 自由度公式 | 适用场景 | 核心公式 | 判定规则 |
|---|---|---|---|---|
| 拟合优度检验 | (为估计参数数) | 单分类变量是否符合理论分布 | 时拒绝 | |
| 独立性/同质性检验 | 双变量关联/多总体分布比较 | 同上 | 同上 | |
| 通用适用条件 | 随机抽样/分组、观测独立(10%条件)、所有 | - | - | - |
9. 接下来怎么学
卡方检验是AP统计推断模块的最后一个核心考点,学完后你已经掌握了所有FRQ必考的推断方法,接下来可以重点练习历年真题的推断类综合题,区分z检验、t检验、卡方检验的适用场景,避免在考试中混用检验方法。同时可以针对性训练卡方检验的FRQ答题规范,确保条件验证、公式、计算、结论四个步骤完整,拿到全部分数。
如果你在练习卡方检验真题的过程中遇到任何疑问,或者需要更多针对性的练习题和考点解析,可以随时到小欧提问,我们会为你提供专属的答疑和备考规划服务。