双变量数据探究 单元概述 — AP 统计学
1. 单元概览
我们将在你已掌握的单变量数据技能基础上,解答这类问题:学习时长越长是否与更高的考试分数相关?我们如何根据建筑面积预测房价?本单元遵循逻辑递进的学习路径:从关系可视化开始,接着测量关联强度、构建回归模型、评估模型拟合度,最后处理非线性数据、强影响点这类特殊情况,最终以分类变量的关联分析收尾。
Common Pitfalls
Why: 相关性仅衡量关联程度,即使很强的关联也可能由潜伏变量导致
Why: 由x预测y的回归线,和由y预测x的回归线并不相同
Why: 弱相关性仅代表不存在线性关系,不代表完全没有任何关系