二项分布的参数 — AP 统计学
1. 什么是二项参数? ★★☆☆☆ ⏱ 3 min
二项分布是一种离散概率分布,用于对固定序列的独立是非(成功/失败)试验中的成功次数建模。二项分布的参数是两个完全定义分布形状、中心和离散程度的数值——不需要额外信息就可以计算任何概率、期望值或离散程度度量。
2. 识别 $n$ 和 $p$:检查BINS条件 ★★☆☆☆ ⏱ 4 min
在你能正确识别 $n$ 和 $p$ 之前,你必须先确认你的场景满足二项分布的四个必要条件,我们可以用一个简单的首字母缩写来记忆。
- **B**二元结果:每次试验只有两种可能结果(成功/失败,成功只是你计数的结果,不代表它一定是好结果)。
- **I**独立试验:一次试验的结果不会改变其他试验结果的概率。无放回抽样时,需要确认10%条件:样本量 $n < 10\%$ 总体大小,才能认为独立性合理。
- **N**试验次数固定:试验次数在统计成功前就已经确定;你不会在达到固定成功次数后就停止试验。
- **S**成功概率相同:每次试验成功的概率 $p$ 都相同。
3. 二项分布的均值(期望值) ★★★☆☆ ⏱ 3 min
二项随机变量 $X$ 的均值(也叫期望值)是重复多次进行相同 $n$ 次试验时,你预期得到的长期平均成功次数。公式可以直接从离散随机变量的一般期望值公式简化得到:
\mu_X = E(X) = n p
这个公式符合常识:对于100次试验,每次成功概率50%,你平均预期得到50次成功,正好等于 $100 \times 0.5 = 50$。在AP考试中,几乎总会要求你结合场景解释均值,而不只是计算出数值。
4. 二项分布的方差和标准差 ★★★☆☆ ⏱ 4 min
方差衡量二项分布 $X$ 的离散程度,标准差是方差的平方根,单位和 $X$(成功次数)一致。两个公式都只依赖参数 $n$ 和 $p$:
\sigma^2_X = Var(X) = n p (1-p)
\sigma_X = SD(X) = \sqrt{n p (1-p)}
直观理解:随着试验次数 $n$ 增加,离散程度会增大,因为更多试验会带来更多可能的变异。当 $p=0.5$ 时离散程度最大(不确定性最大),当 $p$ 趋近0或1时离散程度趋近0(不确定性很小)。标准差的含义是重复试验中,成功次数偏离均值的典型幅度。
Common Pitfalls
Why: 学生混淆了随机变量的值(计数成功)和固定参数 $n$。
Why: '成功'这个词听起来是正面的,所以学生错误地把好结果的概率当作 $p$。
Why: 学生混淆了单次试验的成功概率和 $n$ 次试验的期望总成功次数。
Why: 学生不管样本占总体多少,都直接认为独立性一定成立。
Why: 学生混淆了二项和几何场景,两者都有二元独立试验。
Why: 学生看错了题目要求的计数对象。