内容正文:
7.4.2 超几何分布
温故知新
1. 二项分布:
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p (0<p<1),用X表示事件A发生的次数,则X的分布列为
如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布, 记作X ~B(n,p).
若X~B(n, p),则有
2.二项分布的均值与方差
3.古典概型概率计算公式
【探究1】已知100件产品中有8件次品, 分别采用有放回和不放回的方式随机抽取4件.设抽取的4件产品中次品数为X,求随机变量X的分布列.
【思考2】如果采用不放回抽样,那么抽取的4件产品中次品数X是否也服从二项分布?
【思考1】如果采用有放回抽样,随机变量X服从二项分布吗?
采用有放回抽样,则每次抽到次品的概率为0.08,且各次抽样的结果相互独立,此时X服从二项分布,即X~B(4, 0.08).
采用不放回抽样,虽然每次抽到次品的概率都是0.08,但每次抽取不是同一个试验,各次抽取的结果不独立,不符合n重伯努利试验的特征,因此X不服从二项分布.
解:由题意可知,X可能的取值为0, 1, 2, 3, 4.
【思考3】如果采用不放回抽样,抽取的4件产品中次品数X服从什么分布?如何求X的分布列?
X 0 1 2 3 4
P 0.71257 0.25621 0.02989 0.00131 0.00002
计算的具体结果(精确到0.00001)如下表所示:
提示:根据古典概型求X的分布列.
由古典概型的知识,得X的分布列为
从100件产品中任取4件, 样本空间包含 个样本点, 且每个样本点都是等可能发生的. 其中4件产品中恰有k件次品的结果数为 .
【探究2】从探究1中我们能够抽象出一个数学模型:从含有M件次品的N件产品中,不放回地抽取n件产品,用X表示抽取的次品数,则
【思考】k的取值范围是多少?
·100件产品中有8件次品,抽4次;
·100件产品中有8件次品,抽94次;
两个例子的抽取次品上下限分别是多少?
一般地, 假设一批产品共有N件, 其中有M件次品. 从N件产品中随机抽取n件(不放回), 用X表示抽取的n件产品中的次品数, 则X的分布列为
超几何分布:
其中n, N, M∈N*, M≤N, n≤N, m=max{0, n-N+M}, r=min{n, M}. 如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
超几何分布的三个特征:
①总体中含有两类不同的个体;
②不放回抽样;
③随机变量是从总体中抽取的n个个体中某一类个体的数量.
解:设X表示选出的5名学生中含甲的人数,则X服从超几何分布,且N=50, M=1, n=5.
【例1】从50名学生中随机选出5名学生代表,求甲被选中的概率.
容易发现,每个人被抽到的概率都是 . 这个结论非常直观,上述解答过程就是这一结论的推导过程.
因此甲被选中的概率为
解:设X表示抽取10个零件中不合格品数,则X服从超几何分布,其分布列为
【例2】一批零件共有30个,其中有3个不合格.随机抽取10个零件进行检测,求至少有1件不合格的概率.
∴至少有1件不合格的概率为
(直接法)
(间接法)
【探究3】服从超几何分布的随机变量的均值是什么?
设随机变量 X 服从超几何分布,则 X 可以解释为从包含 M 件次品的 N 件产品中,不放回地随机抽取 n 件产品中的次品数.
令 ,则 p 是 N 件产品的次品率,而 是抽取的 n 件产品的次品率.
我们猜想
下面对均值进行证明.
证明:令m=max{0, n-N+M}, r=min{n, M}.
由随机变量的定义:
当m>0时,
当m=0时,类似可以证明结论依然成立.
若随机变量X服从超几何分布,则有
解:(1) 对于有放回摸球,每次摸到黄球的概率为0.4,且各次试验之间的结果是独立的,因此X~B(20, 0.4),X的分布列为
【例3】一个袋子中有100个大小相同的球,其中有40个黄球、60个白球,从中随机地摸出20个球作为样本.用X表示样本中黄球的个数.
(1)分别就有放回摸球和不放回摸球,求X的分布列;
(2)分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.
对于不放回摸球, 各次试验的结果不独立, X服从超几何分布, X的分布列为
(2)利用统计软件计算出两个分布列的概率值(精确到0.00001), 如下表所示.
样本中黄球的比例 是一个随机变量, 根据表中数据计算得
因此, 在相同的误差限制下, 采用不放回摸球估计的结果更可靠些.
不放回摸球:
有放回摸球:
两种摸球方式下,随机变量X分别服从二项分布和超几何分布,虽然这两种分布有相等的均值(都是8),但从两种分布的概率分布图(如下图)看,超几何分布更集中在均值附近.
二项分布和超几何分布都可以描述随机抽取的n件产品中次品数的分布规律,并且二者的均值相同. 对于不放回抽样,当n远远小于N时,每抽取一次后,对N的影响很小,此时,超几何分布可以用二项分布近似.
超几何分布 二项分布
试验类型 抽样 抽样
试验种数 有 种物品 有 种结果
随机变量取值的概率 利用 计算 利用 计算
联系 当 时,超几何分布 二项分布
不放回
放回
两
两
古典概型
独立重复试验
总体N很大
近似
超几何分布与二项分布的联系与区别:
一般地,假设一批产品共有N件,其中有M件次品. 从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为
1. 超几何分布
若随机变量X服从超几何分布,则有
2. 超几何分布的均值
课堂小结
THE END
16
$$