内容正文:
直线
7.4.2 超几何分布
问题引入
问题1:已知100件产品中有8件次品,分别采用有放回和不放回的方式随机抽取4件.设抽取的4件产品中次品数为,求随机变量的分布列.
我们知道,如果采用有放回抽样,则每次抽到次品的概率为0.08,且各次抽样的结果相互独立,此时服从二项分布,即.
思考1:如果采用不放回抽样,那么抽取的4件产品中次品数是否也服从二项分布?如果不服从,那么的分布列是什么?
采用不放回抽样,虽然每次抽到次品的概率都是0.08,但每次抽取不是同一个试验,而且各次抽取的结果也不独立,不符合重伯努利试验的特征,因此不服从二项分布.
新知探索
问题1:已知100件产品中有8件次品,用不放回的方式随机抽取4件.设抽取的4件产品中次品数为,求随机变量的分布列.
可以根据古典概型求的分布列.由题意可知,可能的取值为0,1,2,3,4.从100件产品中任选4件,样本空间包含个样本点,且每个样本点都是等可能发生的.其中4件产品中恰有件次品的结果数为.由古典概型的知识,得的分布列为
计算的具体结果(精确到0.00001)如表所示.
2 3 4
新知探索
一般地,假设一批产品共有件,其中有件次品.从件产品中随机抽取件(不放回),用表示抽取的件产品中的次品数,则的分布列为
.
其中,,,,,,.如果随机变量的分布列具有上式的形式,那么称随机变量服从超几何分布.
新知探索
辨析1.判断正误.
(1)超几何分布就是一种概率分布模型.( )
(2)一个袋子里装有4个白球,5个黑球和6个黄球,从中任取4个球,则取出的黑球个数服从超几何分布.( )
答案:√,√.
辨析2.在5件产品中,有3件一等品和2件二等品,从中任取2件,那么以为概率的事件是( ).
A.都不是一等品 B.恰有1件一等品
C.至少有1件一等品 D.至多有1件一等品
答案:D.
例析
例4.从50名学生中随机选出5名学生代表,求甲被选中的概率.
解:设表示选出的5名学生中含甲的人数(只能取0或1),则服从超几何分布,且,,.
因此甲被选中的概率为.
例析
例5.一批零件共有30个,其中有3个不合格.随机抽取10个零件进行检测,求至少有1件不合格的概率.
解:设抽取的10个零件中不合格品数为,则服从超几何分布,且,
,.的分布列为
至少有1件不合格的概率为
.
也可以按如下方法求解:
新知探索
问题2:服从超几何分布的随机变量的均值是什么?
设随机变量服从超几何分布,则可以解释为从包含件次品的件产品中,不放回地随机抽取件产品中的次品数.令,则是件产品的次品率,而是抽取的件产品的次品率,我们猜想,即.
实际上,令,,由随机变量均值的定义:当时,.(1)
因为,所以.
当时,注意到(1)式中间求和的第一项为0,类似可以证明结论依然成立.
例析
例6.一个袋子中有100个大小相同的球,其中有40个黄球、60个白球,从中随机地摸出20个球作为样本.用表示样本中黄球的个数.
(1)分别就有放回摸球和不放回摸球,求的分布列;
解(1):对于有放回摸球,每次摸到黄球的概率为0.4,且各次试验之间的结果是独立的,因此,的分布列为
对于不放回摸球,各次试验的结果不独立,服从超几何分布,的分布列为
例析
(2)分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.
解(2):利用统计软件计算出两个分布列的概率值(精确到0.00001),如表所示.
例析
(2)分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.
解(2):样本中黄球的比例是一个随机变量,根据上表,计算得:
有放回摸球:
无放回摸球:
因此,在相同的误差限制下,采用不放回摸球估计的结果更可靠些.
例析
两种摸球方式下,随机变量分别服从二项分布和超几何分布.虽然这两种分布有相等的均值(都是8),但从两种分布的概率分布图看,超几何分布更集中在均值附近.
二项分布和超几何分布都可以描述随机抽取的件产品中次品数的分布规律,并且二者的均值相同.对于不放回抽样,当远远小于时,每抽取一次后,对的影响很小,此时,超几何分布可以用二项分布近似.
练习
题型一:超几何分布概率公式的应用
例1.10件产品中有2件次品,任取2件进行检验,求下列事件的概率:
(1)至少有1件次品;
(2)至多有1件次品.
解:(1)“至少有1件次品”的对立事件是“2件都是正品”.
“2件都是正品”的概率为,所以“至少有1件次品”的概率为.
(2)“至多有1件次品”的对立事件是“2件都是次品”,
“2件都是次品”的概率为,所以“至少有1件次品”的概率为
练习
方法技巧:
有