内容正文:
7.4.2 超几何分布
问题1 已知100件产品中有8件次品 , 分别采用有放回和不放回的方式随机抽取4件 . 设抽取的 4 件产品中次品数为X , 求随机变量X的分布列.
我们知道, 如果采用有放回抽样, 则每次抽到次品的概率为0.08 , 且各次抽样的结果相互独立 , 此时X服从二项分布, 即X~B(4,0.08).
思考? 如果采用不放回抽样 , 那么抽到4件产品中次品数X是否也服从二项分布? 如果不服从,那么X的分布列是什么?
采用不放回抽样 , 虽然每次抽到次品的概率都是0.08 , 但每次抽取不是同一个试验 , 而且各次抽取的结果也不独立, 不符合n重伯努利试验的特征, 因此X不服从二项分布.
可以根据古典概型求X的分布列 . 由题意可知,X可能的取值为0,1,2,3,4. 从100件产品中任取4件,样本空间包含个样本点,且每个样本点都是等可能发生的.
其中4件产品中恰有k件次品的结果数为 .
由古典概型的知识,得X的分布列为
计算的具体结果(精确到0.00001)如表所示.
X 0 1 2 3 4
P 0.71257 0.25621 0.02989 0.00131 0.00002
一般地 , 假设一批产品共有N件, 其中有M件次品. 从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数 , 则X的分布列为
其中n,M,N∈N*,m=max{0,n-N+M},r=min{n , M}.
如果随机变量X的分布列具有上式的形式, 那么称随机变量X服从超几何分布.
公式中字母的含义:
N—总体中的个体总数;
M—总体中的特殊个体总数(如次品总数);
n—样本容量;
k—样本中的特殊个体数(如次品数).
例4 从50名学生中随机选出5名学生代表,求甲被选中的概率.
解: 设X表示选出的5名数学中含甲的人数(只能取0或1),
则X服从超几何分布 , 且N=50 , M=1 , n=5 , 因此甲被选中的概率为
容易发现,每个人被抽到的概率都是. 这个结论非常直观,这里给出了严格的推导.
例5 一批零件共有30个,其中有3个不合格,随机抽取10个零件进行检测,求至少有1件不合格的概率.
解: 设抽取的10个零件中不合格品数为X , 则X服从超几何分布 , 且N=30 , M=3 , n=10,
X的分布列为
至少有1件不合格的概率为
P(X ≥1)= P(X=1)+P(X=2)+P(X=3)
例5 一批零件共有30个,其中有3个不合格,随机抽取10个零件进行检测,求至少有1件不合格的概率.
解: 设抽取的10个零件中不合格品数为X , 则X服从超几何分布 , 且N=30 , M=3 , n=10,
X的分布列为
至少有1件不合格的概率为
P(X ≥1)= P(X=1)+P(X=2)+P(X=3)≈0.7192.
P(X≥1)=1−P(X=0)
也可以按如下方法求解:
探究!服从超几何分布的随机变量的均值是什么?
设随机变量X服从超几何分布 , 则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品中的次品数 .
令p= ,则p是N件产品的次品率,而 是抽取的n件产品的次品率.
我们猜想E()=p,即 E(X)=np.
实际上,令m=max{0,n-N+M},r=min{n , M} , 由随机变量均值的定义:
当m>0时,
我们猜想E()=p,即 E(X)=np.
实际上,令m=max{0,n-N+M},r=min{n , M} , 由随机变量均值的定义:
当m>0时,
当m=0时,注意到上式中间求和的第一项为0 ,类似可以证明结论依然成立.
例6 一袋中有100个大小相同的小球, 其中有40个黄球、60个白球,从中随机摸出20个球作为样本 . 用X表示样本中黄球的个数.
(1)分别就有放回和不放回摸球,求X的分布列;
(2)分别就有放回和不放回摸球, 用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.
分析:因为只有两种颜色的球,每次摸球都是一个伯努利试验,摸出20个球,采用有放回摸球,各次实验结果相互独立,X~B(20,40); 而采用不放回摸球,各次实验结果不独立,X服从几何分布.
例6 一袋中有100个大小相同的小球, 其中有40个黄球、60个白球,从中