内容正文:
7.4.2 超几何分布
问题 已知100件产品中有8件次品,分别采用有放回和不放回的方式随机抽取4件.设抽取的4件产品中次品数为X,求随机变量X的分布列.
我们知道,如果采用有放回抽样,则每次抽到次品的概率为0.08,且各次抽样的结果相互独立,此时X服从二项分布,即X~B(4, 0.08) .
如果采用不放回抽样,那么抽取的4件产品中次品数X是否也服从二项分布?如果不服从,那么X的分布列是什么?
采用不放回抽样,虽然每次抽到次品的概率都是0.08,但每次抽取不是同一个试验,而且各次抽取的结果也不独立,不符合n重伯努利试验的特征,因此X不服从二项分布.
计算的具体结果(精确到0.00001)如表7.4-1所示.
表7.4-1
X 0 1 2 3 4
P 0.71257 0.25621 0.02989 0.00131 0.00002
一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为
如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布(hypergeometric distribution).
例1 从50名学生中随机选出5名学生代表,求甲被选中的概率.
例2一批零件共有30个,其中有3个不合格.随机抽取10个零件进行检测,求至少有1件不合格的概率.
变式训练1: 一批产品中有13件正品、2件次品,从中不放回地任取3件,求取出次品数为ξ的分布列.
变式训练2: 一个袋中装有6个形状、大小完全相同的小球,其中红球有3个,编号为1,2,3;黑球有2个,编号为1,2;白球有1个,编号为1.现从袋中一次随机取出3个球.
(1)求取出的3个球的颜色都不相同的概率;
(2)记取得1号球的个数为随机变量X,求随机变量X的分布列.
探究
服从超几何分布的随机变量的均值是什么?
【例3】 一个袋子中装有60个大小、质地完全相同的球,其中有20个黄球、40个白球,从中随机地摸出10个球作为样本,用X表示样本中黄球的个数.
(1)有放回地摸球,求X的分布列及期望;
(2)不放回地摸球,求X的分布列及期望.
二项分布和超几何分布都可以描述从N件产品中随机抽取的n件产品中次品数的分布规律(n,N∈N*),并且二者的均值相同.对于不放回抽样,当n远远小于N时,每抽取一次后,对N的影响很小,此时超几何分布可以用二项分布近似.
例3 一个袋子中有100个大小相同的球,其中有40个黄球、60个白球,从中随机地摸出20个球作为样本.用X表示样本中黄球的个数.
(1)分别就有放回摸球和不放回摸球,求X的分布列;
(2)分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.
分析:因为只有两种颜色的球,每次摸球都是一个伯努利试验.摸出20个球,采用有放回摸球,各次试验的结果相互独立,X~B(20,0.4);而采用不放回摸球,各次试验的结果不独立,X服从超几何分布.
例3 一个袋子中有100个大小相同的球,其中有40个黄球、60个白球,从中随机地摸出20个球作为样本.用X表示样本中黄球的个数.
(1)分别就有放回摸球和不放回摸球,求X的分布列;
(2)分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.
(2)利用统计软件可以计算出两个分布列具体的概率值(精确到 0.00001 ),
如表7.4-2 所示.
k p1k p2k k p1k p2k
0 0.000 04 0.000 01 11 0.070 99 0.063 76
1 0.000 49 0.000 15 12 0.035 50 0.026 67
2 0.003 09 0.001 35 13 0.014 56 0.008 67
3 0.012 35 0.007 14 14 0.004 85 0.002 17
4 0.034 99 0.025 51 15 0.001 29 0.000 41
5 0.074 65 0.065 30 16 0.000 27 0.000 06
6 0.124 41 0.124 22 17 0.000 04 0.000 01
7 0.165 88 0.179 72 18 0.000 00 0.000 00
8 0.179 71 0.200 78 19 0.000 00 0.000 00
9 0.159 74 0.174 83 20 0.000 00 0.000 00
10 0.117 14 0.119 24
因此,在相同的误差限制下,采用不放回摸球估计的结果更可靠些.
两种摸球方式下,随机变量X分别服从二项分布和超几何分布.虽然这两种分布有相等的均值(都是8),但从两种分布的概率分布图(图7.4-4)看,超几何分布更集中在均值附近.
二项分布和超几何分布都可以描述随机抽取的n件产品中次品数的分布规律,并且二者的均值相同.对于不放回抽样,当n远远小于N时,每抽取一次后,对N的影响很小,此时,超几何分布可以用二项分布近似.
答案:B
变式3(2) 端午节吃粽子是我国的传统习俗.设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观、大小完全相同.从中随机取3个.
(1)求三种粽子各取到1个的概率;
(2)设X表示取到的豆沙粽个数,求X的分布列与数学期望.
1.超几何分布是概率分布的一种形式,一定要读懂题意,注意公式中字母的取值范围及其意义,解决问题时可以直接利用公式求解,但不能机械地记忆.
2.在超几何分布中,只要知道M,N,n(注意这三个参数的含义),就可以利用公式求出X取不同k值时的概率P(X=k),从而求出X的分布列、数学期望、方差等.
第80页
1.一箱24罐的饮料中4罐有奖券,每张奖券奖励饮料一罐,从中任意抽取2罐,求这2罐中有奖券的概率.
解:因为一箱24罐的饮料中4罐有奖券,所以无奖券的有20罐,
2.学校要从12名候选人中选4名同学组成学生会,已知有4名候选人来自甲班.假设每名候选人都有相同的机会被选到,求甲班恰有2名同学被选到的概率.
3.从一副不含大小王的52张扑克牌中任意抽出5张,求至少有2张A牌的概率(精确到0.000 01).
4.有一个摸奖游戏,在一个口袋中装有10个红球和20个白球,这些球除颜色外完全相同,一次从中摸出5个球,至少摸到3个红球就中奖.求中奖的概率(精确到0.001).
$$