内容正文:
7.4.2 超几何分布
第七章 §7.4 二项分布与超几何分布
学习目标
1.理解超几何分布的概念及特征.
2.会用超几何分布解决一些简单的实际问题.
为促进各学校的共同发展,学校之间派部分老师相互交流.已知一学校派出16名一级教师,4名高级教师组成一队伍去相互交流学习,现在需要从这20人中任意选取3人去甲学校,设X表示其中高级教师的人数.则X的可能取值有哪些,你能求出当X=2时对应的概率吗?这里的X的分布列有怎样的规律?
导语
内容索引
一、超几何分布的概率
二、超几何分布的分布列
课时对点练
三、超几何分布的均值
随堂演练
超几何分布的概率
一
问题1 已知在10件产品中有4件次品,分别采取有放回和不放回的方式随机抽取3件,设抽取的3件产品中次品数为X,试写出X的分布列.
超几何分布:一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为
P(X=k)= ,k=m,m+1,m+2,…,r.
其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.
如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
知识梳理
7
注意点:
(1)在超几何分布的模型中,“任取n件”应理解为“不放回地一次取一件,连续取n件”.
(2)超几何分布的特点:①不放回抽样;②考察对象分两类;③实质是古典概型.
知识梳理
8
例1 (1)一个盒子里装有大小相同的10个黑球、12个红球、4个白球,从
中任取2个,其中白球的个数记为X,则下列概率等于 的是
A.P(0<X≤2) B.P(X≤1)
C.P(X=1) D.P(X=2)
√
9
(2)现有来自甲、乙两班的学生共7名,从中任选2名都是甲班的概率为
①求7名学生中甲班的学生数;
设甲班的学生人数为M,
即M2-M-6=0,解得M=3或M=-2(舍去).
∴7名学生中甲班的学生共有3人.
10
②设所选2名学生中甲班的学生数为ξ,求ξ≥1的概率.
由题意可知,ξ服从超几何分布.
∴P(ξ ≥1)=P(ξ=1)+P(ξ=2)
11
(1)解答此类问题的关键是先分析随机变量是否满足超几何分布.
(2)注意公式中M,N,n的含义.
反思感悟
12
跟踪训练1 某校高三年级某班的数学课外活动小组中有6名男生,4名女生,从中选出4人参加数学竞赛考试,用X表示其中的男生人数.求至少有2名男生参加数学竞赛的概率.
13
依题意,得随机变量X服从超几何分布,且N=10,M=6,n=4,
14
方法一 (直接法)
P(X≥2)=P(X=2)+P(X=3)+P(X=4)
方法二 (间接法)
由分布列的性质,得P(X≥2)=1-P(X<2)
15
二
超几何分布的分布列
例2 在一次招聘中,主考官要求应聘者从6道备选题中一次性随机抽取3道题,并独立完成所抽取的3道题.甲能正确完成其中的4道题,且每道题完成与否互不影响.规定至少正确完成其中2道题便可过关.记所抽取的3道题中,甲答对的题数为X,求X的分布列.
17
由题意得X可取1,2,3,
故X的分布列为
18
求超几何分布的分布列的步骤
反思感悟
19
跟踪训练2 在10个乒乓球中有8个正品,2个次品.从中任取3个,求其中所含次品数的分布列.
20
记任取的3个乒乓球中,所含次品的个数为X,则X的所有可能取值为0,1,2.
所以X的分布列为
21
三
超几何分布的均值
问题2 根据问题1,分析服从超几何分布的随机变量的均值是什么?
实际上,令m=max{0,n-N+M},r=min{n,M},
由随机变量均值的定义:当m>0时,
当m=0时,注意到(1)式中间求和的第一项为0,类似可以证明结论依然成立.
例3 (1)袋中有3个白球,1个红球,从中任取2个球,取得1个白球得
0分,取得1个红球得2分,则所得分数X的均值E(X)为
A.0 B.1 C.2 D.4
由题意,得X的可能取值为0或2,其中X=0表示取得2个白球,X=2表示取得1个白球和1个红球,
√
26
(2)某大学志愿者协会有6名男同学,4名女同学.在这10名同学中,3名同学来自数学学院,其余7名同学来自物理、化学等其他互不相同的七个学院.现从这10名同学中随机选取3名同学,到希望小学进行支教活动(每位同学被选到的可能性相同).
①求选出的3名同学是来自互不相同的学院的概率;
27
②设X为选出的3名同学中女同学的人数,求随机变量X的分布列及均值.
28
所以X的分布列为
29
求超几何分布均值的步骤
(1)验证随机变量服从超几何分布,并确定参数N,M,n的值.
(2)根据超几何分布的概率计算公式计算出随机变量取每一个值时的概率.
(3)利用均值公式求解.
反思感悟
30
跟踪训练3 某学校实行自主招生,参加自主招生的学生从8道试题中随机挑选4道进行作答,至少答对3道才能通过初试.记在这8道试题中甲能答对6道,甲答对试题的个数为X,则甲通过自主招生初试的概率为
_____,E(X)=_____.
3
31
依题意,知甲能通过自主招生初试的概率为
32
1.知识清单:
(1)超几何分布的概念及特征.
(2)超几何分布的概率及分布列.
(3)超几何分布的均值.
2.方法归纳:公式法.
3.常见误区:超几何分布的判断错误.
课堂小结
随堂演练
四
1.(多选)下列随机变量中,服从超几何分布的有
A.在10件产品中有3件次品,一件一件地不放回地任意取出4件,记取到
的次品数为X
B.从3台甲型电脑和2台乙型电脑中任取2台,记X表示所取的2台电脑中甲
型电脑的台数
C.一名学生骑自行车上学,途中有6个红绿灯,记此学生遇到红灯的个数
为X
D.从10名男生,5名女生中选3人参加植树活动,其中男生人数记为X
1
2
3
4
√
√
√
依据超几何分布模型定义可知,A,B,D中随机变量X服从超几何分布.而C中显然不能看作一个不放回抽样问题,故C中随机变量X不服从超几何分布.
1
2
3
4
2.在100张奖券中,有4张能中奖,从这100张奖券中任取2张,则2张都能中奖的概率是
1
2
3
4
√
3.袋中有3个黑球、4个红球,除颜色外,其他均相同.从袋中任取3个球,则至少有1个红球的概率为_____.
1
2
3
4
4.袋中有3个红球,7个白球,这些球除颜色不同外其余完全相同,从中无放回地任取5个,取出几个红球就得几分,则得分的均值为_______.
1
2
3
4
1.5
2
课时对点练
五
1.(多选)关于超几何分布下列说法正确的是
A.超几何分布的模型是不放回抽样
B.超几何分布的总体里可以只有一类物品
C.超几何分布中的参数是N,M,n
D.超几何分布的总体往往由差异明显的两部分组成
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
基础巩固
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由超几何分布的定义,可知超几何模型为不放回抽样,故A正确;
超几何分布实质上就是有总数为N件的两类物品,其中一类有M(M≤N)件,从所有物品中任取n(n≤N)件,这n件中所含这类物品的件数X是一个离散型随机变量,
所以B错误;C,D正确.
2.(多选)某企业生产的12个产品中有10个一等品、2个二等品,现从这批产品中任意抽取4个,则其中恰好有1个二等品的概率为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
3.(多选)在一个袋中装有大小相同的4个黑球、6个白球,现从中任取3个球,设取出的3个球中白球的个数为X,则下列结论正确的是
A.随机变量X服从超几何分布
B.随机变量X服从二项分布
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由题意知,随机变量X服从超几何分布,且N=10,M=6,n=3,故A正确,B错误;
4.数学老师让同学从6道习题中随机抽3道进行解答,规定至少要解答正确2道题才能及格.某同学只能解答其中的4道题,则他能及格的概率是
由超几何分布的概率公式可得,他能及格的概率是
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
√
5.盒中有10个螺丝钉,其中3个是坏的.现从盒中随机抽取4个,则概率是
的事件为
A.恰有1个是坏的 B.4个全是好的
C.恰有2个是好的 D.至多有2个是坏的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
6.现有语文、数学课本共7本(其中语文课本不少于2本),从中任取2本,至多有1本语文课本的概率是 ,则语文课本有
A.2本 B.3本 C.4本 D.5本
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
√
解得n=4或n=-3(舍去),所以n=4.
7.某手机经销商从已购买某品牌手机的市民中抽取20人参加宣传活动,这20人中年龄低于30岁的有5人.现从这20人中随机选取2人各赠送一部手
机,记X为选取的年龄低于30岁的人数,则P(X=1)=_____.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
8.莫高窟坐落在甘肃的敦煌,它是世界上现存规模最大、内容最丰富的佛教艺术胜地,每年都会吸引来自世界各地的游客参观旅游.已知购买莫高窟正常参观套票可以参观8个开放洞窟,在这8个洞窟中莫高窟九层楼96号窟、莫高窟三层楼16号窟、藏经洞17号窟被誉为最值得参观的洞窟.某游客为了节省时间需从套票包含的开放洞窟中随机选择4个进行参观,
所有选择中至少包含2个最值得参观洞窟的概率是_____.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
已知8个开放洞窟中有3个最值得参观,随机选择4个进行参观,至少包含2个最值得参观洞窟包括2个或3个两种情况.
9.老师要从10篇课文中随机抽3篇让学生背诵,规定至少要背出其中2篇才能及格.某同学只能背诵其中的6篇,试求:
(1)抽到他能背诵的课文的数量的分布列;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
设抽到他能背诵的课文的数量为X,
X的可能取值为0,1,2,3,且服从超几何分布,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
所以X的分布列为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)该同学能及格的概率.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
10.新高考模式下,数学试卷不分文理卷,学生想得高分比较困难.为了调动学生学习数学的积极性,提高学生的学习成绩,张老师对自己的教学方法进行改革,经过一学期的教学实验,张老师所教的80名学生参加一次测试,数学学科成绩都在[50,100]内,
按区间分组为[50,60),[60,70),[70,80),
[80,90),[90,100],绘制成如图所示的频
率分布直方图,规定不低于80分(百分制)
为优秀.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(1)求这80名学生的平均成绩(同一区间的数据用该区间中点值作代表);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
80名学生的平均成绩为(55×0.01+65×0.03+75×0.03+85×0.025+95×0.005)×10=73.5.
(2)按优秀与非优秀用比例分配的分层随机抽样方法随机抽取10名学生座谈,再在这10名学生中,选3名学生发言,记优秀学生发言的人数为随机变量X,求X的分布列和均值.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
根据频率分布直方图知,优秀学员对应的频率为(0.025+0.005)×10=0.3,
则非优秀学员对应的频率为1-0.3=0.7,
所以抽取的10名学生中,有优秀学生10×0.3=3(人),非优秀学生10×0.7=7(人).
则X所有可能的取值为0,1,2,3,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
所以X的分布列为
11.摇奖器内有10个小球,其中8个小球上标有数字2,2个小球上标有数字5,现摇出3个小球,规定所得奖金X(元)为这3个小球上所标数字之和,则获得12元奖金的概率是
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
综合运用
√
12.在某次学校的春游活动中,高二(2)班设计了这样一个游戏:一个纸箱里放了5个红球和5个白球,这些球除颜色外其余完全相同,若一次性从中摸出5个球,摸到4个或4个以上红球即中奖,则中奖的概率是(精确到0.001)
A.0.114 B.0.112
C.0.103 D.0.121
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
√
设摸出的红球个数为X,则X服从超几何分布,其中N=10,M=5,
n=5,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13.(多选)2022年冬奥会在北京举办,为了弘扬奥林匹克精神,某市多所中小学开展了冬奥会项目科普活动.为了调查学生对冬奥会项目的了解情况,在该市中小学中随机抽取了10所学校中的部分同学,10所学校中了解冬奥会项目的人数如图所示.
若从这10所学校中随机选取3所学校进行冬
奥会项目的宣讲活动,记X为被选中的学校
中了解冬奥会项目的人数在30以上的学校所
数,则下列说法中正确的是
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由题意可得X的可能取值为0,1,2,3,故A正确;
分析可得X服从超几何分布,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15.50张彩票中只有2张中奖票,今从中任取n张,为了使这n张彩票里至少有一张中奖的概率大于0.5,则n至少为______.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
拓广探究
15
16.某城市的垃圾分类标准为厨余垃圾、可回收物、有害垃圾和其他垃圾四类.生活垃圾中有一部分可以回收利用,回收1吨废纸可再造出0.8吨好纸,降低造纸的污染排放,节省造纸能源消耗.某环保小组调查了该城市某垃圾处理厂2023年6月至12月生活垃圾回收情况,其中可回收物中废纸和塑料品的回收量(单位:吨)的折
线图如图所示.
(1)现从2023年6月至12月中随机选
取1个月,求该垃圾处理厂可回收
物中废纸和塑料品的回收量均超过
4.0吨的概率;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
记“该垃圾处理厂可回收物中废纸和塑料品的回收量均超过4.0吨”为事件A,
由图知,只有8月份的可回收
物中废纸和塑料品的回收量均
超过4.0吨,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)从2023年6月至12月中任意选取2个月,记X为选取的这2个月中废纸的回收量超过3.7吨的月份的个数.求X的分布列及均值.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
6月至12月废纸的回收量超过
3.7吨的月份有7月、8月、10月,
共3个月.
∴X的所有可能取值为0,1,2.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
∴X的分布列为
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
提示 若采用有放回抽样,则X服从二项分布,即X~B(3,0.4),其分布列为P(X=k)=C0.4k(1-0.4)3-k,k=0,1,2,3.
若采用不放回抽样,“X=k”,k=0,1,2,3表示“取出的3件产品中恰有k件次品”,这意味着,从4件次品中取出k件,再从6件正品中取出
3-k件,共有CC种取法,故X的分布列为P(X=k)=,k=0,1,2,3.
由题意可知,P(X=1)=,
P(X=0)= ,
故表示选1个白球或者一个白球都没有,即P(X≤1).
.
则==,
=+=+=.
P(X=3)==,
P(X=4)==,
∴P(X=m)=(m=0,1,2,3,4).
∴P(X=0)==,
P(X=1)==,
P(X=2)==,
=++=.
=1-[P(X=0)+P(X=1)]=1-=.
P(X=1)==,
P(X=2)==,
P(X=3)==,
X
1
2
3
P
X
0
1
2
P
有P(X=0)==,
P(X=1)==,
P(X=2)==.
提示 设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品中的次品数.令p=,则p是N件产品的次品率,而是抽取的n件产品的次品率,我们猜想E=p,即E(X)=np.
E(X)==M, (1)
因为C=C,
所以E(X)=C===np.
所以P(X=0)==,P(X=2)==,故X的均值E(X)=0×+2×=1.
设“选出的3名同学是来自互不相同的学院”为事件A,则P(A)==.
所以选出的3名同学是来自互不相同的学院的概率为.
依据条件,随机变量X服从超几何分布,其中N=10,M=4,n=3,且随机变量X的可能取值为0,1,2,3.P(X=k)=,k=0,1,2,3.
X
0
1
2
3
P
所以随机变量X的均值E(X)=0×+1×+2×+3×
=.
P(X=3)+P(X=4)=+=+=.
由于X的可能取值为2,3,4,P(X=2)==,故E(X)=2×
+3×+4×=3.
记X为2张奖券中的中奖数,则P(X=2)==.
A. B. C. D.
令X表示取出的红球个数,则X的可能取值为0,1,2,3,P(X=0)==,故至少有1个红球的概率为P(X≥1)=1-=.
用X表示所得分数,则X也是取得的红球数,X服从超几何分布,且
N=10,M=3,n=5,于是E(X)=n·=5×=1.5.
它取值为k时的概率为P(X=k)=(k≤r,r是n和M中较小的一个),
A.1- B.
C.1- D.
从12个产品中任意抽取4个,样本点总数为C;
其中恰好有1个二等品的样本点有CC个,
∴恰好有1个二等品的概率P=;
也可由对立事件计算可得P=1-.
C.P(X=2)=
D.E(X)=
P(X=2)==,故C正确;
E(X)===,故D正确.
P(X≥2)=P(X=2)+P(X=3)=+=.
A. B. C. D.
对于A,事件的概率为=;
对于B,事件的概率为=;
对于C,事件的概率为=;
对于D,事件的概率为=.
设语文课本有n(n≥2)本,则数学课本有(7-n)本,则2本都是语文课本的概率是=.所以n2-n-12=0,
易知P(X=1)==.
则所求概率P==.
则P(X=k)=,k=0,1,2,3,
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==.
X
0
1
2
3
P
该同学能及格的概率为P(X≥2)=P(X=2)+P(X=3)=+=.
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==.
X
0
1
2
3
P
所以E(X)=0×+1×+2×+3×=.
A. B. C. D.
当摇出的3个小球中有1个标有数字2,2个标有数字5时,X=12,
故P(X=12)==.
于是中奖的概率为P(X≥4)=P(X=4)+P(X=5)=+≈0.103.
A.X的可能取值为0,1,2,3 B.P(X=0)=
C.E(X)=1.2 D.D(X)=
其分布列为P(X=k)=(k=0,1,2,3),
则P(X=0)==,故B错误;
E(X)==1.2,故C正确;
D(X)=(0-1.2)2×+(1-1.2)2×+(2-1.2)2×+(3-1.2)2×=,故D正确.
14.若一个随机变量的分布列为P(ξ=r)=,其中r=0,1,2,…,l,
l=min(n,M),则称ξ服从超几何分布,记为ξ~H(n,M,N),并将
P(ξ=r)=记为H(r;n,M,N),则H(1;3,2,10)=______.
根据题意可知,r=1,n=3,M=2,N=10,所以H(1;3,2,10)=
P(ξ=1)==.
用X表示中奖票数,P(X≥1)=+>0.5,解得n≥15.
∴P(A)=.
P(X=0)===,P(X=1)===,P(X=2)===,
X
0
1
2
P
∴均值E(X)=0×+1×+2×=.
$$