内容正文:
培优课——离散型随机变量的概率分布及应用
第七章 随机变量及其分布
人教A版 数学 选择性必修第三册
重难探究·能力素养速提升
学以致用·随堂检测促达标
目录索引
学习目标 1.加强对离散型随机变量的概率分布的理解.(逻辑推理)
2.进一步熟练求离散型随机变量的分布列、均值及方差.(数学运算)
重难探究·能力素养速提升
问题1离散型随机变量的概率分布有哪几种?如何识别不同的概率分布?
问题2不同的概率分布,其数字特征如何计算?
探究点一 离散型随机变量的概率模型
角度1.二项分布的概率模型
问题3如何识别二项分布的概率模型?
【例1】 在某地举办的射击比赛中,规定每位射手射击10次,每次一发,记分的规则为:击中目标一次得3分,未击中目标得0分,凡参赛者一律另加2分.已知射手小李击中目标的概率为0.9,求小李在比赛中得分的均值与方差.
解 设击中次数为X,比赛得分为Y,
则Y=3X+2.
由题意知X~B(10,0.9),所以
E(X)=10×0.9=9,
D(X)=10×0.9×(1-0.9)=0.9.
E(Y)=E(3X+2)=3E(X)+2=29,
D(Y)=D(3X+2)=9D(X)=8.1.
所以小李在比赛中得分的均值为29,方差为8.1.
规律方法 通过审题,明确判断出随机变量X(击中次数)服从二项分布是解这个题的关键,然后利用二项分布的均值和方差的计算公式即可求出E(X),D(X).
角度2.超几何分布的概率模型
问题4如何识别超几何分布的概率模型?超几何分布与二项分布如何区分?
【例2】 第七次全国人口普查入户工作于2020年10月11日至12月10日期间进行.从11月1日开始进入普查的正式登记阶段.普查员进入每个住户家中逐人逐项登记普查信息,这期间还将随机抽取10%的住户填报普查长表,调查更为详细的人口结构信息.某社区对随机抽取的10%的住户填报的普查长表信息情况进行汇总,并按照住户人均年收入情况绘制出如图所示的频率分布直方图(假设该社区内住户人均年收入均在0到12万之间).
(1)若在抽取的10%的住户中,人均年收入在区间[6,8)内的恰好有32户,则该社区共有住户约多少户?
(2)若从抽取的10%的住户中,人均年收入不高于8万元的,按照分层随机抽样的方法抽取10户,再从这10户中随机抽取4户对其住房和医疗保障情况进行调查,用X表示抽取的4户中人均年收入不少于6万元的住户数,求随机变量X的分布列与数学期望.
解 (1)依题意,由频率分布直方图可知,2(a+2a+3a+4a+0.175+3a)=1,所以a=0.025.所以抽取的10%的住户中,人均年收入在区间[6,8)内的住户所占的比重恰好为8a=0.2.
所以10%的住户共计约为160户,进而可得该社区共有住户约1 600户.
(2)依题意,在抽取的10%的住户中,人均年收入不高于8万元的,按照分层随机抽样抽取10户,可知在这10户中,收入在区间[0,2)内的是1户,在区间[2,4)内的是2户,在区间[4,6)内的是3户,在区间[6,8)内的是4户,再从这10户中随机抽取4户对其住房和医疗保障情况进行调查,所以X的可能取值为0,1,2,3,4.
规律方法 通过审题,明确判断出随机变量X服从超几何分布是解这个题的关键,然后利用均值和方差的计算公式即可求出E(X),D(X).
探究点二 均值与方差在决策中的应用
问题5如何利用离散型随机变量的数字特征来帮助解决实际问题?
【例3】 计划在某水库建一座至多安装3台发电机的水电站.过去50年的水文资料显示,水库年入流量X(年入流量:一年内上游来水与库区降水之和.单位:亿立方米)都在40以上.其中,不足80的年份有10年,不低于80且不超过120的年份有35年,超过120的年份有5年,将年入流量在以上三段的频率作为相应段的概率,并假设各年的入流量相互独立.
(1)求未来4年中,至多有1年的年入流量超过120的概率;
(2)水电站希望安装的发电机尽可能运行,但每年发电机最多可运行台数受年入流量X限制,并有如下关系:
年入流量X 40<X<80 80≤X≤120 X>120
发电机最多可运行台数 1 2 3
若某台发电机运行,则该台发电机年利润为5 000万元;若某台发电机未运行,则该台发电机年亏损800万元.欲使水电站年总利润的均值达到最大,应安装发电机多少台?
(2)记水电站年总利润为Y(单位:万元).
①安装1台发电机的情形.
由于水库年入流量总大于40,故一台发电机运行的概率为1,对应的年利润Y=5 000,E(Y)=5 000×1=5 000.
②安装2台发电机的情形.
依题意,当40<X<80时,一台发电机运行,此时Y=5 000-800=4 200,因此P(Y=4 200)=P(40<X<80)=P1=0.2;当X≥80时,两台发电机运行,此时Y=5 000×2=10 000,因此P(Y=10 000)=P(X≥80)=P2+P3=0.8.由此得Y的分布列如下.
Y 4 200 10 000
P 0.2 0.8
所以,E(Y)=4 200×0.2+10 000×0.8=8 840.
③安装3台发电机的情形.
依题意,当40<X<80时,一台发电机运行,此时Y=5 000-1 600=3 400,因此P(Y=3 400)=P(40<X<80)=P1=0.2;
当80≤X≤120时,两台发电机运行,此时Y=5 000×2-800=9 200,因此P(Y=9 200)=P(80≤X≤120)=P2=0.7;
当X>120时,三台发电机运行,此时Y=5 000×3=15 000,因此
P(Y=15 000)=P(X>120)=P3=0.1.由此得Y的分布列如下.
Y 3 400 9 200 15 000
P 0.2 0.7 0.1
所以,E(Y)=3 400×0.2+9 200×0.7+15 000×0.1=8 620.
综上,欲使水电站年总利润的均值达到最大,应安装2台发电机.
规律方法 随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
本节要点归纳
1.知识清单:(1)二项分布的均值、方差;(2)超几何分布的均值、方差.
2.方法归纳:公式法.
3.常见误区:(1)对随机变量的分布类型判断出错;(2)混淆公式.
学以致用·随堂检测促达标
1
2
3
4
5
6
7
8
9
10
11
12
A 级 必备知识基础练
1.下列说法正确的是( )
A.离散型随机变量ξ的均值E(ξ)反映了ξ取值的概率的平均值
B.离散型随机变量ξ的方差D(ξ)反映了ξ取值的平均水平
C.离散型随机变量ξ的均值E(ξ)反映了ξ取值的平均水平
D.离散型随机变量ξ的方差D(ξ)反映了ξ取值的概率的平均值
C
解析 由离散型随机变量的均值与方差的定义可知,C正确.
1
2
3
4
5
6
7
8
9
10
11
12
2.(多选题)已知随机变量X的分布列如下.
X -1 0 1
P a b c
其中a,b,c成等差数列.若E(X)= ,则D(X)的值是( )
AB
1
2
3
4
5
6
7
8
9
10
11
12
B
1
2
3
4
5
6
7
8
9
10
11
12
4.小芳用肢体语言把成语的意思传递给本组其他同学.若小组内同学甲猜对成语的概率是0.4,同学乙猜对成语的概率是0.5,且规定猜对得1分,猜不对得0分,则这两个同学各猜1次,得分之和X(单位:分)的均值为( )
A.0.9 B.0.8
C.1.2 D.1.1
A
解析 由题意得X=0,1,2,则P(X=0)=0.6×0.5=0.3, P(X=1)=0.4×0.5+0.6×0.5=0.5,P(X=2)=0.4×0.5=0.2,故E(X)=1×0.5+2×0.2=0.9.
1
2
3
4
5
6
7
8
9
10
11
12
5.已知随机变量ξi满足P(ξi=1)=pi,P(ξi=0)=1-pi,i=1,2.若0<p1<p2< ,则( )
A.E(ξ1)<E(ξ2),D(ξ1)<D(ξ2) B.E(ξ1)<E(ξ2),D(ξ1)>D(ξ2)
C.E(ξ1)>E(ξ2),D(ξ1)<D(ξ2) D.E(ξ1)>E(ξ2),D(ξ1)>D(ξ2)
A
1
2
3
4
5
6
7
8
9
10
11
12
6.同时抛掷两枚质地均匀的骰子,至少有一个3点或6点出现时,就说这次试验成功,则在9次试验中,成功次数X的均值是 .
5
1
2
3
4
5
6
7
8
9
10
11
12
7.随机变量ξ的取值为0,1,2.若P(ξ=0)= ,E(ξ)=1,则D(ξ)= .
1
2
3
4
5
6
7
8
9
10
11
12
8.某陶瓷厂准备烧制甲、乙、丙三件不同的工艺品,制作过程必须先后经过两次烧制,当第一次烧制合格后方可进入第二次烧制,两次烧制过程相互独立.根据该厂现有的技术水平,经过第一次烧制后,甲、乙、丙三件产品合格的概率依次为0.5,0.6,0.4.经过第二次烧制后,甲、乙、丙三件产品合格的概率依次为0.6,0.5,0.75.
(1)求第一次烧制后恰有一件产品合格的概率;
(2)经过前后两次烧制后,合格工艺品的个数为ξ,求随机变量ξ的均值与方差.
1
2
3
4
5
6
7
8
9
10
11
12
解 分别记甲、乙、丙经第一次烧制后合格为事件A1,A2,A3.
(1)设E表示第一次烧制后恰好有一件合格,则
=0.5×0.4×0.6+0.5×0.6×0.6+0.5×0.4×0.4=0.38.
(2)因为每件工艺品经过两次烧制后合格的概率均为p=0.3,所以ξ~B(3,0.3).
所以E(ξ)=3×0.3=0.9,D(ξ)=3×0.3×0.7=0.63.
1
2
3
4
5
6
7
8
9
10
11
12
B 级 关键能力提升练
9.已知在10件产品中可能存在次品,从中抽取2件检查,其次品数为ξ,已知P(ξ=1)= 且该产品的次品率不超过40%,则这10件产品的次品率为( )
A.10% B.20% C.30% D.40%
B
1
2
3
4
5
6
7
8
9
10
11
12
10.若随机事件A在1次试验中发生的概率为p(0<p<1),用随机变量X表示A在1次试验中发生的次数,则方差D(X)的最大值为 .
1
2
3
4
5
6
7
8
9
10
11
12
11.本着健康低碳的生活理念,租自行车骑游的人越来越多.某自行车租车点的收费标准是每车每次租车时间不超过两小时免费,超过两小时的部分,每小时收费2元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该租车点租车骑游(各租一车一次).设甲、乙不超过两小时还车的概率分别为 ;两小时以上且不超过三小时还车的概率分别为 ;两人租车时间都不会超过四小时.
(1)求甲、乙两人所付的租车费用相同的概率;
(2)设甲、乙两人所付的租车费用之和为随机变量X,求X的分布列及均值.
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
12.为提升基层综合文化服务中心服务效能,广泛开展群众性文化活动,某村干部在本村的村民中进行问卷调查,将他们的成绩(满分:100分)分成7组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].整理得到如下频率分布直方图.
(1)求a的值并估计该村村民成绩的平均数(同一组中的数据用该组区间的中点值代表);
(2)从成绩在区间[30,40),[80,90)内的村民中用分层随机抽样的方法选取6人,再从这6人中任选3人,记这3人中成绩在区间[80,90)内的村民人数为X,求X的分布列与期望.
1
2
3
4
5
6
7
8
9
10
11
12
解 (1)由图可知,10(3a+0.01+0.015+0.03×2)=1,解得a=0.005.
该村村民成绩的平均数约为(35+45+95)×0.05+(55+65)×0.3+75×0.15+85×0.1=64.5.
1
2
3
4
5
6
7
8
9
10
11
12
所以P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=,P(X=4)=,故随机变量X的分布列为
X
0
1
2
3
4
P
所以E(X)=0+1+2+3+4
解 (1)依题意,得P1=P(40<X<80)==0.2,
P2=P(80≤X≤120)==0.7,P3=P(X>120)==0.1.
由二项分布可知,在未来4年中,至多有1年的年入流量超过120的概率为P=(1-P3)4+(1-P3)3P3=0.94+4×0.93×0.1=0.947 7.
A. B. C. D.
3.若离散型随机变量X的分布列为P(X=k)=(1≤k≤5,k∈Z),则P(<X<)的值为( )
A. B. C. D.
解析 由题意可知ξi(i=1,2)服从两点分布,
∴E(ξ1)=p1,E(ξ2)=p2,D(ξ1)=p1(1-p1),D(ξ2)=p2(1-p2),又0<p1<p2<,
∴E(ξ1)<E(ξ2),把方差看作函数y=x(1-x),函数在区间0,内单调递增,
故由题意可知,D(ξ1)<D(ξ2).故选A.
解析 由已知,同时抛掷两枚骰子一次,至少有一个3点或6点出现时的概率为,9次试验相当于9次独立重复试验,则成功次数X服从二项分布,即X~B
故E(X)=9=5.
解析 设P(ξ=1)=a,P(ξ=2)=b,则解得
所以D(ξ)=0+1=
P(E)=P(A1)+P(A2)+P(A3)
解析 设10件产品中存在n件次品,从中抽取2件,其次品数为ξ,由P(ξ=1)=,得,化简得n2-10n+16=0,解得n=2或n=8.又该产品的次品率不超过40%,则n≤4,即n=2,则这10件产品的次品率为=20%.
解析 随机变量X的所有可能取值是0,1,并且P(X=1)=p,P(X=0)=1-p.
从而E(X)=0×(1-p)+1×p=p.
D(X)=(0-p)2×(1-p)+(1-p)2p=p-p2=
因为0<p<1,所以当p=时,D(X)取最大值,最大值是
解 (1)由题意得,甲、乙在三小时以上且不超过四小时还车的概率分别为记甲、乙两人所付的租车费用相同为事件A,
则P(A)=
故甲、乙两人所付的租车费用相同的概率为
(2)X的可能取值为0,2,4,6,8.
P(X=0)=,P(X=2)=,
P(X=4)=,P(X=6)=,
P(X=8)=
∴甲、乙两人所付的租车费用之和X的分布列为
X
0
2
4
6
8
P
∴E(X)=0+2+4+6+8
(2)从成绩在区间[30,40),[80,90)内的村民中用分层随机抽样的方法选取6人,其中成绩在区间[30,40)内的村民有6=2人,
成绩在区间[80,90)内的村民有4人,
则X服从起几何分布,X的分布列为P(X=k)=,k=1,2,3.
P(X=1)=,P(X=2)=,
P(X=3)=,具体的计算结果为
X
1
2
3
P
故E(X)=1+2+3=2.
$$