内容正文:
专题微课 离散型随机变量及其分布列
题型(一) 离散型随机变量均值与方差的决策性问题
[例1] 某大学为了鼓励大学生自主创业,举办了“校园创业知识竞赛”,该竞赛决赛局有A,B两类知识竞答挑战,规则为进入决赛的选手要先从A,B两类知识中选择一类进行挑战,挑战成功才有对剩下的一类知识挑战的机会,挑战失败则竞赛结束,第二类挑战结束后,无论结果如何,竞赛都结束.A,B两类知识挑战成功分别可获得2万元和5万元创业奖金,第一类挑战失败,可得到2 000元激励奖金.已知甲同学成功晋级决赛,面对A,B两类知识的挑战成功率分别为0.6,0.4,且挑战是否成功与挑战次序无关.
(1)若记X为甲同学优先挑战A类知识所获奖金的累计总额(单位:元),写出X的分布列;
(2)为了使甲同学可获得的奖金累计总额期望更大,请帮甲同学制定挑战方案,并给出理由.
解:(1)由题意可知,X的可能取值有2 000,20 000,70 000,
P(X=2 000)=1-0.6=0.4,P(X=20 000)=0.6×(1-0.4)=0.36,P(X=70 000)=0.6×0.4=0.24,
所以随机变量X的分布列为
X
2 000
20 000
70 000
P
0.4
0.36
0.24
(2)记Y为甲同学优先挑战B类知识所获奖金累计总额,
甲同学优先挑战A类知识所获奖金累计总额的期望为E(X),优先挑战B类知识所获奖金累计总额的期望为E(Y),
由题意可知,随机变量Y的可能取值有2 000,50 000,70 000,
则P(Y=2 000)=1-0.4=0.6,P(Y=50 000)=0.4×(1-0.6)=0.16,P(Y=70 000)=0.4×0.6=0.24,所以E(Y)=2 000×0.6+50 000×0.16+70 000×0.24=26 000(元),E(X)=2 000×0.4+20 000×0.36+70 000×0.24=24 800(元),
所以E(X)<E(Y),所以为了使甲同学可获得奖金累计总额期望更大,应该优先选择挑战B类知识.
[针对训练]
1.某公司计划购买2台机器,该种机器使用三年后即被淘汰,机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元,在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得到其频数分布直方图(如图所示).将这100台机器在三年内更换的易损零件数的频率视为1台机器在三年内更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)以购买易损零件所需费用的均值为决策依据,在n=19与n=20之中选其一,应选用哪个?并说明理由.
解:(1)由频数分布直方图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,
所以X的可能取值为16,17,18,19,20,21,22,
则P(X=16)=0.2×0.2=0.04,
P(X=17)=2×0.2×0.4=0.16,
P(X=18)=2×0.2×0.2+0.4×0.4=0.24,
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24,
P(X=20)=2×0.2×0.4+0.2×0.2=0.2,
P(X=21)=2×0.2×0.2=0.08,
P(X=22)=0.2×0.2=0.04,
所以X的分布列为
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(2)记Y表示2台机器在购买易损零件上所需的费用(单位:元),当n=19时,E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040,
当n=20时,E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
因为4 040<4 080,所以当n=19时所需费用的均值小于n=20时所需费用的均值,故应选n=19.
题型(二) 与统计有关的分布列的均值
[例2] 某学校随机抽取了高三年级的甲、乙两个班级进行网络问卷调查,统计学生每天的学习时间(单位:h),将样本数据分成[3,4),[4,5),[5,6),[6,7),[7,8]五个组,并整理得到如图所示的频率分布直方图.
(1)已知该校高三年级共有600名学生,根据甲班的统计数据,估计该校高三年级每天学习时间达到5小时及以上的学生人数;
(2)已知这两个班级各有40名学生,从甲、乙两个班级每天学习时间不足4小时的学生中随机抽取3人,记抽到的甲班学生人数为X,求X的分布列和均值;
(3)记甲、乙两个班级学生每天学习时间的方差分别为,,试比较与的大小.(只需写出结论)
解:(1)由甲班频率分布直方图知,甲班每天学习时间达到5小时及以上的频率为(0.500+0.250+0.050)×1=0.8.故该校高三年级每天学习时间达到5小时及以上的学生人数约为0.8×600=480.
(2)甲班每天学习时间不足4小时的人数约为40×0.050×1=2,乙班每天学习时间不足4小时的人数约为40×0.100×1=4,
所以两个班每天学习时间不足4小时的学生共6人.从中随机抽取3人,抽到的甲班学生人数X的可能取值为0,1,2,且X服从超几何分布,
则P(X=0)==,P(X=1)==,
P(X=2)==,
所以X的分布列为
X
0
1
2
P
法一 E(X)=0×+1×+2×=1.
法二 E(X)==1.
(3)从甲、乙两个班级学生每天学习时间的频率分布直方图上来看,甲班的数据比较集中,乙班的数据相比甲班较为分散,故<.
|思|维|建|模|
求与统计有关的分布列问题,常借助题设条件运用古典概型的计算公式、二项分布的计算公式、超几何分布的计算公式及均值的公式求解,或借助题设条件运用频率分布直方图和分布列求解.
[针对训练]
2.某学校对高中生体质健康调研,随机抽取100名学生的体重(单位:kg)得到如下频数分布表:
分组
[40,50)
[50,60)
[60,70)
[70,80)
[80,90]
频数
5
25
40
20
10
(1)估计样本的中位数;
(2)从样本[60,70)和[70,80)中按分层抽样抽取学生6人,再从这6人中随机抽取3人,其中体重在[60,70),[70,80)的人数分别为x,y,记X=x-y.
①求X的分布列及期望;
②求D(2X+1).
解:(1)因为5+25=30<50,5+25+40=70>50,
故样本的中位数落在[60,70)内,
又40÷2=20,30+20=50,故中位数为=65.
(2)①[60,70)和[70,80)的人数比为40∶20=2∶1,分层抽样抽取学生6人中,[60,70)和[70,80)的人数分别为6×=4和6×=2, 故这6人中随机抽取3人,x的可能取值为3,2,1,对应的y的取值为0,1,2,
所以X的可能取值为3,1,-1,
P(X=3)==,P(X=1)==,
P(X=-1)==,
故X的分布列为
X
3
1
-1
P
期望为E(X)=3×+1×+(-1)×=1.
②由①知D(X)=(3-1)2×+(1-1)2×+(-1-1)2×=,
所以D(2X+1)=4D(X)=.
题型(三) 离散型随机变量分布列与数列的综合
[例3] (2023·新课标Ⅰ卷)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率.
(2)求第i次投篮的人是甲的概率.
(3)已知:若随机变量Xi服从两点分布,且P(Xi=1)=1-P(Xi=0)=qi,i=1,2,…,n,则E(Xi)=qi.记前n次(即从第1次到第n次投篮)中甲投篮的次数为Y,求E(Y).
解:(1)设“第i次投篮的人是甲”为事件Ai,“第i次投篮的人是乙”为事件Bi,
所以P(B2)=P(A1B2)+P(B1B2)
=P(A1)P(B2|A1)+P(B1)P(B2|B1)
=0.5×(1-0.6)+0.5×0.8=0.6.
(2)设“第i次投篮的人是甲的概率”为pi,由题意可知p1=,pi+1=pi×0.6+(1-pi)×(1-0.8),即pi+1=0.4pi+0.2=pi+,所以pi+1-=,又p1-=-=,所以数列是以为首项,为公比的等比数列,
所以pi-=×,
所以pi=+×.
(3)设第i次投篮时甲投篮的次数为Xi,则Xi的可能取值为0,1,当Xi=0时,表示第i次投篮的人是乙,当Xi=1时,表示第i次投篮的人是甲,所以P(Xi=1)=pi,P(Xi=0)=1-pi,所以E(Xi)=pi.Y=X1+X2+X3+…+Xn,
则E(Y)=E(X1+X2+X3+…+Xn)=p1+p2+p3+…+pn,由(2)知,pi=+×,所以E(Y)=p1+p2+p3+…+pn=+×=+×=+×.
[针对训练]
3.从甲、乙、丙、丁、戊5人中随机地抽取三个人去做传球训练.训练规则是确定一人第一次将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人,每次必须将球传出.
(1)记甲、乙、丙三人中被抽到的人数为随机变量X,求X的分布列和数学期望;
(2)若刚好抽到甲、乙、丙三个人相互做传球训练,且第1次由甲将球传出,记n次传球后球在甲手中的概率为Pn(n=1,2,3,…).
①直接写出P1,P2,P3的值;
②求与Pn(n∈N+)的关系式,并求出Pn(n∈N+).
解:(1)X的所有可能取值为1,2,3.则
P(X=1)==,P(X=2)==,
P(X=3)==.
所以随机变量X的分布列为
X
1
2
3
P
数学期望E(X)=1×+2×+3×=1.8.
(2)①由题意得P1=0,P2==,P3==.
②记An表示事件“经过n次传球后,球在甲手中”.An+1=·An+1+An·An+1,
所以Pn+1=P(·An+1+An·An+1)
=P(·An+1)+P(An·An+1)
=P()·P(An+1|)+P(An)·P(An+1|An)=(1-Pn)·+Pn·0
=(1-Pn).即Pn+1=-Pn+(n∈N+).
所以Pn+1-=-,
且P1-=-,所以数列表示以-为首项,-为公比的等比数列,
所以Pn-=-×,
Pn=-×+=×=×.即n次传球后球在甲手中的概率是×.
学科网(北京)股份有限公司
$