内容正文:
专题微课
离散型随机变量及其分布列
建构知识体系
融通学科素养
1.浸润的核心素养
(1)通过解决统计图表与随机变量的均值、方差的综合问题,重点提升直观想象、数据分析的核心素养.
(2)在学习超几何分布与二项分布区别的过程中,重点提升数学建模、数据分析、数学运算的核心素养.
2.渗透的数学思想
(1)涉及数形结合的题目主要是统计图表和随机变量的分布列的综合问题,要仔细观察统计图表,以便从中提取信息用以后续计算.
(2)在涉及概率问题的计算时,要注意转化为古典概型问题或相互独立事件的概率问题,体现了转化与化归的思想方法.
CONTENTS
目录
1
2
3
题型(一) 离散型随机变量均值与方差的决策性问题
题型(二) 与互斥、独立事件有关的分布列的均值与方差
题型(三) 与统计有关的分布列的均值
4
课时跟踪检测
题型(一) 离散型随机变量均值与方差的决策性问题
01
[例1] 在一个抽奖游戏中,主持人从编号为1,2,3的三个外观相同的空箱子中随机选择一个,放入一个金蛋,再将三个箱子关闭.主持人知道金蛋在哪个箱子里.游戏规则是主持人请抽奖人在三个箱子中选择一个,若金蛋在此箱子里,抽奖人得到200元奖金;若金蛋不在此箱子里,抽奖人得到50元参与奖.无论抽奖人是否抽中金蛋,主持人都重新随机放置金蛋,关闭三个箱子,等待下一个抽奖人.
(1)求前3位抽奖人抽中金蛋人数X的分布列和方差;
X 0 1 2 3
P
方差D(X)=3××=.
解:由题意知,抽中金蛋人数X服从二项分布,即X~B,则P(X=0)==;
P(X=1)=××==;
P(X=2)=××==;
P(X=3)==,
∴X的分布列为
(2)为了增加节目效果,改变游戏规则:当抽奖人选定编号后,主持人在剩下的两个箱子中打开一个空箱子.与此同时,主持人也给抽奖人一个改变选择的机会,如果抽奖人改变选择后,抽到金蛋,奖金翻倍;否则,取消参与奖.若仅从最终所获得的奖金考虑,抽奖人该如何抉择呢?
解:若改变选择,记获得奖金数为Y,则Y可能的取值为0,400,
则P(Y=400)=×1=,P(Y=0)=1-P(Y=400)=,
∴改变选择时,获得奖金数的数学期望E(Y)=0×+400×=;
若不改变选择,记获得奖金数为Z,则Z可能的取值为50,200,
则P(Z=50)=,P(Z=200)=,
∴不改变选择时,获得奖金数的数学期望E(Z)=50×+200×=100.
∵E(Y)>E(Z),
∴抽奖人应改变选择.
针对训练
1.某公司计划购买2台机器,该种机器使用三年后即被淘汰,机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元,在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,
为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得到其频数分布直方图(如图所示).将这100台机器在三年内更换的易损零件数的频率视为1台机器在三年内更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
解:由频数分布直方图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,
所以X的可能取值为16,17,18,19,20,21,22,
则P(X=16)=0.2×0.2=0.04,P(X=17)=2×0.2×0.4=0.16,
P(X=18)=2×0.2×0.2+0.4×0.4=0.24,
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24,
P(X=20)=2×0.2×0.4+0.2×0.2=0.2,
P(X=21)=2×0.2×0.2=0.08,
P(X=22)=0.2×0.2=0.04,
所以X的分布列为
X 16 17 18 19 20 21 22
P 0.04 0.16 0.24 0.24 0.2 0.08 0.04
(2)以购买易损零件所需费用的均值为决策依据,在n=19与n=20之中选其一,应选用哪个?并说明理由.
解:记Y表示2台机器在购买易损零件上所需的费用(单位:元),当n=19时,
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+
(19×200+3×500)×0.04=4 040,
当n=20时,E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)
×0.04=4 080.
因为4 040<4 080,
所以当n=19时所需费用的均值小于n=20时所需费用的均值,故应选n=19.
题型(二) 与互斥、独立事件有关的分布列的均值与方差
02
[例2] 猜歌名游戏是根据歌曲的主旋律制成的铃声来猜歌名.某嘉宾参加猜歌名节目,节目组准备了A,B两组歌曲的主旋律制成的铃声,随机从A,B两组歌曲中各播放两首歌曲的主旋律制成的铃声,该嘉宾根据歌曲的主旋律制成的铃声来猜歌名.已知该嘉宾猜对A组中每首歌曲歌名的概率均是,猜对B组中每首歌曲歌名的概率均是,且猜对每首歌曲的歌名相互独立.
(1)求该嘉宾至少猜对2首歌曲歌名的概率;
解:该嘉宾一首歌曲的歌名都没有猜对的概率P1=×=,
该嘉宾只猜对一首歌曲歌名的概率P2=×××+×××=,
故该嘉宾至少猜对2首歌曲歌名的概率P=1-P1-P2=.
(2)若嘉宾猜对一首A组歌曲的歌名得1分,猜对一首B组歌曲的歌名得2分,猜错均得0分,记该嘉宾累计得分为X,求X的分布列与均值.
解:由题意可得X的所有可能取值是0,1,2,3,4,5,6,没有猜对A组中每首歌曲歌名的概率为1-=,没有猜对B组中每首歌曲歌名的概率是1-=,则P(X=0)=×=,
P(X=1)=×××=,
P(X=2)=×+×××=,
P(X=3)=×××××=,
P(X=4)=×××+×=,
P(X=5)=×××=,
P(X=6)=×=.
故X的分布列为
X 0 1 2 3 4 5 6
P
故E(X)=0×+1×+2×+3×+4×+5×+6×=.
|思|维|建|模|
若随机变量取某一值的概率较为复杂或不好求解时,可以利用分布列的性质求其概率.
针对训练
2.为了促进消费,某商场针对会员客户推出会员积分兑换商品活动:每位会员客户可在价值80元,90元,100元的A,B,C三种商品中选择一种使用积分进行兑换,每10积分可兑换1元.已知参加活动的甲、乙两位会员客户各有1 000积分,且甲兑换A,B,C三种商品的概率分别为,,,乙兑换A,B,C三种商品的概率分别为,,,且他们兑换何种商品相互独立.
(1)求甲、乙两人兑换同一种商品的概率;
解:由题可知,甲、乙两人兑换同一种商品的概率为×+×+×=.
(2)记X为两人兑换商品后的积分总余额,求X的分布列与均值.
X 0 100 200 300 400
P
E(X)=0×+100×+200×+300×+400×=250.
解:由题意知,兑换A,B,C三种商品所需的积分分别为800,900,1 000,
则X的取值可能为0,100,200,300,400,P(X=0)=×=,
P(X=100)=×+×=,
P(X=200)=×+×+×=,
P(X=300)=×+×=,
P(X=400)=×=,
所以X的分布列为
题型(三) 与统计有关的分布列的均值
03
[例3] 某学校随机抽取了高三年级的甲、乙两个班级进行网络问卷调查,统计学生每天的学习时间(单位:h),将样本数据分成[3,4),[4,5),[5,6),[6,7),
[7,8]五个组,并整理得到如图所示的频率分布直方图.
(1)已知该校高三年级共有600名学生,根据甲班的统计数据,估计该校高三年级每天学习时间达到5小时及以上的学生人数;
解:由甲班频率分布直方图知,甲班每天学习时间达到5小时及以上的频率为(0.500+0.250+0.050)×1=0.8.故该校高三年级每天学习时间达到5小时及以上的学生人数约为0.8×600=480.
(2)已知这两个班级各有40名学生,从甲、乙两个班级每天学习时间不足4小时的学生中随机抽取3人,记抽到的甲班学生人数为X,求X的分布列和均值;
X 0 1 2
P
法一 E(X)=0×+1×+2×=1.
法二 E(X)==1.
解:甲班每天学习时间不足4小时的人数约为40×0.050×1=2,乙班每天学习时间不足4小时的人数约为40×0.100×1=4,
所以两个班每天学习时间不足4小时的学生共6人.从中随机抽取3人,抽到的甲班学生人数X的可能取值为0,1,2,且X服从超几何分布,则P(X=0)==,P(X=1)==,
P(X=2)==,
所以X的分布列为
(3)记甲、乙两个班级学生每天学习时间的方差分别为,,试比较与的大小.(只需写出结论)
解:从甲、乙两个班级学生每天学习时间的频率分布直方图上来看,甲班的数据比较集中,乙班的数据相比甲班较为分散,故<.
|思|维|建|模|
求与统计有关的分布列问题,常借助题设条件运用古典概型的计算公式、二项分布的计算公式、超几何分布的计算公式及均值的公式求解,或借助题设条件运用频率分布直方图和分布列求解.
针对训练
3.某市为争创“文明城市”,现对城市的主要路口进行“文明骑车”道路监管.为了解市民对该项目的满意度,分别从不同地区随机抽取了200名市民对该项目进行评分,绘制如下频率分布直方图.
(1)求频率分布直方图中a的值;
解:在频率分布直方图中,所有矩形的面积之和为1,则(0.002+0.004+0.014+0.02+0.035+a)×10=1,解得a=0.025.
(2)用频率作为概率的估计值,现从该城市市民中随机抽取4人进一步了解情况,用X表示抽到的评分在90分以上的人数,求X的分布列及均值E(X).
解:因为评分在90分以上的市民所占的频率为0.025×10=0.25=,
由题意可知,X~B,所以P(X=0)==,
P(X=1)=××=,P(X=2)=××=,
P(X=3)=××=,P(X=4)==,
所以随机变量X的分布列为
E(X)=4×=1.
X 0 1 2 3 4
P
课时跟踪检测
04
1
3
4
5
6
7
8
9
10
11
12
13
2
1.某一供电网络有n个用电单位,每个单位在一天中用电的机会都是p,则供电网络中一天平均用电单位的个数是 ( )
A.np(1-p) B.np C.n D.p(1-p)
√
解析:∵用电单位的个数X~B(n,p),
∴E(X)=np.
1
5
6
7
8
9
10
11
12
13
2
3
4
2.若随机变量X的分布列如下表所示,则E(X)等于 ( )
A. B. C. D.
X 0 1 2 3 4 5
P 2x 3x 7x 2x 3x x
解析:因为2x+3x+7x+2x+3x+x=18x=1,所以x=,因此E(X)=0×2x+1×3x+2×7x+3×2x+4×3x+5×x=40x=40×=.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
3.某机械研究所对新研发的某批次机械元件进行寿命追踪调查,随机抽查的200个机械元件情况如表所示:
若以频率视为概率,现从该批次机械元件中随机抽取3个,则至少有2个元件的使用寿命在30天以上的概率为 ( )
A. B. C. D.
使用时间/天 10~20 21~30 31~40 41~50 51~60
个数 10 40 80 50 20
解析:由题表可知元件使用寿命在30天以上的概率为=,则所求概率为××+=.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
4.已知离散型随机变量X的分布列为
则D(X)的值为 ( )
A. B. C. D.1
X 0 1 2
P m
解析:由分布列的性质,知+m+=1,∴m=.∴E(X)=0×+1×+2×=1,
D(X)=(0-1)2×+(1-1)2×+(2-1)2×=.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
5.已知X是离散型随机变量,P(X=x1)=,P(X=x2)=,且x1<x2,若E(X)=,
D(X)=,则x1+x2的值为( )
A. B. C.3 D.
√
解析:∵E(X)=x1+x2=,∴x2=4-2x1.又D(X)=×+
×=,x1<x2,∴x1=1,x2=2,∴x1+x2=3.
1
5
6
7
8
9
10
11
12
13
3
4
2
6.已知随机变量ξ的分布列如下表,若D(ξ-1)=,则E(ξ-1)=( )
A. B.- C.-或- D.或-
ξ -1 0 1
P a c
解析:由题意得,a+c=,a∈,E(ξ)=-2a+.若D(ξ-1)=,则D(ξ)=,
所以a++=,整理得,12a2-8a+1=0,解得a=或a=.所以E(ξ)=-2a+=-或,E(ξ-1)=
E(ξ)-1=-或-.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
7.小王到某公司面试,一共要回答3道题,每道题答对得2分,答错倒扣1分,设他每道题答对的概率均为p(0<p<1),且每道题答对与否相互独立,记小王答完3道题的总得分为X,则当E(X)+D(X)取得最大值时,p= ( )
A. B. C. D.
解析:设答对题的个数为Y,由已知可得Y~B(3,p),所以E(Y)=3p,D(Y)=3p(1-p),
因为每道题答对得2分,答错倒扣1分,X为小王答完3道题的总得分,所以X=2Y-(3-Y)=3Y-3,所以E(X)=3E(Y)-3=9p-3,D(X)=9D(Y)=9×3p(1-p)=27p(1-p),所以E(X)+D(X)=-27p2+36p-3=-27+9.又0<p<1,所以当p=时,E(X)+D(X)取最大值,最大值为9.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
8.[多选]某计算机程序每运行一次都随机出现一个五位二进制数A=a1a2a3a4a5(例如10 100),其中A的各位数中ak(k=1,2,3,4,5)出现0的概率为,出现1的概率为,记X=a1+a2+a3+a4+a5,则当程序运行一次时( )
A.X服从超几何分布 B.P(X=1)=
C.X的均值E(X)= D.X的方差D(X)=
解析:由二进制数A的特点知,每一个数位上的数字只能填0,1,且每个数位上的数字互不影响,故X的可能取值有0,1,2,3,4,5,且X的取值表示1出现的次数,由二项分布的定义,可得X~B,故A错误;P(X=1)==,故B正确;因为X~B,所以E(X)=5×=,D(X)=5××=,故C、D正确.故选BCD.
√
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
9.(5分)李明参加某大会的青年志愿者选拔,在已知备选的10道题中,李明能答对其中的6道,规定考试从备选题中随机地抽出3题进行测试,至少答对2题才能入选.则李明入选的概率为_________.
解析:设所选3题中李明能答对的题数为X,则X服从参数为N=10,M=6,n=3的超几何分布,且P(X=k)=(k=0,1,2,3),
故所求概率为P(X≥2)=P(X=2)+P(X=3)=+=+=.
1
5
6
7
8
9
10
11
12
13
3
4
2
10.(5分)某校为了增强学生对传统文化的继承和发扬,组织了一场《诗词大会》 PK赛(共4局),A,B两队各由4名选手组成,每局两队各派一名选手PK,除第三局胜者得2分外,其余各胜者均得1分,每局的负者得0分.假设每局比赛A队选手获胜的概率均为,且各局比赛结果相互独立,比赛结束时A队的得分高于B队得分的概率为_____.
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:比赛结束时A队的得分高于B队得分的情况有三种,
第一种:A队全胜,概率为=.
第二种:A队三胜一负,概率为××=,
第三种:A队胜第三局,另外三局一胜二负,概率为×××=.所以比赛结束时A队的得分高于B队得分的概率为++=.
1
5
6
7
8
9
10
11
12
13
3
4
2
11.(5分)五一临近,某火车站有三个安检入口,每个安检入口每天通过的旅客人数超过1 100的概率不低于0.2,假设三个安检入口均能正常工作,则这三个安检入口每天至少有两个超过1 100人的概率最小为 ________.
0.104
解析:由题意可知旅客人数X超过1 100人的概率不低于0.2,即P(X>
1 100)≥0.2,所以这三个安检入口每天至少有两个超过1 100人的概率最小为P=×0.22×(1-0.2)+×0.23×(1-0.2)0=0.104.
1
5
6
7
8
9
10
11
12
13
3
4
2
12.(15分)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将100个样本数据按[30,40),[40,50),[50,60),[60,70),[70,80),[80,90]分成6组,并整理得到如下频率分布直方图.
(1)请通过频率分布直方图估计这100份
样本数据的平均值;(同一组中的数据用
该组区间的中点值作代表)(5分)
1
5
6
7
8
9
10
11
12
13
3
4
2
解:由频率分布直方图可知,100份样本数据的平均值为
=(35×0.005+45×0.010+55×0.010+65×0.020+75×0.032+85×
0.023)×10=68.3.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)以样本频率估计概率,若竞赛成绩不低于60分,则被认定为成绩合格,低于60分说明成绩不合格.从参加知识竞赛的市民中随机抽取5人,用X表示成绩合格的人数,求X的分布列及均值.(10分)
解:竞赛成绩不低于60分的频率为(0.020+0.032+0.023)×10=0.75=,低于60分的频率为(0.005+0.010+0.010)×10=0.25=.
由题意可知X~B, P(X=0)==,
P(X=1)=××=,
1
5
6
7
8
9
10
11
12
13
3
4
2
P(X=2)=×==,P(X=3)=×==,
P(X=4)=×=,P(X=5)==,所以X的分布列为
EX=5×=.
X 0 1 2 3 4 5
P
1
5
6
7
8
9
10
11
12
13
3
4
2
13.(15分)2023年冬,甲型流感病毒来势汹汹.某科研小组经过研究发现,患病者与未患病者的某项医学指标有明显差异.在某地的两类人群中各随机抽取20人的该项医学指标作为样本,得到如右栏所示的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确
定临界值a,将该指标小于a的人判定为
阳性,大于或等于a的人判定为阴性.此
检测标准的漏诊率是将患病者判定为阴性的概率,记为p(a);误诊率是将未患病者判定为阳性的概率,记为q(a).假设数据在组内均匀分布,用频率估计概率.
1
5
6
7
8
9
10
11
12
13
3
4
2
(1)当临界值a=20时,求漏诊率p(a)和误诊率q(a);(4分)
解:由频率分布直方图可知p(20)=0.02×5=0.1,q(20)=0.01×5=0.05.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)从指标在区间[20,25]样本中随机抽取2人,记随机变量X为未患病者的人数,求X的分布列和均值;(5分)
解:样本中患病者在区间[20,25]的人数是20×0.02×5=2,未患病者在区间[20,25]的人数是20×0.03×5=3,总人数为5.由题意知X可能的取值为0,1,2.则P(X=0)==,P(X=1)==,P(X=2)==.
所以随机变量X的分布列为
E(X)=0×+1×+2×=.
X 0 1 2
P
1
5
6
7
8
9
10
11
12
13
3
4
2
(3)在该地患病者占全部人口的5%的情况下,记f(a)为该地诊断结果不符合真实情况的概率.当a∈[20,25]时,直接写出使得f(a)取最小值时a的值.(6分)
解:由题意得,f(a)=q(a)×95%+p(a)×5%,
当a∈[20,25]时,令a=t+20(t=0,1,2,3,4,5),
则q(a)=5×,p(a)=5×,
所以f(a)=g(t)=5××95%+5××5%,则关于t的一次函数的系数为5(0.03×19%-0.02×1%)>0,故g(t)单调递增.所以当t=0,即a=20时,f(a)取最小值.
$