内容正文:
专题微课 离散型随机变量及其分布列
CONTENTS
目录
1
2
3
题型(一) 超几何分布与二项分
布的区别
题型(二)概率与统计相结合
题型(三) 概率与数列相结合
4
课时跟踪检测
题型(一)超几何分布与二项分布的区别
01
[例1] 某食品厂为了检查一条自动包装流水线的生产情况,对该流水线上的产品进行简单随机抽样,获得数据如下表:
分组区间
(单位:克) [490,
495] (495,
500] (500,
505] (505,
510] (510,
515]
产品件数 3 4 7 5 1
包装质量在[495,510]克的产品为一等品,其余为二等品.
解:样本中的产品件数为3+4+7+5+1=20,包装质量在[495,510]克的产品件数为4+7+5=16,故从该流水线上任取一件产品为一等品的概率P==.
(1)估计从该流水线上任取一件产品为一等品的概率;
(2)从上述抽取的样本产品中任取2件,设X为一等品的产品数量,求X的分布列;
解:依题意,得X的可能取值为0,1,2,P(X=2)==,P(X=1)==,P(X=0)==.故X的分布列为
X 0 1 2
P
(3)从该流水线上任取2件产品,设Y为一等品的产品数量,求Y的分布列;试比较期望E(X)与期望E(Y)的大小.(结论不要求证明)
解:由(2)可得E(X)=0×+1×+2×=,依题意得Y~B,且Y的可能取值为0,1,2,则P(Y=2)==,
P(Y=1)=××=,P(Y=0)==.
故Y的分布列为
Y 0 1 2
P
所以E(Y)=2×=,E(Y)=E(X).
|思|维|建|模| 二项分布与超几何分布的辨别方法
项目 二项分布 超几何分布
特点 在n重伯努利试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p 在含有M件次品的N件产品中,任取n件,其中恰有X件次品
概率
公式 P(X=k)=·pk(1-p)n-k,
k=0,1,2,…,n P(X=k)=,k=0,1,2,…,m(m=min{n,M},且n≤N,M≤N,n,M,N∈N*)
期望、
方差
公式 E(X)=np,
D(X)=np(1-p)
E(X)=,
D(X)=
当N→+∞时,超几何分布近似为二项分布
续表
针对训练
1.在10件产品中有2件次品,连续抽3次,每次抽1件,求:
(1)不放回抽样时,抽取次品数X的均值;
解:法一 由题意知X的可能取值为0,1,2.P(X=0)==;
P(X=1)==;P(X=2)==. ∴随机变量X的分布列为
X 0 1 2
P
E(X)=0×+1×+2×=.
法二 由题意知P(X=k)=(k=0,1,2),
∴随机变量X服从超几何分布,n=3,M=2,N=10,
∴E(X)===.
(2)放回抽样时,抽取次品数Y的均值与方差.
解:由题意知抽取1次取到次品的概率为=,
随机变量Y服从二项分布B,
∴E(Y)=3×=,D(Y)=3××=.
2.某校高一年级举行数学史知识竞赛,每个同学从10道题中一次性抽出
4道作答.小张有7道题能答对,3道不能答对;小王每道答对的概率均为
p(0<p<1),且每道题答对与否互不影响.
(1)分别求小张,小王答对题目数的分布列;
解:设小张答对的题目数为X,可知随机变量X服从超几何分布,X的取值分别为1,2,3,4.有P(X=1)===,
P(X=2)===,
P(X=3)===,P(X=4)===,
故小张答对的题目数X的分布列为
X 1 2 3 4
P
设小王答对的题目数为Y,可知随机变量Y服从二项分布Y~B(4,p),Y的取值分别为0,1,2,3,4,
有P(Y=0)=(1-p)4,P(Y=1)=(1-p)3p=4p(1-p)3,
P(Y=2)=(1-p)2p2=6p2(1-p)2,
P(Y=3)=(1-p)p3=4p3(1-p),P(Y=4)=p4.
故小王答对的题目数Y的分布列为
Y 0 1 2 3 4
P (1-p)4 4p(1-p)3 6p2(1-p)2 4p3(1-p) p4
(2)若预测小张答对题目数多于小王答对题目数,求p的取值范围.
解:由(1)可知E(X)=1×+2×+3×+4×=,而Y~B,
所以E(Y)=4p,若预测小张答对的题目数多于小王答对的题目数,
则E(X)>E(Y),即>4p,可得0<p<.故p的取值范围是.
题型(二)概率与统计相结合
02
[例2] 某学校随机抽取了高三年级的甲、乙两个班级进行网络问卷调查,统计学生每天的学习时间(单位:h),将样本数据分成[3,4),[4,5),[5,6),[6,7),[7,8]五个组,并整理得到如图所示的频率分布直方图.
(1)已知该校高三年级共有600名学生,根据甲班的统计数据,估计该校高三年级每天学习时间达到5小时及以上的学生人数;
解:由甲班频率分布直方图知,甲班每天学习时间达到5小时及以上的频率为(0.500+0.250+0.050)×1=0.8.故该校高三年级每天学习时间达到5小时及以上的学生人数约为0.8×600=480.
(2)已知这两个班级各有40名学生,从甲、乙两个班级每天学习时间不足4小时的学生中随机抽取3人,记抽到的甲班学生人数为X,求X的分布列和均值;
解:甲班每天学习时间不足4小时的人数约为40×0.050×1=2,乙班每天学习时间不足4小时的人数约为40×0.100×1=4,
所以两个班每天学习时间不足4小时的学生共6人.从中随机抽取3人,
则抽到的甲班学生人数X的可能取值为0,1,2,且X服从超几何分布,
则P(X=0)==,P(X=1)==,P(X=2)==,
所以X的分布列为
X 0 1 2
P
法一 E(X)=0×+1×+2×=1.
法二 E(X)==1.
(3)记甲、乙两个班级学生每天学习时间的方差分别为,,试比较与的大小.(只需写出结论)
解:从甲、乙两个班级学生每天的学习时间的频率分布直方图上来看,甲班的数据比较集中,乙班的数据相比甲班较为分散,故<.
|思|维|建|模|
求与统计有关的分布列问题,常借助题设条件运用古典概型的计算公式、二项分布的计算公式、超几何分布的计算公式及均值的公式求解,或借助题设条件运用频率分布直方图和分布列求解.
针对训练
3.某市为争创“文明城市”,现对城市的主要路口进行“文明骑车”的道路监管,为了解市民对该项目的满意度,分别从不同地区随机抽取了200名市民对该项目进行评分,绘制如下频率分布直方图.
(1)求频率分布直方图中a的值;
解:在频率分布直方图中,所有矩形的面积之和为1,
则(0.002+0.004+0.014+0.02+0.035+a)×10=1,解得a=0.025.
(2)用频率作为概率的估计值,现从该城市市民中随机抽取4人进一步了解情况,用X表示抽到的评分在90分以上的人数,求X的分布列及均值E(X).
解:因为评分在90分以上的市民所占的频率为0.025×10=0.25,
由题意可知,X~B,所以P(X=0)==,
P(X=1)=××=,
P(X=2)=××=,P(X=3)=××=,
P(X=4)==,所以随机变量X的分布列为
X 0 1 2 3 4
P
所以E(X)=4×=1.
题型(三) 概率与数列
相结合
03
[例3] 甲、乙两人进行乒乓球比赛,规则如下:①每局胜者得1分,负者得0分;②若比赛进行到有一人比对方多2分或两人得分之和达到6分时停止比赛.设甲在每局中获胜的概率均为p,第二局比赛结束时比赛停止的概率为,且各局胜负相互独立.
(1)求p;
解:由p2+(1-p)2=得p=或p=.
∵p>,∴p=.
(2)记X表示比赛停止时已比赛的局数,求X的分布列及数学期望;
解:X的可能取值为2,4,6,由(1)知,当X=2时,P(X=2)=,P(X=4)=+=,P(X=6)=1-P(X=2)-
P(X=4)=, ∴X的分布列如表所示:
X 2 4 6
P
故E(X)=2×+4×+6×=.
(3)若不限定局数(即删去两人得分之和达到6分时停止比赛这一条件),设an为比赛进行n局后仍未停止比赛的概率,求数列{an}的通项公式.
解:由题可得a1=1,a3=a2=2××=,当n为奇数(n≥3)时,
第(n-1)局没有停,甲、乙得分均为分,则an=an-1;
当n为偶数时,an+2=2××an=an,
∴当n为偶数时,数列{an}是以为首项,为公比的等比数列,∴an=a2×=,当n为奇数时,n-1为偶数,
∴an=an-1=(n≥3),当n=1时,a1=1也满足.
∴通项公式an=
|思|维|建|模|
概率与数列问题的交汇,多以概率的求解为主线,建立关于概率的递推关系.解决此类问题的基本步骤为
精准
定性 即明确所求概率的“事件属性”,这是确定概率概型的依据,也是建立递推关系的准则
准确
建模 即通过概率的求解,建立递推关系,转化为数列模型问题
解决
模型 也就是递推数列的求解,多通过构造的方法转化为等差数列、等比数列的问题求解.求解过程应灵活运用数列的性质,准确应用相关公式
针对训练
4.甲、乙两人进行乒乓球比赛,每局比赛甲获胜的概率是p(0<p<1),乙获胜的概率是1-p,每局比赛相互独立.
(1)当p=0.6时,比赛采用3局2胜制,求甲最终获胜的概率;
解:3局2胜制甲最终获胜结果可以是2∶0,2∶1,每局比赛甲获胜的概率p=0.6,根据独立事件乘法公式和互斥事件的加法公式得,
甲最终获胜的概率是0.62+2×0.62×0.4=0.648.
(2)若比赛采用5局3胜制比3局2胜制对甲更有利(即甲最终获胜概率更大),确定p的取值范围;
解:3局2胜制甲最终获胜结果可以是2∶0,2∶1,每局比赛甲获胜的概率为p,根据独立事件乘法公式和互斥事件的加法公式得,甲最终获胜的概率是p1=p2+2p2(1-p)=p2(3-2p);5局3胜制甲最终获胜结果可以是3∶0,3∶1,3∶2,则甲最终获胜的概率是p2=p3+3p3(1-p)+6p3(1-p)2=p3(6p2-15p+10).由题知p2>p1,即p2-p1>0,则p2-p1=
p3(6p2-15p+10)-p2(3-2p)=3p2(p-1)2(2p-1)>0.又p∈(0,1),
则p的取值范围是.
(3)若甲、乙共进行10局比赛,随机变量X表示甲获胜的局数.令an=
P(X=n-1)(n=1,2,…,11),若a7是数列an的唯一的最大项,确定p的取值范围.
解:由题,X~B(10,p),故an=P(X=n-1)=pn-1(1-p)11-n(n=1,2,…,11).a7是数列{an}的唯一的最大项,则必有a6<a7>a8,
即p5(1-p)5<p6(1-p)4>p7(1-p)3,解得p∈,
此时,==≥1⇔n≤11p,
则11p∈(6,7).所以当n≤6时,an<an+1;
当n>6时,an>an+1,
即a1<a2<…<a6<a7>a8>…>a11,
故a7是数列{an}唯一的最大项.
综上,p的取值范围是.
课时跟踪检测
04
1
3
4
2
1.(10分)某校科技节进行答题竞赛,满分100分,现得到全校学生成绩的频率分布直方图如图所示:
1
3
4
2
(1)求m的值;(2分)
解:根据题意得(m+2m+0.015+0.02×2+0.03)×10=1,解得m=0.005.
(2)以每一组数据的中间值为代表,估计本次成绩的平均值;(3分)
解:以每一组数据的中间值为代表,估计本次考试的平均成绩为
=45×0.05+55×0.15+65×0.2+75×0.3+85×0.2+95×0.1=72.5.
(3)若采用分层按比例抽样的方法从成绩在[40,70)的同学中抽取8名同学的成绩进行失分分析,如果从抽到的8名同学中不放回抽取3份试卷,记得到分数在[50,60)内的人数为随机变量ξ,求ξ的分布列和数学期望.(5分)
1
3
4
2
解:根据频率分布直方图可知,全校同学中成绩在[40,50),[50,60),[60,70)各段的同学人数比例为1∶3∶4,所以样本中三段分数的同学为1人,3人,4人,
所以随机变量ξ的可能取值为0,1,2,3,
则P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,P(ξ=3)==,
1
3
4
2
所以随机变量ξ的分布列为
ξ 0 1 2 3
P
E(ξ)=0×+1×+2×+3×=.
1
2
3
4
2.(15分)某平台为了研究用户日均观看短视频的时长,随机抽取了200名用户进行调查,得到数据如下表:
日均时长
/分钟 [0,
10) [10,
20) [20,
30) [30,
40) [40,
50]
频数 30 50 80 30 10
1
2
3
4
解:将数据按时长升序排列,第70百分位数位置为200×70%=140,
前两组累计频数为30+50=80<140,前3组累计频数为30+50+80=160>140,
故第70百分位数落在区间[20,30),
则第70百分位数约为20+×10=27.5.
(1)估计这200名用户日均观看时长的第70百分位数;(4分)
1
2
3
4
(2)若平台规定“日均观看时长不少于30分钟的用户为潜在高粘性用户”,现从样本中有放回地抽取k次,每次抽取1人,记抽到潜在高粘性用户的人数为Y.
①当k=3时,求Y的分布列和数学期望;(7分)
②若平台希望至少抽到1名潜在高粘性用户的概率不低于90%,至少需抽取多少次?(参考数据:ln 5≈1.609,ln 2≈0.693)(4分)
解:①潜在高粘性用户的频率为=,
易得Y~B,Y的可能取值有0,1,2,3,
1
2
3
4
则P(Y=0)==,P(Y=1)=××=,
P(Y=2)=××=,P(Y=3)==,
所以Y的分布列为
Y 0 1 2 3
P
1
2
3
4
E(Y)=3×=.
②设至少需抽取n次,则1-≥0.9,
即≤0.1,
即n≥=≈≈10.3,
故至少需抽取11次.
1
3
4
2
3.(15分)现有一种趣味答题比赛,其比赛规则如下:①每位参赛者最多参加5轮比赛;②每一轮比赛中,参赛选手从10道题中随机抽取4道回答,每答对一道题积2分,答错或放弃均积0分;③每一轮比赛中,获得积分至少6分的选手将获得“挑战达人”勋章一枚;④结束所有轮比赛后,参赛选手还可以凭总积分获得相对应的礼品.据主办方透露:这10道题中有7道题是大家都会做的,有3道题是大家都不会做的.
(1)求某参赛选手在一轮比赛中所获得积分X的分布列和期望;(7分)
解:由题知,X可取2,4,6,8,
则P(X=2)==,P(X=4)==,
1
3
4
2
P(X=6)==,P(X=8)==,
所以X的分布列为
X 2 4 6 8
P
故E(X)=2×+4×+6×+8×=.
1
3
4
2
(2)若参赛选手每轮获得勋章的概率稳定且每轮是否获得勋章相互独立.问:某参赛选手在5轮参赛中,获得多少枚“挑战达人”勋章的概率最大?(8分)
解:法一 由(1)知参赛选手在一轮比赛中获得“挑战达人”勋章的概率为P=+=,则某参赛选手在5轮挑战比赛中,记获得“挑战达人”勋章的枚数为Y,则Y~B,故P(Y=k)=··(k=0,1,…,5),所以假设当Y=k时,概率最大,
1
3
4
2
则
解得3≤k≤4,而P(Y=3)=P(Y=4)=.故某参赛选手在5轮挑战比赛中,获得3枚或4枚“挑战达人”勋章的概率最大.
法二 由(1)知参赛选手在一轮比赛中获得“挑战达人”勋章的概率为P=+=,则某参赛选手在5轮挑战比赛中,记获得“挑战达人”
1
3
4
2
勋章的枚数为Y,则Y~B,故P(Y=k)=··(k=0,1,…,5),所以Y的分布列为
Y 0 1 2 3 4 5
P
从分布列中可以看出,概率最大为P(Y=3)=P(Y=4)=,
所以参赛选手在5轮挑战比赛中,获得3枚或4枚“挑战达人”勋章的
概率最大.
1
3
4
2
4.(15分)为提高学生的身体素质,除了进行体育锻炼之外,学校每天中午免费为学生提供水果和牛奶两种营养餐(每人每次只能选择其中一种),经过统计分析发现:学生第一天选择水果的概率为,选择牛奶的概率为.而前一天选择水果第二天选择水果的概率为,选择牛奶的概率为;前一天选择牛奶第二天选择水果的概率为,选择牛奶的概率也是,如此往复.记某同学第n天选择水果的概率为pn.
(1)记某班的2名同学在发放营养餐开始第二天选择水果的人数为X,求X的分布列和期望;(5分)
1
3
4
2
解:依题意,第二天选择水果的概率为p=×+×=,第二天选择牛奶的概率为p'=×+×=,第二天选择水果的人数X的可能值为0,1,2,P(X=0)==,P(X=1)=××=,
P(X=2)==,所以X的分布列为
X 0 1 2
P
故E(X)=0×+1×+2×=.
1
3
4
2
(2)证明数列是等比数列,并求数列{pn}的通项公式;(5分)
解:依题意,pn+1=pn+(1-pn)=pn+,由pn+1-=,
而p1-=-,所以数列是以-为首项,为公比的等比数列,
pn-=-×,数列{pn}的通项公式为pn=-×.
1
3
4
2
(3)为了培养学生的服务意识,30天后学校组织学生参加志愿服务活动,其中有15位学生负责为全体同学分发营养餐,应该如何安排分发水果和牛奶的人数.(5分)
解:由(2)知,pn=-×,当n=30时,×非常小,趋近于0,p30≈,pn≈(n>30),即30天后学校每天选择水果的人数约为总人数的,所以15位学生负责为全体同学分发营养餐,分发水果的人数为×15=10,分发牛奶的人数为15-10=5.
本课结束
更多精彩内容请登录:www.zghkt.cn
$