内容正文:
专题02 随机变量及概率分布模型
目录
典例详解
类型一、离散型随机变量的分布列与数字特征
类型二、二项分布
类型三、超几何分布
类型四、正态分布
压轴专练
类型一、离散型随机变量的分布列与数字特征
1.离散型随机变量的分布列的表示
(1)一般地,若离散型随机变量可能取的不同值为,取每一个值的概率,以表格的形式表示如下:
我们将上表称为离散型随机变量的概率分布列,简称为的分布列.有时为了简单起见,也用等式,表示的分布列.
(2)离散型随机变量的分布列的性质:
①pi≥0(i=1,2,…,n);②p1+p2+…+pn=1.
2.两点分布
(1)定义:对于只有两个可能结果的随机试验,用表示“成功”,表示“失败”,
定义如果,则,那么X的分布列如表所示.
X
0
1
我们称X服从两点分布或0-1分布.
注意:随机变量X只取0和1,才是两点分布,否则不是.
(2)适用范围:①研究只有两个结果的随机试验的概率分布规律;②研究某一随机事件是否发生的概率分布规律.如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等,都可以用两点分布来研究.
3.离散型随机变量的均值及其性质
(1)称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)均值的性质:
①(为常数).
②若,其中为常数,则也是随机变量,且.
③.
④如果相互独立,则.
(3)常见分布列的均值:
①若X服从两点分布,则E(X)=p;②若X~B(n,p),则E(X)=np;③若X服从参数为N,M,n的超几何分布,则E(X).
4.离散型随机变量的方差及其性质
(1)称为随机变量的方差,并称其算术平方根为随机变量的标准差,记作σ(X).方差刻画了随机变量X与其均值E(X)的平均偏离程度.
(2)方差的性质:
①(为常数).
②若,其中为常数,则也是随机变量,且.
③方差公式的变形:.
④如果两两独立,则.
(3)常见分布列的方差:
①若X服从两点分布,则D(X)=p(1-p);②若X~B(n,p),则D(X)=np(1-p).
例1.已知随机变量X服从两点分布,且,,则实数a的值为( )
A. B. C. D.或
【答案】A
【分析】根据两点分布的性质以及概率的取值范围来确定实数的值.
【详解】因为随机变量服从两点分布,所以.
.
整理得,解得,.
当时,,;
当时,,故不合题意.
综上,可得.
故选:A.
变式1-1.(多选)设随机变量X的分布列为,,,分别为随机变量X的均值与方差,则下列结论正确的是( )
A. B.
C. D.
【答案】BC
【分析】利用分布列的性质可得概率之和为1,得出,利用概率的性质可判断A选项,再利用均值方差定义公式以及其性质逐项判断BCD即可.
【详解】因为随机变量的分布列为,由分布列的性质可知,,解得,
对于A,,故A不正确;
对于B,,
,故B正确;
对于C,,故C正确;
对于D,,,故D不正确.
故选:BC.
变式1-2.(多选)离散型随机变量的数学期望为1,则( )
A. B.
C. D.
【答案】AD
【分析】根据期望和方差公式逐选项判断即可.
【详解】选项A,由于,有,根据方差公式,
,因此,
不等式恒成立,故选项A正确;
选项B,,但是平均绝对偏差,当的取值使得时(例如以等概率取0和2),
则,与相等,而非小于,因此,选项B不一定成立,错误;
选项C,令,则,且有,
由于可能为负,且,因此可能为负(例如取和的概率分布),
导致,故选项C不一定成立,错误;
选项D,令,则,
由于,有,当等号成立,故选项D正确,
故选:AD.
变式1-3.甲乙两人进行乒乓球比赛,现采用三局两胜的比赛制度,规定每一局比赛都没有平局(必须分出胜负),且每一局甲赢的概率都是p,随机变量X表示最终的比赛局数,若,则的最大值是 ;的取值范围是 .
【答案】 ; .
【分析】结合二项分布可计算随机变量的分布列,再利用公式可求、,最后利用二次函数的性质可求其范围.
【详解】随机变量可能的取值为.
.
,
故的分布列为:
故
因为,故,故.
而,
令,因为,
故,此时,
故答案为:,.
类型二、二项分布
1. 二项分布的定义
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,)
于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
2.二项分布的适用范围及本质
(1)适用范围:①各次试验中的事件是相互独立的;②每次试验只有两种结果:事件要么发生,要么不发生;③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
3.二项分布的期望、方差
若,则,.
4.二项分布中概率最大值理论
设X~B(n,p),则P(X=k)= (k=0,1,2,…,n).
(1)一般求解思路:设X=k时,对应概率最大,则应满足 然后通过求解该不等式组,结合k的取值范围即可确定k的具体取值.
(2)也可以从单调性的角度探究概率的最大值.
当k<(n+1)p时,,随k值的增加而增加;当k>(n+1)p时,,随k值的增
加而减小.
如果(n+1)p为正整数,则当k=(n+1)p时,,此时均为最大值.如果(n+1)p为非整数,而k取(n+1)p的整数部分,则是唯一的最大值.
例2.已知离散型随机变量X服从二项分布,且,,则的最小值为( )
A. B. C.2 D.4
【答案】B
【分析】根据期望和方差的线性运算得到,再利用基本不等式的运用可求的最小值.
【详解】,,
,,又,解得,即,,当且仅当,又,即当时取等,
故选:B.
变式2-1.某人在次射击中击中目标的次数为,且,记,,若是唯一的最大值,则的值为( )
A.1.28 B.1.6 C.6.4 D.8
【答案】A
【分析】根据给定条件,列出不等式求出,再利用二项分布的期望公式计算得解.
【详解】,,,
若是唯一的最大值,则 所以
解得.
因为,,
,,.
.
故选:A.
变式2-2.(多选)某计算机程序运行次,每次运行都等可能地产生或中的一个数.记出现的次数为,出现的次数多于出现的次数的概率为,则( )
A. B.
C. D.
【答案】ABD
【分析】利用二项分布的定义可判断A选项;求出的表达式,结合可判断C选项;利用独立重复试验的概率公式可判断B选项;利用的单调性可判断D选项.
【详解】对于A选项,依题意易得,A正确,
对于C选项,,
所以,
显然,C错误;
对于B选项,,B正确;
对于D选项,因为,所以.
因为,
所以,所以,D正确.
故选:ABD.
变式2-3.甲、乙两名同学进行定点投篮训练,据以往的训练数据可知,甲每次投篮命中的概率为,乙每次投篮命中的概率为,各次投篮互不影响.现甲、乙两人开展多轮次的定点投篮活动,每轮次各投2个球,每投进一个球记1分,不投进记分.
(1)求甲在一个轮次投篮结束后的得分不大于0的概率;
(2)记甲、乙每轮次投篮得分之和为X.
①求;
②若,则称该轮次为一个“成功轮次”.在连续轮次的投篮活动中,记“成功轮次”的数量为Y,当n为何值时,的值最大?
【答案】(1);
(2)①;②或或.
【分析】(1)将问题转化成甲在一轮投篮中至多命中一次,再利用对立事件和相互独立事件同时发生的概率公式,即可求解;
(2)①由条件可得,再结合独立重复试验概率公式及互斥事件概率加法公式求结论;
②根据条件,得到,再由为不等式组的解,即可求.
【详解】(1)甲在一轮投篮结束后的得分不大于,即甲在一轮投篮中至多命中一次,
所以甲在一轮投篮结束后的得分不大于的概率为.
(2)①.
②由①知,由题知,
所以,
由,
得到且,
整理得到,即,
得到,所以,
由题有,所以,得到,又,
所以或或.
类型三、超几何分布
1.超几何分布的定义
在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
2.超几何分布的适用范围件及本质
(1)适用范围:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
3.超几何分布与二项分布的区别与联系
(1)区别:
①超几何分布:
i.超几何分布描述的是不放回抽样问题.ii.特征:考察对象分两类;已知各类对象的个数M,N;已知抽取次数n;随机变量为抽到的某类个体的个数.iii.实质是古典概型.
②二项分布:
i.二项分布描述的是有放回抽样问题.ii.特征:做独立重复试验;每次试验的“成功概率”p是已知的(或可求的);已知抽取次数n;随机变量为试验发生的次数.iii.实质是n次独立重复试验.
(2)联系:
当抽取的方式从不放回变为有放回,超几何分布变为二项分布;对于不放回抽样,当n远远小于N时,每抽取一次后,对N的影响很小,超几何分布可近似为二项分布.
例3.一个不透明的袋子中装有除颜色外,大小,质地完全相同的5个黑球,个白球,已知一次从中任意取出3个球,取出的球是2个黑球,1个白球的概率为.现一次从中任取4个球,若取出一个黑球得1分,取出一个白球得2分,设随机变量为取出4个球的总得分,则( )
A. B. C. D.
【答案】B
【分析】先根据一次从中任意取出3个球,取出的球是2个黑球,1个白球的概率为,列方程求出,然后根据题意确定的可能取值范围,再分析满足的得分对应黑球数量的取值,计算对应组合数之和,从而可求出概率.
【详解】由题意得球的总数为,取3个球的总数为,取2黑1白的组合数为,
因为一次从中任意取出3个球,取出的球是2个黑球,1个白球的概率为,
所以,所以,
化简得,,,
,得或,
由,得,
所以,
设从袋子中取出个黑球,则白球为个,所以,
由,得,则,得,
即的取值为0,1,2,
当时,不合题意,
当时,即取出1个黑球3个白球,则有种方法,
当时,即取出2个黑球2个白球,则有种方法,
所以.
故选:B.
变式3-1.某班班主任为了解班级学生每周的体育锻炼情况进行了调查,发现班级中有20人每周的体育锻炼时长超过6小时,若从班级学生中随机抽取的15人中有7人每周的体育锻炼时长超过6小时,估计班级学生的总人数为 .(记为抽取的每周的体育锻炼时长超过6小时的学生人数,以使得最大的班级学生的总人数为估计值)
【答案】42
【分析】求使得最大时的,记,以判断 的单调性及最大值得解.
【详解】设班级学生的总人数为,且,则,
记,则,
易得,
由可得,
所以当时,,当时,,
所以的最大值在时取到,
所以估计班级学生的总人数为42人.
故答案为:42.
变式3-2.某校为了提高教师身心健康号召教师利用空余时间参加阳光体育活动.现有4名男教师,2名女教师报名,本周随机选取2人参加.
(1)记参加活动的女教师人数为X,求X的分布列及期望;
(2)若本次活动有慢跑、游泳、瑜伽三个可选项目,每名女教师至多从中选择参加2项活动,且选择参加1项或2项的可能性均为,每名男教师至少从中选择参加2项活动,且选择参加2项或3项的可能性也均为,每人每参加1项活动可获得“体育明星”积分3分,选择参加几项活动彼此互不影响,记随机选取的两人得分之和为Y,求Y的期望.
【答案】(1)分布列见解析,
(2)
【分析】(1)参加活动的女教师人数为X,则X服从超几何分布,即可写出X的分布列及期望.
(2)根据一名女教师和一名男教师参加活动获得分数的期望,由结合期望的性质求得.
【详解】(1)依题意,X的可能值为0,1,2,服从超几何分布,,
,,,
所以X的分布列为:
(2)设一名女教师参加活动可获得分数为,一名男教师参加活动可获得分数为,
则的所有可能取值为3,6,的所有可能取值为6,9,
,
,
,
,
有X名女教师参加活动,则男教师有名参加活动,,
所以.
即两个教师得分之和的期望为13分.
类型四、正态分布
1.正态密度函数
函数f(x)=,x∈R.其中∈R,>0为参数.利用图象求正态分布密度函数的解析式,应抓住图象的两个实质性特点:一是对称轴为,二是最大值为.这两点确定以后,相应参数便确定了,代入中便可求出相应的解析式.
2.正态曲线图像的特点
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴之间的面积为1;
(5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
3.服从正态分布的概率的计算
(1)对称法:由于正态曲线是关于直线对称的,且概率的和为1,故关于直线对称的区间概率相等.如:①;②.
(2)正态分布的三个常用数据:
①;
②;
③.
在实际应用中,通常认为服从于正态分布的随机变量只取中的值,这在统计学中称为原则.
4.正态分布的期望与方差
若,则,.
例4.(多选)已知随机变量,随机变量,若,,则下列说法正确的是( )
A. B.
C. D.
【答案】ACD
【分析】利用正态曲线的对称性判断A;利用正态分布和二项分布的期望性质建立方程,求解参数判断C;结合正态分布和二项分布的方差性质判断B,D即可.
【详解】对于A,因为随机变量,且,
所以结合正态曲线的对称性可得,故A正确;
对于C,由正态分布的期望性质得,
由二项分布性质得,而,
则,解得,此时随机变量变,故C正确;
对于B,由二项分布的方差性质得,
而,则,
由方差的性质得,故B错误;
对于D,由方差性质得,故D正确.
故选:ACD.
变式4-1.现实世界中的很多随机变量遵循正态分布.例如反复测量某一个物理量,其测量误差通常被认为服从正态分布.若某物理量做n次测量,最后结果的误差,则为使的概率控制在0.0456以下,至少要测量的次数为( )
A.32 B.64 C.128 D.256
【答案】C
【分析】先由题设条件得到,再转化得,从而利用正态分布原则可得,由此可得结果.
【详解】依题意,得,
所以,即,
而,所以且,
又因为,所以,,
所以且,即,解得,
故至少要测量的次数为.
故选:C.
变式4-2.江先生每天9点上班,上班通常开私家车加步行或乘坐地铁加步行,私家车路程近一些,但路上经常拥堵,所需时间(单位:分钟)服从正态分布,从停车场步行到单位要6分钟;江先生从家到地铁站需要步行5分钟,乘坐地铁畅通,但路线长且乘客多,所需间(单位:分钟)服从正态分布,下地铁后从地铁站步行到单位要5分钟,从统计的角度出发,下列说法中合理的有( )
参考数据:若,则,,
A.若出门,则开私家车不会迟到
B.若出门,则乘坐地铁上班不迟到的可能性更大
C.若出门,则乘坐地铁上班不迟到的可能性更大
D.若出门,则乘坐地铁几乎不可能上班不迟到
【答案】D
【分析】对于A,由即可判断;对于BC,分别计算开私家车及乘坐地铁不迟到的概率即可判断;对于D,计算即可判断
【详解】对于A,当满足时,
江先生仍旧有可能迟到,只不过发生的概率较小,故A错误;
对于,若出门,
①江先生开私家车,
当满足时,
此时江先生开私家车不会迟到;
②江先生乘坐地铁,
当满足时,
此时江先生乘坐地铁不会迟到;
此时两种上班方式,江先生不迟到的概率相当,故B错误;
对于C,若出门,
①江先生开私家车,
当满足时,
此时江先生开私家车不会迟到;
②江先生乘坐地铁,
当满足时,此时江先生乘坐地铁不会迟到;
此时两种上班方式,显然江先生开私家车不迟到的可能性更大,故C错误;
对于D,若出门,
江先生乘坐地铁上班,
当满足时,江先生乘坐地铁不会迟到,
此时不迟到的可能性极小,故江先生乘坐地铁几乎不可能上班不迟到,故D正确.
故选:D.
变式4-3.某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行测试,对其生产的第一批零件的内径进行测量,统计绘制了如图所示的频率分布直方图.
(1)求的值以及这批零件内径的平均值(同一组中的数据用该组区间的中点值作代表);
(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间内的零件个数为,求的分布列以及数学期望;
(3)已知这批零件的内径(单位:mm)服从正态分布,现以这批零件内径的平均数作为的估计值,这批零件内径的标准差作为的估计值,已知的近似值为0.105,则在这批零件中随机抽取200个,记内径在区间上的零件个数为,求的方差.
参考数据:若,则,,.
【答案】(1),2.6
(2)分布列见解析,0.8
(3)26.88
【分析】(1)根据频率分布直方图中所有小矩形的面积之和为1,及频率分布直方图中平均值的计算公式,求出相应的值即可;
(2)确定的可能取值,求出的不同值对应的概率,得到的分布列,再根据离散型随机变量数学期望的计算公式求出的数学期望即可;
(3)由正态分布的概率求法,求出内径在上的概率,再根据二项分布的定义判定,最后根据二项分布方差的计算公式求出的方差.
【详解】(1)由,得.
这批零件内径的平均值2.6.
(2)由题意知,内径在区间内的频率为,则,
的可能取值为0,1,2,3,4,
则,,,,,
因此可得的分布列:
则的数学期望0.8,
或,所以;
(3)由题意知,,,
又,,
则.
由二项分布的定义知,
由二项分布的方差公式知,26.88.
一、单选题
1.已知随机变量的分布列为,则( )
A. B. C. D.
【答案】A
【分析】运用概率分布列的性质求出,再求即可.
【详解】依题意,分布列概率之和为1,则,解得.
即,所以.
故选:A.
2.已知随机变量X的分布列如下表:若,则( )
X
0
1
2
P
n
m
A. B.5 C.7 D.21
【答案】D
【分析】先求出,的值,再求出的值,最后根据方差的性质即可得答案.
【详解】由题意,解得,
所以.
所以.
故选:D
3.某竞赛小组共有13人,其中有6名女生,现从该竞赛小组中任选5人参加一项活动,用表示这5人中女生的人数,则下列概率中等于的是( )
A. B.
C. D.
【答案】D
【分析】根据超几何概率问题得取值情况及相应概率,即可得所求.
【详解】取值是:,
所以.
故选:D.
4.已知条试题中有条选择题,甲无放回地依次从中抽取条题,乙有放回地依次从中抽取条题,甲、乙每次均抽取一条试题,抽出的条题中选择题的条数分别为,的期望分别为,方差分别为,则( )
A.
B.
C.
D.
【答案】D
【分析】先确定的可能取值,再求随机变量取各值的概率, 根据期望公式方差公式求 ,判断随机变量服从二项分布,根据二项分布的均值、方差公式计算,由此可得结论.
【详解】由题意可知,的可能取值为,的可能取值为,
所以,,
,
所以,
.
乙每次抽到选择题的概率为,由条件可得
根据二项分布的均值方差公式得:,
,
所以,.
故选:D.
5.下列说法不正确的是( )
A.若随机变量,则
B.若随机变量,则
C.若随机变量,则
D.若随机变量,则
【答案】C
【分析】利用二项分布的性质求解判断AB;利用正态分布的性质求解判断CD.
【详解】对于A,由,得,A正确;
对于B,由,得,B正确;
对于C,由,得,C错误;
对于 D,由,得,D正确.
故选:C
6.某商家开展促销活动,已知当天参加活动的顾客中,消费超过200元的顾客的频率为,用频率估计概率,现从参加活动的顾客中随机抽取20人赠送小礼品,若这20人中有人消费超过200元的概率最大,则的值为( )
A.7 B.8 C.9 D.8或9
【答案】B
【分析】由题知抽到消费超过200元的人数,,则,再利用组合数的性质求最大值即可.
【详解】由题知抽到消费超过200元的人数,,
则,又这20人中有人消费超过200元的概率最大,
所以,即,解得,
又,所以.
故选:B.
二、多选题
7.某地区为提升农民亩收入(单位:万元),引进了新型的种植技术,通过抽样调查后发现引进新型种植技术之前农民每亩地的年收入X近似服从正态分布,引进之后每亩地的年收入近似服从正态分布,已知的正态密度曲线的峰值高于的正态密度曲线的峰值(如图),则( )
A.
B.
C.
D.
【答案】AC
【分析】利用正态分布的对称性即可判断AB,由正态密度曲线的图像即可判断C,的方差更小,其正态密度曲线右侧下降速度更快,当取足够大的正数时,有,进而判断D.
【详解】由正态密度曲线的对称性得,故A正确,B错误;
由图像可知正态密度曲线的峰值越高,则方差越小,得,故,故C正确.
因为的方差更小,所以其正态密度曲线右侧下降速度更快,当取足够大的正数时,
有,则,即,故D错误.
故选:AC.
8.已知随机变量服从二项分布,则以下选项正确的是( )
A.若,则 B.若,则
C. D.
【答案】AD
【分析】根据二项分布的期望公式及方差公式得出,根据数学期望及方差性质计算可判断A、B;由二项分布概率公式计算可判断C、 D.
【详解】由于,所以,
对于A,因为,则,A正确;
对于B,因为,则,B错误;
对于C,,C错误;
对于D,,
,
所以,D正确;
故选:AD
三、填空题
9.已知随机变量X的分布列如下表所示,其中a是常数,则 .
1
2
3
…
50
…
【答案】
【分析】由分布列的性质求得,进而可求解.
【详解】由题意,,
解得,
所以
.
故答案为:
10.设随机变量,其中且,若,,则 .
【答案】
【分析】先利用期望的性质及,求出,再根据二项分布的期望,方差的公式求出,再利用方差的性质求解即可.
【详解】因为,,
又因为,所以,解得.
因为随机变量,其期望,所以.
因为二项分布的方差,解得.
因为,将,代入可得
.
故答案为:
四、解答题
11.某校为丰富学生的校园生活决定开展兴趣课,兴趣课包括音乐课,舞蹈课,影视鉴赏课、篮球课、围棋课等十余种.兴趣课共开展3个月,每种课每月4节且必须上满,每节课可得1分且表现优秀可额外获得1分,若本月不少于6分,下月可以选择继续上此课或者选择其他的兴趣课,6分以下则只能上原来的课.现有甲、乙两人是好朋友,在第一个月他们一起选择了音乐课,音乐课上甲每节课表现优秀的概率为,乙每节课表现优秀的概率为.
(1)求甲第一个月得分的分布列及数学期望;
(2)求第二个月甲乙两人可以一起选择其他兴趣课的概率;
(3)若乙每种课的表现优秀率一致,在三个月后乙一共获得21分的情况下,求他在第二个月获得8分的概率.
【答案】(1)分布列见解析;
(2)
(3)
【分析】(1)方法一,先列出甲在第一个月的得分的所有可能,再按照重伯努利实验计算出概率,写出分布列,求出数学期望即可;方法二,分析出甲的4节课中优秀的节数服从二项分布,且,再按照期望的性质计算即可;
(2)分别求出甲乙在第一个月的得分不少于6分,即的概率,再按照相互独立事件概率公式求解即可;
(3)先分析出乙得分为21分有3种情况,并分别求出概率,从而得到乙一共获得21分的概率,再求出乙获得21分的同时他在第二个月获得8分的概率,再用条件概率的公式计算即可.
【详解】(1)方法一:记甲在第一个月的得分为,则的取值为4,5,6,7,8,
则,
,
,
,
,
所以甲第一个月得分的分布列为:
;
方法二:设甲的4节课中优秀的节数为,
则且
则;
(2)记事件为“甲、乙第二个月可以一起选择其他兴趣课”,
设甲在第一个月的得分为,
则,
设乙在第一个月的得分为,设乙的4节课中优秀的节数为,则且,
所以,,
,
所以;
(3)记事件B为“乙在三个月后得分为21分”,
事件为“乙在第2个月的得8分”
乙得分为21分共有3种情况:
① 8+8+5,这种情况的概率,
② 8+7+6,这种情况的概率,
③ 7+7+7,这种情况的概率,
所以,,
则.
12.实验测量中,测量数据往往存在误差,故测量数据常常服从正态分布.在一次实验测量中,某同学的测量数据近似服从正态分布,且.
(1)在的条件下,求的概率;
(2)已知事件“”与事件“”相互独立,求实数;
(3)若认为该实验在时测量精度较高,且已知随机变量时,,请评价本次实验测量的测量精度.
【答案】(1)0.8
(2)
(3)本次实验的测量精度不高
【分析】(1)利用正态分布的对称性及条件概率计算即可;
(2)利用正态分布的对称性及事件的相互关系、相互独立事件的性质分类讨论计算参数即可;
(3)设变量,分类讨论二者大小,结合条件得出的充要条件,利用正态分布的性质计算得出,从而判定测量精度即可.
【详解】(1)在的条件下,的概率等价于,
由题意可知,其概率密度函数图象关于直线对称,
所以,
根据对称性,,
故
(2)设事件为“”,事件为“”,
且事件“”等价于事件“或”.
由题意得,
则由对称性得,
由事件“”与“”互斥,则,
因为事件与相互独立,所以,
当时,等价于事件“”,则,解得,无解;
当时,等价于事件“”,
则,即,解得,
由于,故.
当时,等价于事件“或”.
此时有,
故由正态分布性质,拆分可得
,
又,代入解得,
而,故,无解.
综上所述,;
(3)由题可计算得,
又对于任意,由于等价于
,
则对于任意均有,
时,同理,
故是的充要条件.
由正态分布性质有,且数据比较,
即,
故,再由上述的充要条件,
这等价于的情况,故必有,即,
故,即可做出本次实验的测量精度不高的评价.
1 / 10
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题02 随机变量及概率分布模型
目录
典例详解
类型一、离散型随机变量的分布列与数字特征
类型二、二项分布
类型三、超几何分布
类型四、正态分布
压轴专练
类型一、离散型随机变量的分布列与数字特征
1.离散型随机变量的分布列的表示
(1)一般地,若离散型随机变量可能取的不同值为,取每一个值的概率,以表格的形式表示如下:
我们将上表称为离散型随机变量的概率分布列,简称为的分布列.有时为了简单起见,也用等式,表示的分布列.
(2)离散型随机变量的分布列的性质:
①pi≥0(i=1,2,…,n);②p1+p2+…+pn=1.
2.两点分布
(1)定义:对于只有两个可能结果的随机试验,用表示“成功”,表示“失败”,
定义如果,则,那么X的分布列如表所示.
X
0
1
我们称X服从两点分布或0-1分布.
注意:随机变量X只取0和1,才是两点分布,否则不是.
(2)适用范围:①研究只有两个结果的随机试验的概率分布规律;②研究某一随机事件是否发生的概率分布规律.如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等,都可以用两点分布来研究.
3.离散型随机变量的均值及其性质
(1)称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)均值的性质:
①(为常数).
②若,其中为常数,则也是随机变量,且.
③.
④如果相互独立,则.
(3)常见分布列的均值:
①若X服从两点分布,则E(X)=p;②若X~B(n,p),则E(X)=np;③若X服从参数为N,M,n的超几何分布,则E(X).
4.离散型随机变量的方差及其性质
(1)称为随机变量的方差,并称其算术平方根为随机变量的标准差,记作σ(X).方差刻画了随机变量X与其均值E(X)的平均偏离程度.
(2)方差的性质:
①(为常数).
②若,其中为常数,则也是随机变量,且.
③方差公式的变形:.
④如果两两独立,则.
(3)常见分布列的方差:
①若X服从两点分布,则D(X)=p(1-p);②若X~B(n,p),则D(X)=np(1-p).
例1.已知随机变量X服从两点分布,且,,则实数a的值为( )
A. B. C. D.或
变式1-1.(多选)设随机变量X的分布列为,,,分别为随机变量X的均值与方差,则下列结论正确的是( )
A. B.
C. D.
变式1-2.(多选)离散型随机变量的数学期望为1,则( )
A. B.
C. D.
变式1-3.甲乙两人进行乒乓球比赛,现采用三局两胜的比赛制度,规定每一局比赛都没有平局(必须分出胜负),且每一局甲赢的概率都是p,随机变量X表示最终的比赛局数,若,则的最大值是 ;的取值范围是 .
类型二、二项分布
1. 二项分布的定义
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,)
于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
2.二项分布的适用范围及本质
(1)适用范围:①各次试验中的事件是相互独立的;②每次试验只有两种结果:事件要么发生,要么不发生;③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
3.二项分布的期望、方差
若,则,.
4.二项分布中概率最大值理论
设X~B(n,p),则P(X=k)= (k=0,1,2,…,n).
(1)一般求解思路:设X=k时,对应概率最大,则应满足 然后通过求解该不等式组,结合k的取值范围即可确定k的具体取值.
(2)也可以从单调性的角度探究概率的最大值.
当k<(n+1)p时,,随k值的增加而增加;当k>(n+1)p时,,随k值的增
加而减小.
如果(n+1)p为正整数,则当k=(n+1)p时,,此时均为最大值.如果(n+1)p为非整数,而k取(n+1)p的整数部分,则是唯一的最大值.
例2.已知离散型随机变量X服从二项分布,且,,则的最小值为( )
A. B. C.2 D.4
变式2-1.某人在次射击中击中目标的次数为,且,记,,若是唯一的最大值,则的值为( )
A.1.28 B.1.6 C.6.4 D.8
变式2-2.(多选)某计算机程序运行次,每次运行都等可能地产生或中的一个数.记出现的次数为,出现的次数多于出现的次数的概率为,则( )
A. B.
C. D.
变式2-3.甲、乙两名同学进行定点投篮训练,据以往的训练数据可知,甲每次投篮命中的概率为,乙每次投篮命中的概率为,各次投篮互不影响.现甲、乙两人开展多轮次的定点投篮活动,每轮次各投2个球,每投进一个球记1分,不投进记分.
(1)求甲在一个轮次投篮结束后的得分不大于0的概率;
(2)记甲、乙每轮次投篮得分之和为X.
①求;
②若,则称该轮次为一个“成功轮次”.在连续轮次的投篮活动中,记“成功轮次”的数量为Y,当n为何值时,的值最大?
类型三、超几何分布
1.超几何分布的定义
在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
2.超几何分布的适用范围件及本质
(1)适用范围:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
3.超几何分布与二项分布的区别与联系
(1)区别:
①超几何分布:
i.超几何分布描述的是不放回抽样问题.ii.特征:考察对象分两类;已知各类对象的个数M,N;已知抽取次数n;随机变量为抽到的某类个体的个数.iii.实质是古典概型.
②二项分布:
i.二项分布描述的是有放回抽样问题.ii.特征:做独立重复试验;每次试验的“成功概率”p是已知的(或可求的);已知抽取次数n;随机变量为试验发生的次数.iii.实质是n次独立重复试验.
(2)联系:
当抽取的方式从不放回变为有放回,超几何分布变为二项分布;对于不放回抽样,当n远远小于N时,每抽取一次后,对N的影响很小,超几何分布可近似为二项分布.
例3.一个不透明的袋子中装有除颜色外,大小,质地完全相同的5个黑球,个白球,已知一次从中任意取出3个球,取出的球是2个黑球,1个白球的概率为.现一次从中任取4个球,若取出一个黑球得1分,取出一个白球得2分,设随机变量为取出4个球的总得分,则( )
A. B. C. D.
变式3-1.某班班主任为了解班级学生每周的体育锻炼情况进行了调查,发现班级中有20人每周的体育锻炼时长超过6小时,若从班级学生中随机抽取的15人中有7人每周的体育锻炼时长超过6小时,估计班级学生的总人数为 .(记为抽取的每周的体育锻炼时长超过6小时的学生人数,以使得最大的班级学生的总人数为估计值)
变式3-3.某校为了提高教师身心健康号召教师利用空余时间参加阳光体育活动.现有4名男教师,2名女教师报名,本周随机选取2人参加.
(1)记参加活动的女教师人数为X,求X的分布列及期望;
(2)若本次活动有慢跑、游泳、瑜伽三个可选项目,每名女教师至多从中选择参加2项活动,且选择参加1项或2项的可能性均为,每名男教师至少从中选择参加2项活动,且选择参加2项或3项的可能性也均为,每人每参加1项活动可获得“体育明星”积分3分,选择参加几项活动彼此互不影响,记随机选取的两人得分之和为Y,求Y的期望.
类型四、正态分布
1.正态密度函数
函数f(x)=,x∈R.其中∈R,>0为参数.利用图象求正态分布密度函数的解析式,应抓住图象的两个实质性特点:一是对称轴为,二是最大值为.这两点确定以后,相应参数便确定了,代入中便可求出相应的解析式.
2.正态曲线图像的特点
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴之间的面积为1;
(5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
3.服从正态分布的概率的计算
(1)对称法:由于正态曲线是关于直线对称的,且概率的和为1,故关于直线对称的区间概率相等.如:①;②.
(2)正态分布的三个常用数据:
①;
②;
③.
在实际应用中,通常认为服从于正态分布的随机变量只取中的值,这在统计学中称为原则.
4.正态分布的期望与方差
若,则,.
例4.(多选)已知随机变量,随机变量,若,,则下列说法正确的是( )
A. B.
C. D.
变式4-1.现实世界中的很多随机变量遵循正态分布.例如反复测量某一个物理量,其测量误差通常被认为服从正态分布.若某物理量做n次测量,最后结果的误差,则为使的概率控制在0.0456以下,至少要测量的次数为( )
A.32 B.64 C.128 D.256
变式4-2.江先生每天9点上班,上班通常开私家车加步行或乘坐地铁加步行,私家车路程近一些,但路上经常拥堵,所需时间(单位:分钟)服从正态分布,从停车场步行到单位要6分钟;江先生从家到地铁站需要步行5分钟,乘坐地铁畅通,但路线长且乘客多,所需间(单位:分钟)服从正态分布,下地铁后从地铁站步行到单位要5分钟,从统计的角度出发,下列说法中合理的有( )
参考数据:若,则,,
A.若出门,则开私家车不会迟到
B.若出门,则乘坐地铁上班不迟到的可能性更大
C.若出门,则乘坐地铁上班不迟到的可能性更大
D.若出门,则乘坐地铁几乎不可能上班不迟到
变式4-3.某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行测试,对其生产的第一批零件的内径进行测量,统计绘制了如图所示的频率分布直方图.
(1)求的值以及这批零件内径的平均值(同一组中的数据用该组区间的中点值作代表);
(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间内的零件个数为,求的分布列以及数学期望;
(3)已知这批零件的内径(单位:mm)服从正态分布,现以这批零件内径的平均数作为的估计值,这批零件内径的标准差作为的估计值,已知的近似值为0.105,则在这批零件中随机抽取200个,记内径在区间上的零件个数为,求的方差.
参考数据:若,则,,.
一、单选题
1.已知随机变量的分布列为,则( )
A. B. C. D.
2.已知随机变量X的分布列如下表:若,则( )
X
0
1
2
P
n
m
A. B.5 C.7 D.21
3.某竞赛小组共有13人,其中有6名女生,现从该竞赛小组中任选5人参加一项活动,用表示这5人中女生的人数,则下列概率中等于的是( )
A. B.
C. D.
4.已知条试题中有条选择题,甲无放回地依次从中抽取条题,乙有放回地依次从中抽取条题,甲、乙每次均抽取一条试题,抽出的条题中选择题的条数分别为,的期望分别为,方差分别为,则( )
A.
B.
C.
D.
5.下列说法不正确的是( )
A.若随机变量,则
B.若随机变量,则
C.若随机变量,则
D.若随机变量,则
6.某商家开展促销活动,已知当天参加活动的顾客中,消费超过200元的顾客的频率为,用频率估计概率,现从参加活动的顾客中随机抽取20人赠送小礼品,若这20人中有人消费超过200元的概率最大,则的值为( )
A.7 B.8 C.9 D.8或9
二、多选题
7.某地区为提升农民亩收入(单位:万元),引进了新型的种植技术,通过抽样调查后发现引进新型种植技术之前农民每亩地的年收入X近似服从正态分布,引进之后每亩地的年收入近似服从正态分布,已知的正态密度曲线的峰值高于的正态密度曲线的峰值(如图),则( )
A.
B.
C.
D.
8.已知随机变量服从二项分布,则以下选项正确的是( )
A.若,则 B.若,则
C. D.
三、填空题
9.已知随机变量X的分布列如下表所示,其中a是常数,则 .
1
2
3
…
50
…
10.设随机变量,其中且,若,,则 .
四、解答题
11.某校为丰富学生的校园生活决定开展兴趣课,兴趣课包括音乐课,舞蹈课,影视鉴赏课、篮球课、围棋课等十余种.兴趣课共开展3个月,每种课每月4节且必须上满,每节课可得1分且表现优秀可额外获得1分,若本月不少于6分,下月可以选择继续上此课或者选择其他的兴趣课,6分以下则只能上原来的课.现有甲、乙两人是好朋友,在第一个月他们一起选择了音乐课,音乐课上甲每节课表现优秀的概率为,乙每节课表现优秀的概率为.
(1)求甲第一个月得分的分布列及数学期望;
(2)求第二个月甲乙两人可以一起选择其他兴趣课的概率;
(3)若乙每种课的表现优秀率一致,在三个月后乙一共获得21分的情况下,求他在第二个月获得8分的概率.
12.实验测量中,测量数据往往存在误差,故测量数据常常服从正态分布.在一次实验测量中,某同学的测量数据近似服从正态分布,且.
(1)在的条件下,求的概率;
(2)已知事件“”与事件“”相互独立,求实数;
(3)若认为该实验在时测量精度较高,且已知随机变量时,,请评价本次实验测量的测量精度.
1 / 10
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$