内容正文:
清单03 概率
(7个考点梳理+题型解读+提升训练)
【清单01】条件概率
1.条件概率的概念
条件概率揭示了P(A),P(AB),P(B|A)三者之间“知二求一”的关系
一般地,设A,B为两个随机事件,且P(A)>0,我们称P(B|A)=为在事件A发生的条件下,事件B发生的条件概率,简称条件概率.
2.概率的乘法公式
由条件概率的定义,对任意两个事件A与B,若P(A)>0,则P(AB)=P(A)P(B|A).我们称上式为概率的乘法公式.
3.条件概率的性质
设P(A)>0,则
(1)P(Ω|A)=1;
(2)如果B与C是两个互斥事件,则P((B∪C)|A)=P(B|A)+P(C|A);
(3)设和B互为对立事件,则P( )=1-P(B).
4.全概率公式
在全概率的实际问题中我们经常会碰到一些较为复杂的概率计算,这时,我们可以用 “化整为零”的思想将它们分解为一些较为容易的情况分别进行考虑
一般地,设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,有P(B)=P(Ai)P(B.
我们称上面的公式为全概率公式,全概率公式是概率论中最基本的公式之一.
5.贝叶斯公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意事件B⊆Ω,P(B)>0,
有P(Ai==i=1,2,…,n.
6.在贝叶斯公式中,P(Ai)和P(Ai |B)分别称为先验概率和后验概率.
【清单02】二项分布
1.n重伯努利试验的概念
只包含两个可能结果的试验叫做伯努利试验,将一个伯努利试验独立地重复进行n次所组成的随机试验称为n重伯努利试验.
2.n重伯努利试验具有如下共同特征
(1)同一个伯努利试验重复做n次;
(2)各次试验的结果相互独立.
3.二项分布(若有件产品,其中件是次品,有放回地任意抽取件,则其中恰有的次品件数是服从二项分布的)
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0<p<1),用X表示事件A发生的次数,则X的分布列为:
如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作X~B(n,p).
4.一般地,可以证明:如果X~B(n,p),那么E(X)=np,D(X)=np(1-p).
【清单03】两点分布
两点分布:是很简单的一种概率分布,其实验结果只有两种可能,且概率和为1;两点分布列又称分布列或佰努利分布列;两点分布能清晰的反映出事件的正反两面.两点分布的应用十分广泛,如抽取的彩票是否中奖,买回的意见产品是否为正品,新生儿的鉴定,投篮是否命中等.(想象成扔硬币问题)
【清单04】超几何分布
超几何分布:一般地,在含有件次品的件产品中,任取件,其中恰有件次品数,则事件发生的概率为,其中,且.称分布列
0
1
…
…
为超几何分布列.如果随机变量 的分布列为超几何分布列,则称随机变量 服从超几何分布.
注意:若有件产品,其中件为次品,无放回地任意抽取件,则其中恰有的次品件数是服出超几何分布.
【清单05】正态分布
1.正态曲线及其性质
(1)正态曲线:
函数,,其中实数μ,σ(σ>0)为参数,我们称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线.
(2)正态曲线的性质:
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;
⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,总体分布越分散;σ越小.曲线越“瘦高”.总体分布越集中,如图乙所示:
甲 乙
2.正态分布
一般地,如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=,则称随机变量X服从正态分布(normal distribution).正态分布完全由参数μ和σ确定,因此正态分布常记作N(μ,σ2).如果随机变量X服从正态分布,则记为X~N(μ,σ2).
3.正态总体三个特殊区间内取值的概率值
①P(μ-σ<X≤μ+σ)=0.6826;
②P(μ-2σ<X≤μ+2σ)=0.9544;
③P(μ-3σ<X≤μ+3σ)=0.9974.
4.3σ原则
通常服从正态分布N(μ,σ2)的随机变量X只取(μ-3σ,μ+3σ)之间的值.
【规律方法】
1.求正态曲线的两个方法
(1)图解法:明确顶点坐标即可,横坐标为样本的均值μ,纵坐标为.
(2)待定系数法:求出μ,σ便可.
2.正态分布下2类常见的概率计算
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
3.正态总体在某个区间内取值概率的求解策略
(1)充分利用正态曲线对称性和曲线与x轴之间面积为1.
(2)熟记P(μ-σ<X≤μ+σ),P(μ-2σ<X≤μ+2σ),P(μ-3σ<X≤μ+3σ)的值.
(3)注意概率值的求解转化:
①P(X<a)=1-P(X≥a);
②P(X<μ-a)=P(X≥μ+a);
③若b<μ,则P(X<b)=.
特别提醒:正态曲线,并非都关于y轴对称,只有标准正态分布曲线才关于y轴对称.
【清单06】离散型随机变量的均值与方差
Ⅰ:随机变量的数字特征
1.离散型随机变量的均值的概念
一般地,若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称E(X)=x1p1+x2p2+…+xipi+…+xnpn=为随机变量X的均值或数学期望.
2.离散型随机变量的均值的意义
均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.
3.离散型随机变量的均值的性质
若Y=aX+b,其中a,b均是常数(X是随机变量),则Y也是随机变量,且有E(aX+b)=aE(X)+b.
证明如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y
ax1+b
ax2+b
…
axi+b
…
axn+b
P
p1
p2
…
pi
…
pn
于是有E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
方差:.称为随机变量的方差,它反映了离散型随机变量相对于期望的平均波动大小(或说离散程度),其算术平方根为随机变量的标准差,记作,方差(或标准差)越小表明的取值相对于期望越集中,否则越分散.
Ⅱ: 均值与方差的性质
(1).
(2)(为常数).(3)
两点分布、二项分布、超几何分布的期望、方差
(1)若X服从两点分布,则,.
(2)若X服从二项分布,即,则.
(3)若X服从超几何分布,即时,
.
方法总结: 求离散型随机变量的均值、方差的基本步骤:
第一步:判断取值:先根据随机变量的意义,确定随机变量可以取哪些值;
第二步:探求概率:利用排列组合、枚举法、概率公式(常见的有古典概型公式、几何概型公式、互斥事件的概率和公式、独立事件的概率积公式,以及对立事件的概率公式)等,求出随机变量取每个值时的概率;
第三步:写分布列:按规范形式写出分布列,并注意用分布列的性质(概率总和为1)检验所求的分布列是否正确;
第四步:求期望值和方差:利用数学期望和方差的公式分别求期望和方差的值.对于有些实际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布X~B(n,p)),则此随机变量的期望可直接利用这种典型分布的期望公式(E(X)=np)求得.因此,应熟记常见的典型分布的期望与方差公式,可加快解题速度.
【清单07】二项分布之概率最值问题
Ⅰ:如果,其中,求最大值对应的值.
一般是考察与的大小关系.
因为
所以要使,则.故有
⑴如果,则时取得最大值.
⑵如果,是不超过的正整数,则当和时,取得最大值.
(3)如果是不超过的非整数,则当(注意表示不超过的最大整数)时取得最大值.
Ⅱ:方法二
【考点题型一】条件概率的求算
技巧:规律方法 利用定义计算条件概率的步骤
(1)分别计算概率P(AB)和P(A).
(2)将它们相除得到条件概率P(B|A)=,这个公式适用于一般情形,其中AB表示A,B同时发生.
【例1】随着城市经济的发展,早高峰问题越发严重,上班族需要选择合理的出行方式.某公司员工小明的上班出行方式有三种,某天早上他选择自驾,坐公交车,骑共享单车的概率分别为,,,而他自驾,坐公交车,骑共享单车迟到的概率分别为,,,结果这一天他迟到了,在此条件下,他骑共享单车去上班的概率为 .
【变式1-1】某人忘记了电话号码的最后一位数字,因而他随意地拨号,则下列说法正确的是( )
A.第一次就接通电话的概率是
B.若已知最后一位数字是奇数,则第一次就接通电话的概率是
C.拨号不超过三次接通电话的概率是
D.若已知最后一位数字是奇数,则拨号不超过三次接通电话的概率是
【变式1-2】从标有1,2,3,4,5,6的六张卡片中不放回地抽取两次,每次抽取1张,则在第一次抽到的卡片所标数字为奇数的条件下,第二次抽到的卡片所标数字仍为奇数的概率为( )
A. B. C. D.
【变式1-3】随机事件A,B满足,,则= .
【变式1-4】已知事件满足,,则( )
A.若事件满足,则
B.若,则,
C.若与互斥,则
D.若与相互独立,则
【考点题型二】全概率公式
技巧:全概率公式
在全概率的实际问题中我们经常会碰到一些较为复杂的概率计算,这时,
我们可以用 “化整为零”的思想将它们分解为一些较为容易的情况分别进行考虑
一般地,设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,
且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,有P(B)=P(Ai)P(B.
【例2】11分制乒乓球比赛规则如下:在一局比赛中,每两球交换发球权,每胜一球得1分,先得11分且至少领先2分者获胜,该局比赛结束;当某局比分打成10:10后,每球交换发球权,领先2分者获胜,该局比赛结束.现有甲、乙两人进行一场五局三胜,每局11分制的乒乓球比赛,比赛开始前通过拋掷一枚质地均匀的硬币来确定谁先发球.假设甲发球时甲得分的概率为,乙发球时甲得分的概率为,各球的比赛结果相互独立,且各局的比赛结果地相互独立,则下列说法正确的是( )
A.若每局比赛甲获胜的概率,则该场比赛甲3:2获胜的概率为
B.若某局比赛甲先发球,则该局比赛中打完前4个球时甲得3分的概率为
C.若某局比赛甲先发球,双方比分为8:8,则该局比赛甲以11:9获胜的概率为
D.若某局比赛目前比分为10:10,则该局比赛甲获胜的概率为
【变式2-1】张某经营、两家公司,张某随机到公司指导与管理,已知他第1个月去公司的概率是.如果本月去公司,那么下个月继续去公司的概率为;如果本月去公司,那么下个月去公司的概率为,如此往复.设张某第个月去公司的概率为,则( )
A. B.
C. D.
【变式2-2】设有一批同规格的产品,由三家工厂生产,其中甲厂生产,乙、丙两厂各生产,而且各厂的次品率依次为,现从中任取一件,则取到次品的概率为 .
【变式2-3】某校团委开展知识竞赛活动.现有两组题目放在A,B两个箱子中,A箱中有6道选择题和3道论述题,B箱中有3道选择题和2道论述题.参赛选手先在任一箱子中随机选取一题,作答完后再在此箱子中选取第二题作答,答题结束后将这两个题目放回原箱子.
(1)若同学甲从B箱中抽取了两题,求第二题抽到论述题的概率;
(2)若同学甲从B箱中抽取了两题,已知第一题抽到论述题的条件下,求第二题抽到论述题的概率;
(3)若同学乙从A箱中抽取了两题,答题结束后误将题目放回了B箱,接着同学丙从B箱中抽取题目作答,求丙取出的第一道题是选择题的概率.
【变式2-4】某农科所正在试验培育甲、乙两个品种的杂交水稻,水稻成熟后对每一株的米粒称重,重量达到规定的标准后,则该株水稻达标.在水稻收获后,通过科研人员的统计,甲品种的杂交水稻有不达标,乙品种的杂交水稻有不达标.
(1)若假设甲、乙两个品种的杂交水稻株数相等,一科研人员随机选取了一株水稻,称重后发现不达标,求该株水稻来自甲品种和乙品种的概率分别是多少;
(2)科研人员选取了8株水稻,其中甲品种5株,乙品种3株,再从中随机选取3株进行分析研究,这3株中来自乙品种水稻的有株,求的数学期望.
【考点题型三】贝叶斯公式
技巧:贝叶斯公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,
且P(Ai)>0,i=1,2,…,n,则对任意事件B⊆Ω,P(B)>0,
有P(Ai=
i=1,2,…,n.
【例3】甲参加某多轮趣味游戏,在A,B两个不透明的盒内摸球,规定在一轮游戏中甲先在A盒内随机取出1个小球放入B盒,再在B盒内随机取出2个小球.若每轮游戏的结果相互独立,且每轮游戏开始前,两盒内小球的数量始终如下表(小球除颜色外大小质地完全相同):
红球
蓝球
白球
A盒
2
2
1
B盒
2
2
1
(1)求在一轮游戏中甲从A,B两盒内取出的小球均为白球的概率:
(2)已知每轮游戏的得分规则为:若从B盒内取出的小球均为红球,则甲获得5分;若从B盒内取出的小球中只有1个红球,则甲获得3分;若从B盒内取出的小球没有红球,则甲获得1分.
(i)记甲在一轮游戏中的得分为X,求X的分布列:
(ii)在的条件下,从A盒取出放入B盒的球最有可能是什么颜色?
【变式3-1】在某人工智能的语音识别系统开发中,每次测试语音识别成功的概率受环境条件(安静或嘈杂)的影响.
(1)已知在安静环境下,语音识别成功的概率为0.9;在嘈杂环境下,语音识别成功的概率为0.6.某天进行测试,已知当天处于安静环境的概率为0.3,处于嘈杂环境的概率为0.7.
(ⅰ)求测试结果为语音识别成功的概率;
(ⅱ)已知测试结果为语音识别成功,求当天处于安静环境的概率;
(2)已知当前每次测试成功的概率为0.8,每次测试成本固定,现有两种测试方案:
方案一:测试4次;方案二:先测试3次,如果这3次中成功次数小于等于2次,则再测试2次,否则不再测试,为降低测试成本,以测试次数的期望值大小为决策依据,应选择哪种方案?
【变式3-2】有三个相同的箱子,分别编号,其中号箱内装有个红球、个白球,号箱内装有个红球、个白球,号箱内装有个红球,这些球除颜色外完全相同.某人等可能从三个箱子中任取一箱并从中摸出一个球,事件表示“取到号箱”,事件表示“摸到红球”,事件表示“摸到白球”,则( )
A. B.
C. D.
【变式3-3】下列命题中正确的是( )
A.已知随机变量,则
B.
C.已知一组数据:7、7、8、9、5、6、8、8,则这组数据的第30百分位数是8
D.相关系数越大,成对样本数据的线性相关程度越强
【变式3-4】有甲、乙、丙3台车床加工同一型号的零件,加工的次品率分别为、、,加工出来的零件混放在一起.已知甲、乙、丙台车床加工的零件数分别占总数的、、.任取一个零件,如果取到的零件是次品,则它是甲车床加工的概率为( )
A. B. C. D.
【考点题型四】离散型随机变量的分布列
技巧:规律方法 求离散型随机变量分布列的步骤
(1)首先确定随机变量X的取值;
(2)求出每个取值对应的概率;
(3)列表对应,即为分布列.
【例4】若随机变量的分布列为
0
1
2
若,且,则( )
A. B. C. D.
【变式4-1】马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,因俄国数学家安德烈•马尔科夫而得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第n次的状态有关,与第,,,…次状态无关.已知有A,B两个盒子,各装有1个黑球、1个黄球和1个红球,现从A,B两个盒子中各任取一个球交换放入另一个盒子,重复进行次这样的操作后,记A盒子中红球的个数为,恰有1个红球的概率为,恰有2个红球的概率为.
(1)求,的值;
(2)证明:是等比数列,并求的通项公式;
(3)求的数学期望.
【变式4-2】口袋中有编号分别为1,2,3,…,10的10个小球,所有小球除了编号外无其他差别.
(1)从口袋中任取3个小球,求取到的小球编号既有奇数又有偶数的概率;
(2)从口袋中任取5个小球,设其中编号的最小值为,求的分布列及期望.
【变式4-3】某商场举行促销活动,顾客凡是购买一袋指定的大米都可以抽一次奖,一袋大米的价格为元,每次抽奖只抽张奖券,每张奖券上有个不同的号码,每个号码只能是未中奖或中奖一次,从回收的张奖券中,记录并整理这些奖券的情况,获得数据如下表:
中奖次数
张数
当一张奖券中中奖号码不大于个时,兑换金额是每个中奖号码元;当中奖号码是个时,兑换金额是每个中奖号码元;当中奖号码是个时,兑换金额是每个中奖号码元.假设不同奖券的中奖情况是相互独立的,用频率估计概率.
(1)估计一张奖券的中奖号码个数不少于的概率.
(2)假设一袋米的进价为元,一张奖券的毛利润定义为一袋大米的利润与一张奖券中奖金额之差.
(i)记为一张奖券的毛利润(单位:元),估计的数学期望;
(ii)若没中奖的大米售价减少,中奖的大米售价增加,在这种情况下,一张奖券毛利润的数学期望估计值不小于(i)中的估计值,求的最小值.
【变式4-4】某初级中学为了响应国家提倡的素质教育,积极组织学生参加体育锻炼,并定期进行成绩测试.在某次测试中,该校随机抽取了初二年级名男生的立定跳远成绩和米短跑成绩,在立定跳远成绩大于等于的名男生中,米短跑成绩小于等于的有人,在立定跳远成绩小于的男生中,米短跑成绩大于的有人.
单位:人
立定跳远成绩
米短跑成绩
合计
小于等于
大于
大于等于
小于
合计
(1)完成上面列联表,并依据小概率值的独立性检验,分析立定跳远成绩是否与米短跑成绩有关;
(2)“立定跳远成绩小于”且“米短跑成绩小于等于”的人数为,已知这人中有人喜爱运动,若从中任取人进行调研,设表示取出的喜爱运动的人数,求的分布列和数学期望.
下面附临界值表及参考公式:
【考点题型五】两点分布
技巧:规律方法 两点分布的4个特点
(1)两点分布中只有两个对应结果,且两结果是对立的;
(2)两点分布中的两结果一个对应1,另一个对应0;
(3)由互斥事件的概率求法可知,已知P(X=0)(或P(X=1)),便可求出P(X=1)(或P(X=0));
(4)在有多个结果的随机试验中,如果我们只关心一个随机事件是否发生,就可以利用两点分布来研究它.
【例5】已知离散型随机变量服从两点分布,且,则( )
A. B. C. D.
【变式5-1】若随机变量服从两点分布,,则为( )
A.0.3 B.0.35 C.0.6 D.0.65
【变式5-2】若随机变量X服从两点分布,则其分布列为
X
0
1
P
p
其中 称为成功概率.
【变式5-3】一个袋中装有6个形状、大小完全相同的小球,其中红球有3个,编号为1,2,3;黑球有2个,编号为1,2;白球有1个,编号为1.现从袋中一次随机抽取3个球,若记取到白球的个数为随机变量,求随机变量的分布列,
0
1
【变式5-4】对于只有两个可能结果的随机试验,用表示“成功”,表示“失败”,定义如果,则,那么的分布列如表所示
0
1
我们称服从 分布或分布.
【考点题型六】正态分布
技巧:规律方法 利用正态分布求概率的两个方法
(1)对称法:由于正态曲线是关于直线x=μ对称的,且概率的和为1,
故关于直线x=μ对称的区间概率相等.如:
①P(X<a)=1-P(X≥a);
②P(X<μ-a)=P(X>μ+a).
(2)“3σ”法:利用X落在区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]
内的概率分别是0.6827,0.9545,0.9973求解.
【例6】关于下列命题中,正确的是( )
A.两变量X,Y的相关系数越接近1,X,Y的相关程度越强,越接近,相关程度越弱
B.从3名男同学和2名女同学中任选3人参加社区服务,则选中的男同学比女同学多的概率为
C.随机变量,若,则,
D.已知,若,则
【变式6-1】下列说法中正确的是( )
A.已知随机变量,,则
B.根据小概率值的独立性检验推断两个分类变量与是否有关联,经计算,可以推断两个变量有关联,该推断犯错误的概率不超过0.05
C.一个袋子中有大小和质地完全相同的6个球(标号为1,2,3,4,5,6),从袋中不放回地依次随机摸出2个球.设事件“第一次摸到标号小于4的球”,事件“第二次摸到标号小于4的球”,则与相互独立
D.甲、乙两组数据,甲组有8个数据,平均数为210,方差为1,乙组有12个数据,平均数为200,方差为1,则甲乙两组数据组成的总样本的方差为25
【变式6-2】下列命题正确的是( )
A.已知由一组样本数据,得到的回归直线方程为,且,则这组样本数据中一定有(10,60)
B.若随机变量,则
C.已知互不相同的30个样本数据,若去掉其中最大和最小的数据,则剩下28个数据的第75百分位数可能等于原样本数据的第75百分位数
D.若随机变量,且,则
【变式6-3】已知某次数学的测试成绩X服从的正态分布,若小明的成绩不低于91分,那么他的成绩大约超过了 %的学生(精确到0.1%).(参考数据:)
【变式6-4】下列说法正确的是( )
A.已知一组各不相同的数据,去掉其中最大和最小两个数据后,剩下的28个数据的22%分位数不等于原来数据的22%分位数
B.若事件A,B满足,,且,则事件A,B独立
C.若随机变量服从正态分布,且,则
D.已知具有线性相关关系的变量x,y,其经验回归方程为,若样本点中心为,则
1 / 1
1 / 1
学科网(北京)股份有限公司
$$
清单03 概率
(7个考点梳理+题型解读+提升训练)
【清单01】条件概率
1.条件概率的概念
条件概率揭示了P(A),P(AB),P(B|A)三者之间“知二求一”的关系
一般地,设A,B为两个随机事件,且P(A)>0,我们称P(B|A)=为在事件A发生的条件下,事件B发生的条件概率,简称条件概率.
2.概率的乘法公式
由条件概率的定义,对任意两个事件A与B,若P(A)>0,则P(AB)=P(A)P(B|A).我们称上式为概率的乘法公式.
3.条件概率的性质
设P(A)>0,则
(1)P(Ω|A)=1;
(2)如果B与C是两个互斥事件,则P((B∪C)|A)=P(B|A)+P(C|A);
(3)设和B互为对立事件,则P( )=1-P(B).
4.全概率公式
在全概率的实际问题中我们经常会碰到一些较为复杂的概率计算,这时,我们可以用 “化整为零”的思想将它们分解为一些较为容易的情况分别进行考虑
一般地,设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,有P(B)=P(Ai)P(B.
我们称上面的公式为全概率公式,全概率公式是概率论中最基本的公式之一.
5.贝叶斯公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意事件B⊆Ω,P(B)>0,
有P(Ai==i=1,2,…,n.
6.在贝叶斯公式中,P(Ai)和P(Ai |B)分别称为先验概率和后验概率.
【清单02】二项分布
1.n重伯努利试验的概念
只包含两个可能结果的试验叫做伯努利试验,将一个伯努利试验独立地重复进行n次所组成的随机试验称为n重伯努利试验.
2.n重伯努利试验具有如下共同特征
(1)同一个伯努利试验重复做n次;
(2)各次试验的结果相互独立.
3.二项分布(若有件产品,其中件是次品,有放回地任意抽取件,则其中恰有的次品件数是服从二项分布的)
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0<p<1),用X表示事件A发生的次数,则X的分布列为:
如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作X~B(n,p).
4.一般地,可以证明:如果X~B(n,p),那么E(X)=np,D(X)=np(1-p).
【清单03】两点分布
两点分布:是很简单的一种概率分布,其实验结果只有两种可能,且概率和为1;两点分布列又称分布列或佰努利分布列;两点分布能清晰的反映出事件的正反两面.两点分布的应用十分广泛,如抽取的彩票是否中奖,买回的意见产品是否为正品,新生儿的鉴定,投篮是否命中等.(想象成扔硬币问题)
【清单04】超几何分布
超几何分布:一般地,在含有件次品的件产品中,任取件,其中恰有件次品数,则事件发生的概率为,其中,且.称分布列
0
1
…
…
为超几何分布列.如果随机变量 的分布列为超几何分布列,则称随机变量 服从超几何分布.
注意:若有件产品,其中件为次品,无放回地任意抽取件,则其中恰有的次品件数是服出超几何分布.
【清单05】正态分布
1.正态曲线及其性质
(1)正态曲线:
函数,,其中实数μ,σ(σ>0)为参数,我们称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线.
(2)正态曲线的性质:
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;
⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,总体分布越分散;σ越小.曲线越“瘦高”.总体分布越集中,如图乙所示:
甲 乙
2.正态分布
一般地,如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=,则称随机变量X服从正态分布(normal distribution).正态分布完全由参数μ和σ确定,因此正态分布常记作N(μ,σ2).如果随机变量X服从正态分布,则记为X~N(μ,σ2).
3.正态总体三个特殊区间内取值的概率值
①P(μ-σ<X≤μ+σ)=0.6826;
②P(μ-2σ<X≤μ+2σ)=0.9544;
③P(μ-3σ<X≤μ+3σ)=0.9974.
4.3σ原则
通常服从正态分布N(μ,σ2)的随机变量X只取(μ-3σ,μ+3σ)之间的值.
【规律方法】
1.求正态曲线的两个方法
(1)图解法:明确顶点坐标即可,横坐标为样本的均值μ,纵坐标为.
(2)待定系数法:求出μ,σ便可.
2.正态分布下2类常见的概率计算
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
3.正态总体在某个区间内取值概率的求解策略
(1)充分利用正态曲线对称性和曲线与x轴之间面积为1.
(2)熟记P(μ-σ<X≤μ+σ),P(μ-2σ<X≤μ+2σ),P(μ-3σ<X≤μ+3σ)的值.
(3)注意概率值的求解转化:
①P(X<a)=1-P(X≥a);
②P(X<μ-a)=P(X≥μ+a);
③若b<μ,则P(X<b)=.
特别提醒:正态曲线,并非都关于y轴对称,只有标准正态分布曲线才关于y轴对称.
【清单06】离散型随机变量的均值与方差
Ⅰ:随机变量的数字特征
1.离散型随机变量的均值的概念
一般地,若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称E(X)=x1p1+x2p2+…+xipi+…+xnpn=为随机变量X的均值或数学期望.
2.离散型随机变量的均值的意义
均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.
3.离散型随机变量的均值的性质
若Y=aX+b,其中a,b均是常数(X是随机变量),则Y也是随机变量,且有E(aX+b)=aE(X)+b.
证明如下:如果Y=aX+b,其中a,b为常数,X是随机变量,那么Y也是随机变量.因此P(Y=axi+b)=P(X=xi),i=1,2,3,…,n,所以Y的分布列为
Y
ax1+b
ax2+b
…
axi+b
…
axn+b
P
p1
p2
…
pi
…
pn
于是有E(Y)=(ax1+b)p1+(ax2+b)p2+…+(axi+b)pi+…+(axn+b)pn=a(x1p1+x2p2+…+xipi+…+xnpn)+b(p1+p2+…+pi+…+pn)=aE(X)+b,即E(aX+b)=aE(X)+b.
方差:.称为随机变量的方差,它反映了离散型随机变量相对于期望的平均波动大小(或说离散程度),其算术平方根为随机变量的标准差,记作,方差(或标准差)越小表明的取值相对于期望越集中,否则越分散.
Ⅱ: 均值与方差的性质
(1).
(2)(为常数).(3)
两点分布、二项分布、超几何分布的期望、方差
(1)若X服从两点分布,则,.
(2)若X服从二项分布,即,则.
(3)若X服从超几何分布,即时,
.
方法总结: 求离散型随机变量的均值、方差的基本步骤:
第一步:判断取值:先根据随机变量的意义,确定随机变量可以取哪些值;
第二步:探求概率:利用排列组合、枚举法、概率公式(常见的有古典概型公式、几何概型公式、互斥事件的概率和公式、独立事件的概率积公式,以及对立事件的概率公式)等,求出随机变量取每个值时的概率;
第三步:写分布列:按规范形式写出分布列,并注意用分布列的性质(概率总和为1)检验所求的分布列是否正确;
第四步:求期望值和方差:利用数学期望和方差的公式分别求期望和方差的值.对于有些实际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布X~B(n,p)),则此随机变量的期望可直接利用这种典型分布的期望公式(E(X)=np)求得.因此,应熟记常见的典型分布的期望与方差公式,可加快解题速度.
【清单07】二项分布之概率最值问题
Ⅰ:如果,其中,求最大值对应的值.
一般是考察与的大小关系.
因为
所以要使,则.故有
⑴如果,则时取得最大值.
⑵如果,是不超过的正整数,则当和时,取得最大值.
(3)如果是不超过的非整数,则当(注意表示不超过的最大整数)时取得最大值.
Ⅱ:方法二
【考点题型一】条件概率的求算
技巧:规律方法 利用定义计算条件概率的步骤
(1)分别计算概率P(AB)和P(A).
(2)将它们相除得到条件概率P(B|A)=,这个公式适用于一般情形,其中AB表示A,B同时发生.
【例1】随着城市经济的发展,早高峰问题越发严重,上班族需要选择合理的出行方式.某公司员工小明的上班出行方式有三种,某天早上他选择自驾,坐公交车,骑共享单车的概率分别为,,,而他自驾,坐公交车,骑共享单车迟到的概率分别为,,,结果这一天他迟到了,在此条件下,他骑共享单车去上班的概率为 .
【答案】
【分析】根据全概率和条件概率公式求解即可.
【详解】设事件A:这一天他迟到,事件B:他骑共享单车去上班,
由题可知,
所以,
故答案为:.
【变式1-1】某人忘记了电话号码的最后一位数字,因而他随意地拨号,则下列说法正确的是( )
A.第一次就接通电话的概率是
B.若已知最后一位数字是奇数,则第一次就接通电话的概率是
C.拨号不超过三次接通电话的概率是
D.若已知最后一位数字是奇数,则拨号不超过三次接通电话的概率是
【答案】CD
【分析】根据古典概型概率公式求解判断A;根据缩小样本空间法求解条件概率判断B,根据互斥事件加法公式和相互独立事件乘法公式求解概率判断C,根据缩小样本空间法,结合互斥事件加法公式和相互独立事件乘法公式求解条件概率判断D.
【详解】设表示“第次接通电话”,;表示“拨号不超过3次接通电话”.
由题意,知,选项A错误;
若已知最后一位数字是奇数,则第一次就接通电话的概率是,选项B错误;
事件,
则,选项C正确;
若已知最后一位数字是奇数,
则,选项D正确.
故选:CD
【变式1-2】从标有1,2,3,4,5,6的六张卡片中不放回地抽取两次,每次抽取1张,则在第一次抽到的卡片所标数字为奇数的条件下,第二次抽到的卡片所标数字仍为奇数的概率为( )
A. B. C. D.
【答案】C
【分析】由条件概率计算公式求解即可.
【详解】记“第一次抽到的卡片所标数字为奇数”,“第二次抽到的卡片所标数字为奇数”,
由题意得,,
所以.
故选:C
【变式1-3】随机事件A,B满足,,则= .
【答案】0.04
【分析】根据条件概率公式求出,再利用概率的基本性质求出.
【详解】已知条件概率公式,已知,,将其代入公式可得:
因为事件可以拆分为与同时发生以及与同时发生这两个互斥事件的和,即.
将,代入上式可得:
故答案为:0.04.
【变式1-4】已知事件满足,,则( )
A.若事件满足,则
B.若,则,
C.若与互斥,则
D.若与相互独立,则
【答案】BCD
【分析】举反例说明选项A错误;根据事件之间的关系结合条件概率计算公式可得选项B正确;根据互斥事件的概率加法公式可得选项C正确;根据独立事件概率的乘法公式可得选项D正确.
【详解】A.当事件两两互斥时,,
由,,,得.
当事件不满足两两互斥时,选项A不成立,举例如下:
设一个盒子里有编号为1到的个小球,从中摸出一个小球,记下球的编号,
记事件“球的编号不大于”,事件“球的编号不大于”,事件“球的编号大于3”,
满足,且,,但,故A错误.
B.若,则,,
∴,故B正确.
C.若与互斥,则,故C正确.
D.若与相互独立,则与相互独立,
∴,故D正确.
故选:BCD.
【考点题型二】全概率公式
技巧:全概率公式
在全概率的实际问题中我们经常会碰到一些较为复杂的概率计算,这时,
我们可以用 “化整为零”的思想将它们分解为一些较为容易的情况分别进行考虑
一般地,设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,
且P(Ai)>0,i=1,2,…,n,则对任意的事件B⊆Ω,有P(B)=P(Ai)P(B.
【例2】11分制乒乓球比赛规则如下:在一局比赛中,每两球交换发球权,每胜一球得1分,先得11分且至少领先2分者获胜,该局比赛结束;当某局比分打成10:10后,每球交换发球权,领先2分者获胜,该局比赛结束.现有甲、乙两人进行一场五局三胜,每局11分制的乒乓球比赛,比赛开始前通过拋掷一枚质地均匀的硬币来确定谁先发球.假设甲发球时甲得分的概率为,乙发球时甲得分的概率为,各球的比赛结果相互独立,且各局的比赛结果地相互独立,则下列说法正确的是( )
A.若每局比赛甲获胜的概率,则该场比赛甲3:2获胜的概率为
B.若某局比赛甲先发球,则该局比赛中打完前4个球时甲得3分的概率为
C.若某局比赛甲先发球,双方比分为8:8,则该局比赛甲以11:9获胜的概率为
D.若某局比赛目前比分为10:10,则该局比赛甲获胜的概率为
【答案】AC
【分析】根据给定条件,利用独立重复试验的概率公式、独立事件的概率公式、互斥事件的概率公式及全概率公式逐项分析求解.
【详解】对于A,甲3:2获胜的事件是第5局甲获胜,前4局甲胜2局,概率为,A正确;
对于B,打完前4个球时甲得3分的事件是甲发2球得2分的事件与甲发2球得1分的事件和,
其概率为,B错误;
对于C,比分为8:8后由甲发球,甲以11:9获胜的事件是4次发球,前3球甲胜2球,第4球甲胜,
其概率为,C正确;
对于D,设打成后再打2个球时甲的得分为,则,
,,
设该局比赛甲获胜为事件,则,
由全概率公式,得
,解得,则该局比赛甲获胜的概率,D错误.
故选:AC
【变式2-1】张某经营、两家公司,张某随机到公司指导与管理,已知他第1个月去公司的概率是.如果本月去公司,那么下个月继续去公司的概率为;如果本月去公司,那么下个月去公司的概率为,如此往复.设张某第个月去公司的概率为,则( )
A. B.
C. D.
【答案】A
【分析】先根据全概率公式得到数列的递推公式,再根据递推公式求通项公式,可求.
【详解】设表示第个月去公司,则,,
根据题意,得,,
由全概率公式,得
,
即,整理得,
又,所以是以为首项,为公比的等比数列,
所以,则.
故选:A
【变式2-2】设有一批同规格的产品,由三家工厂生产,其中甲厂生产,乙、丙两厂各生产,而且各厂的次品率依次为,现从中任取一件,则取到次品的概率为 .
【答案】0.025/
【分析】利用条件概率和全概率公式进行求解即可.
【详解】设分别表示甲,乙,丙工厂的产品,表示次品,
则,
,
.
故答案为:.
【变式2-3】某校团委开展知识竞赛活动.现有两组题目放在A,B两个箱子中,A箱中有6道选择题和3道论述题,B箱中有3道选择题和2道论述题.参赛选手先在任一箱子中随机选取一题,作答完后再在此箱子中选取第二题作答,答题结束后将这两个题目放回原箱子.
(1)若同学甲从B箱中抽取了两题,求第二题抽到论述题的概率;
(2)若同学甲从B箱中抽取了两题,已知第一题抽到论述题的条件下,求第二题抽到论述题的概率;
(3)若同学乙从A箱中抽取了两题,答题结束后误将题目放回了B箱,接着同学丙从B箱中抽取题目作答,求丙取出的第一道题是选择题的概率.
【答案】(1)(2)(3)
【分析】(1)设出事件,利用全概率公式求解即可;
(2)根据条件概率公式求解即可;
(3)设出事件,,,并求出对应的概率,利用全概率公式求出即可.
【详解】(1)设事件表示“甲第i次从B信封中取到论述题”,,2,
则,,
第一次抽到选择题的概率为,此时剩下2道选择题和2道论述题,
第二次抽到论述题的概率为;
第一次抽到论述题的概率为,此时剩下3道选择题和1道论述题,第
二次抽到论述题的概率为,
所以,.
由全概率公式得第2题抽到论述题的概率
.
(2)由(1)知,;
也可,
即第一题抽到论述题的条件下,求第二题抽到论述题的概率.
(3)设事件A为“丙从B信封中取出的第一个题是选择题”,
事件为“乙从A信封中取出2个选择题”,
事件为“乙从A信封中取出1个选择题和1个论述题”,
事件为“乙从A信封中取出2个论述题”,
则,,两两互斥且,
则,,,
,,,
所以丙取出的第一道题是选择题的概率为.
【变式2-4】某农科所正在试验培育甲、乙两个品种的杂交水稻,水稻成熟后对每一株的米粒称重,重量达到规定的标准后,则该株水稻达标.在水稻收获后,通过科研人员的统计,甲品种的杂交水稻有不达标,乙品种的杂交水稻有不达标.
(1)若假设甲、乙两个品种的杂交水稻株数相等,一科研人员随机选取了一株水稻,称重后发现不达标,求该株水稻来自甲品种和乙品种的概率分别是多少;
(2)科研人员选取了8株水稻,其中甲品种5株,乙品种3株,再从中随机选取3株进行分析研究,这3株中来自乙品种水稻的有株,求的数学期望.
【答案】(1)株水稻来自甲品种和乙品种的概率分别是,;(2).
【分析】(1)设事件A为“该株水稻来自甲品种”,事件B为“该株水稻不达标”,应用全概率公式求,再应用贝叶斯公式求该株水稻来自甲品种和乙品种的概率;
(2)根据已知分析随机变量的可能取值,并求出对应概率值,进而求期望即可.
【详解】(1)从甲、乙两个品种的杂交水稻中任取一株,
设事件A为“该株水稻来自甲品种”,事件B为“该株水稻不达标”,
则,,,,
∴,
,,
该株水稻来自甲品种和乙品种的概率分别是,.
(2)依题意的所有可能取值为0,1,2,3,则
,,
,,
∴的数学期望.
【考点题型三】贝叶斯公式
技巧:贝叶斯公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,
且P(Ai)>0,i=1,2,…,n,则对任意事件B⊆Ω,P(B)>0,
有P(Ai=
i=1,2,…,n.
【例3】甲参加某多轮趣味游戏,在A,B两个不透明的盒内摸球,规定在一轮游戏中甲先在A盒内随机取出1个小球放入B盒,再在B盒内随机取出2个小球.若每轮游戏的结果相互独立,且每轮游戏开始前,两盒内小球的数量始终如下表(小球除颜色外大小质地完全相同):
红球
蓝球
白球
A盒
2
2
1
B盒
2
2
1
(1)求在一轮游戏中甲从A,B两盒内取出的小球均为白球的概率:
(2)已知每轮游戏的得分规则为:若从B盒内取出的小球均为红球,则甲获得5分;若从B盒内取出的小球中只有1个红球,则甲获得3分;若从B盒内取出的小球没有红球,则甲获得1分.
(i)记甲在一轮游戏中的得分为X,求X的分布列:
(ii)在的条件下,从A盒取出放入B盒的球最有可能是什么颜色?
【答案】(1);
(2)(i)分布列见解析;(ii)红球
【分析】(1)记“在一轮游戏中甲从两盒内取出的小球均为白球”为事件,利用概率的乘法公式求得,即可求解;
(2)(i)由题意得到随机变量可以取,利用全概率的概率公式求得相应的概率,列出分布列;(ii)利用全概率公式计算即可.
【详解】(1)记“在一轮游戏中甲从两盒内取出的小球均为白球”为事件,
所以由条件概率可知,
所以在一轮游戏中甲从两盒内取出的小球均为白球的概率为.
(2)(i)由题意,可知随机变量可以取,
可得,
,
,
所以随机变量的分布列为
(ii)在的条件下,从A盒取出红球的概率为,
在的条件下,从A盒取出蓝球的概率为,
在的条件下,从A盒取出白球的概率为,
因,故在的条件下,从A盒取出放入B盒的球最有可能是红球.
【变式3-1】在某人工智能的语音识别系统开发中,每次测试语音识别成功的概率受环境条件(安静或嘈杂)的影响.
(1)已知在安静环境下,语音识别成功的概率为0.9;在嘈杂环境下,语音识别成功的概率为0.6.某天进行测试,已知当天处于安静环境的概率为0.3,处于嘈杂环境的概率为0.7.
(ⅰ)求测试结果为语音识别成功的概率;
(ⅱ)已知测试结果为语音识别成功,求当天处于安静环境的概率;
(2)已知当前每次测试成功的概率为0.8,每次测试成本固定,现有两种测试方案:
方案一:测试4次;方案二:先测试3次,如果这3次中成功次数小于等于2次,则再测试2次,否则不再测试,为降低测试成本,以测试次数的期望值大小为决策依据,应选择哪种方案?
【答案】(1);
(2)方案二
【分析】(1)(ⅰ)应用全概率公式计算求解;(ⅱ)应用贝叶斯公式计算求解.
(2)分析的取值,对于方案一,计算成本;对于方案二,利用规则得出对应概率列出分布列再求期望,比较即可判断求解.
【详解】(1)(ⅰ)记事件A是“安静环境”,则是“嘈杂环境”,记事件B是“语音识别成功”.
所以;
(ⅱ)已知测试结果为语音识别成功,则当天处于安静环境的概率;
(2)设每次测试成本固定为,
设方案一和方案二测试成本分别为,
方案一:测试4次则测试4次;
方案二:可取,
,
,
随机变量的分布列如下表所示:
所以.
所以,即方案一测试次数的期望值大于方案二测试次数的期望值,所以应选择方案二.
【变式3-2】有三个相同的箱子,分别编号,其中号箱内装有个红球、个白球,号箱内装有个红球、个白球,号箱内装有个红球,这些球除颜色外完全相同.某人等可能从三个箱子中任取一箱并从中摸出一个球,事件表示“取到号箱”,事件表示“摸到红球”,事件表示“摸到白球”,则( )
A. B.
C. D.
【答案】AD
【分析】对于A,,由条件概率公式,即可求解;对于B,利用事件,事件相互对立和条件概率公式,即可求解;对于C,根据条件,利用全概论公式,即可求解;对于D,利用选项C中结果,再利用贝叶斯公式,即可求解.
【详解】对于选项A,因为,所以选项A正确;
对于选项B,因为事件,事件相互对立,所以,所以选项B不正确;
对于选项C, 由全概率公式知,
所以选项C不正确;
对于选项D,由选项C知
则,所以选项D正确,
故选:AD.
【变式3-3】下列命题中正确的是( )
A.已知随机变量,则
B.
C.已知一组数据:7、7、8、9、5、6、8、8,则这组数据的第30百分位数是8
D.相关系数越大,成对样本数据的线性相关程度越强
【答案】AB
【分析】二项分布的方差计算方法可得A,再根据条件概率与贝叶斯公式可得B,有限个数的百分位数计算公式可求的30百分位数,根据相关系数的定义可得D选项.
【详解】因为,所以,则,A正确,
因为且,由贝叶斯公式可得,B正确,
将该组数据从小到大排列为:5,6,7,7,8,8,8,9,又因为,所以第30百分位数是7,C错误,
由相关系数的定义可知,越大,成对样本数据的线性相关程度越强,而不是越大,成对样本数据的线性相关程度越强,D错误.
故选:
【变式3-4】有甲、乙、丙3台车床加工同一型号的零件,加工的次品率分别为、、,加工出来的零件混放在一起.已知甲、乙、丙台车床加工的零件数分别占总数的、、.任取一个零件,如果取到的零件是次品,则它是甲车床加工的概率为( )
A. B. C. D.
【答案】C
【分析】记事件取到的零件为甲车床加工的,事件取到的零件为乙车床加工的,事件取到的零件为丙车床加工的,事件取到的零件是次品,利用贝叶斯公式可求得的值.
【详解】记事件取到的零件为甲车床加工的,事件取到的零件为乙车床加工的,
事件取到的零件为丙车床加工的,事件取到的零件是次品,
则,,,
,,,
由贝叶斯公式可得.
因此,如果取到的零件是次品,则它是甲车床加工的概率为.
故选:C.
【考点题型四】离散型随机变量的分布列
技巧:规律方法 求离散型随机变量分布列的步骤
(1)首先确定随机变量X的取值;
(2)求出每个取值对应的概率;
(3)列表对应,即为分布列.
【例4】若随机变量的分布列为
0
1
2
若,且,则( )
A. B. C. D.
【答案】A
【分析】由随机概率的性质可得,根据随机变量的分布列确定随机变量的分布列,从而可得,联立解得的值,于是可得的值.
【详解】由分布列可得,即①,
又,
则随机变量的分布列为
0
1
4
所以,即②,
联立①②可得:,
则.
故选:A.
【变式4-1】马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,因俄国数学家安德烈•马尔科夫而得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第n次的状态有关,与第,,,…次状态无关.已知有A,B两个盒子,各装有1个黑球、1个黄球和1个红球,现从A,B两个盒子中各任取一个球交换放入另一个盒子,重复进行次这样的操作后,记A盒子中红球的个数为,恰有1个红球的概率为,恰有2个红球的概率为.
(1)求,的值;
(2)证明:是等比数列,并求的通项公式;
(3)求的数学期望.
【答案】(1),
(2)证明见解析,
(3)
【分析】(1)根据题意可得A盒子中没有红球的概率为,进而根据规则求解即可;
(2)由题意可得,整理可得,进而求证,再求解的通项公式;
(3)由题意可得,,整理可得,进而求解的分布列,再计算数学期望即可.
【详解】(1)由题意,A盒子中没有红球的概率为,
则,,
,
.
(2)因为,,,
所以,又,
所以数列是以为首项,为公比的等比数列,
所以,即.
(3)当,时,,①
,②
由①②得,,又,
所以,则,
的可能取值为0,1,2,
则,
,,
则的分布列为:
0
1
2
所以.
【变式4-2】口袋中有编号分别为1,2,3,…,10的10个小球,所有小球除了编号外无其他差别.
(1)从口袋中任取3个小球,求取到的小球编号既有奇数又有偶数的概率;
(2)从口袋中任取5个小球,设其中编号的最小值为,求的分布列及期望.
【答案】(1);
(2)分布列见解析,期望为.
【分析】(1)利用古典概率的概率公式即可解出;
(2)求出的可能值及各个值对应的概率,列出分布列并求出期望.
【详解】(1)从口袋中任取3个小球有种方法,编号全为奇数的取法有种,全为偶数的取法有种,
因此编号既有奇数又有偶数的取法种数为,
所以取到的小球编号既有奇数又有偶数的概率为.
(2)依题意,的所有可能值为1,2,3,4,5,6,
从口袋中任取5个小球有种取法,
,,,
,,,
所以的分布列为
1
2
3
4
5
6
期望为.
【变式4-3】某商场举行促销活动,顾客凡是购买一袋指定的大米都可以抽一次奖,一袋大米的价格为元,每次抽奖只抽张奖券,每张奖券上有个不同的号码,每个号码只能是未中奖或中奖一次,从回收的张奖券中,记录并整理这些奖券的情况,获得数据如下表:
中奖次数
张数
当一张奖券中中奖号码不大于个时,兑换金额是每个中奖号码元;当中奖号码是个时,兑换金额是每个中奖号码元;当中奖号码是个时,兑换金额是每个中奖号码元.假设不同奖券的中奖情况是相互独立的,用频率估计概率.
(1)估计一张奖券的中奖号码个数不少于的概率.
(2)假设一袋米的进价为元,一张奖券的毛利润定义为一袋大米的利润与一张奖券中奖金额之差.
(i)记为一张奖券的毛利润(单位:元),估计的数学期望;
(ii)若没中奖的大米售价减少,中奖的大米售价增加,在这种情况下,一张奖券毛利润的数学期望估计值不小于(i)中的估计值,求的最小值.
【答案】(1)
(2)(i);(ii)的最小值为.
【分析】(1)由已知数据求出回收的奖券中一张奖券的中奖号码个数不少于的频率,再根据频率与概率的关系求结论;
(2)(i)由条件确定随机变量的可能取值,再求其取各值的概率,由此可得的分布列,再求的数学期望,
(ii)由条件再求随机变量的分布列及其期望,列不等式求的最小值.
【详解】(1)由已知回收的张奖券中中奖号码个数不少于的奖券的数量为,
所以回收的张奖券中一张奖券的中奖号码个数不少于的频率为,
所以估计一张奖券的中奖号码个数不少于的概率,
(2)(i)由已知的可能取值有,,,,,
且,,,
,,
所以随机变量的分布列为
所以随机变量的数学期望,
(ii)随机变量的可能取值有,,,,,
且,,,
,,
所以随机变量的分布列为
所以随机变量的数学期望,
由已知,
所以,
所以,
所以,
所以的最小值为.
【变式4-4】某初级中学为了响应国家提倡的素质教育,积极组织学生参加体育锻炼,并定期进行成绩测试.在某次测试中,该校随机抽取了初二年级名男生的立定跳远成绩和米短跑成绩,在立定跳远成绩大于等于的名男生中,米短跑成绩小于等于的有人,在立定跳远成绩小于的男生中,米短跑成绩大于的有人.
单位:人
立定跳远成绩
米短跑成绩
合计
小于等于
大于
大于等于
小于
合计
(1)完成上面列联表,并依据小概率值的独立性检验,分析立定跳远成绩是否与米短跑成绩有关;
(2)“立定跳远成绩小于”且“米短跑成绩小于等于”的人数为,已知这人中有人喜爱运动,若从中任取人进行调研,设表示取出的喜爱运动的人数,求的分布列和数学期望.
下面附临界值表及参考公式:
【答案】(1)表格见解析,有关
(2)分布列见解析,
【分析】(1)根据题意补充完整列联表,然后求出卡方,结合参考表格下结论即可;
(2)由(1)可得,分析得到的取值,然后求出取值对应的概率,得到变量的分布列,即可求出期望.
【详解】(1)列联表如图.
单位:人
立定跳远成绩
米短跑成绩
合计
小于等于
大于
大于等于
小于
合计
零假设为:立定跳远成绩与米短跑成绩无关,
计算得,
根据小概率的独立性检验,推断不成立,
即认为立定跳远成绩与米短跑成绩有关,此推断犯错误的概率不大于.
(2)由(1)可知的可能取值为,
则,
,
,
其分布列为:
所以数学期望为.
【考点题型五】两点分布
技巧:规律方法 两点分布的4个特点
(1)两点分布中只有两个对应结果,且两结果是对立的;
(2)两点分布中的两结果一个对应1,另一个对应0;
(3)由互斥事件的概率求法可知,已知P(X=0)(或P(X=1)),便可求出P(X=1)(或P(X=0));
(4)在有多个结果的随机试验中,如果我们只关心一个随机事件是否发生,就可以利用两点分布来研究它.
【例5】已知离散型随机变量服从两点分布,且,则( )
A. B. C. D.
【答案】A
【分析】根据两点分布可得,再结合已知即可得.
【详解】离散型随机变量服从两点分布,则,
又,所以.
故选:A.
【变式5-1】若随机变量服从两点分布,,则为( )
A.0.3 B.0.35 C.0.6 D.0.65
【答案】B
【分析】根据题意,得到,结合,列出方程,求得,进而求得的值,即可求解.
【详解】由随机变量服从两点分布,则,
因为,可得,解得,
所以.
故选:B.
【变式5-2】若随机变量X服从两点分布,则其分布列为
X
0
1
P
p
其中 称为成功概率.
【答案】
【分析】略
【详解】略
【变式5-3】一个袋中装有6个形状、大小完全相同的小球,其中红球有3个,编号为1,2,3;黑球有2个,编号为1,2;白球有1个,编号为1.现从袋中一次随机抽取3个球,若记取到白球的个数为随机变量,求随机变量的分布列,
【答案】答案见解析
【分析】利用两点分布可求的分布列.
【详解】由题意可知,服从两点分布.
又,
所以的分布列为
0
1
【变式5-4】对于只有两个可能结果的随机试验,用表示“成功”,表示“失败”,定义如果,则,那么的分布列如表所示
0
1
我们称服从 分布或分布.
【答案】两点
【分析】略
【详解】略
【考点题型六】正态分布
技巧:规律方法 利用正态分布求概率的两个方法
(1)对称法:由于正态曲线是关于直线x=μ对称的,且概率的和为1,
故关于直线x=μ对称的区间概率相等.如:
①P(X<a)=1-P(X≥a);
②P(X<μ-a)=P(X>μ+a).
(2)“3σ”法:利用X落在区间[μ-σ,μ+σ],[μ-2σ,μ+2σ],[μ-3σ,μ+3σ]
内的概率分别是0.6827,0.9545,0.9973求解.
【例6】关于下列命题中,正确的是( )
A.两变量X,Y的相关系数越接近1,X,Y的相关程度越强,越接近,相关程度越弱
B.从3名男同学和2名女同学中任选3人参加社区服务,则选中的男同学比女同学多的概率为
C.随机变量,若,则,
D.已知,若,则
【答案】BCD
【分析】由相关系数的意义判断A;应用组合数求任选3人的方法、选中的男同学比女同学多的方法,应用古典概型的概率求法判断B;根据二项分布的期望、方差求法及期望、方差的性质判断C;根据正态分布的对称性求指定概率判断D.
【详解】对于两变量X,Y的相关系数r,越接近1,则X,Y的相关程度越强,故A错误;
从3名男同学和2名女同学中任选3人共有种不同的选法,
而选中的男同学比女同学多的有种不同的选法,
所以选中的男同学比女同学多的概率为,故B正确;
因为,所以,,
所以,,故C正确;
因为,,所以,故D正确.
故选:BCD
【变式6-1】下列说法中正确的是( )
A.已知随机变量,,则
B.根据小概率值的独立性检验推断两个分类变量与是否有关联,经计算,可以推断两个变量有关联,该推断犯错误的概率不超过0.05
C.一个袋子中有大小和质地完全相同的6个球(标号为1,2,3,4,5,6),从袋中不放回地依次随机摸出2个球.设事件“第一次摸到标号小于4的球”,事件“第二次摸到标号小于4的球”,则与相互独立
D.甲、乙两组数据,甲组有8个数据,平均数为210,方差为1,乙组有12个数据,平均数为200,方差为1,则甲乙两组数据组成的总样本的方差为25
【答案】BD
【分析】利用二项分布及正态分布求出概率判断A;利用独立性检验判断B;利用相互独立事件的概率公式判断C;利用分层抽样的方差公式计算判断D.
【详解】对于A,由随机变量,得,由,得,A错误;
对于B,由独立性检验知,B正确;
对于C,,C错误;
对于D,甲乙两组数据组成的总样本的平均数为,
因此甲乙两组数据组成的总样本的方差为,D正确.
故选:BD
【变式6-2】下列命题正确的是( )
A.已知由一组样本数据,得到的回归直线方程为,且,则这组样本数据中一定有(10,60)
B.若随机变量,则
C.已知互不相同的30个样本数据,若去掉其中最大和最小的数据,则剩下28个数据的第75百分位数可能等于原样本数据的第75百分位数
D.若随机变量,且,则
【答案】BD
【分析】根据题意,结合回归方程的性质,样本均值和方程的计算方法,以及百分位数的计算方法,正态分布的概率计算,逐项判定,即可求解.
【详解】选项,回归直线方程是通过样本数据拟合得到的,
它表示的是变量和之间的一种线性关系,一定过样本中心点,但并不意味着样本数据中一定存在点,
回归直线是对样本数据整体趋势的一种近似描述,样本点不一定都在回归直线上,
所以这组样本数据中不一定有,选项错误.
对于选项,随机变量,那么,B选项正确.
对于C选项,设30个互不相同的样本数据从小到大排列为.
计算,则原样本数据的第75百分位数是.
去掉最大和最小的数据后,剩下28个数据从小到大排列为,计算,则剩下28个数据的第75百分位数是.
由于30个数据互不相同,则,C选项错误.
对于D选项,因为随机变量,所以正态曲线关于直线对称.
已知,根据正态曲线的对称性可知.
那么,D选项正确.
故选:BD.
【变式6-3】已知某次数学的测试成绩X服从的正态分布,若小明的成绩不低于91分,那么他的成绩大约超过了 %的学生(精确到0.1%).(参考数据:)
【答案】
【分析】根据正态分布的范围求解即可.
【详解】因为,
所以,
故答案为:
【变式6-4】下列说法正确的是( )
A.已知一组各不相同的数据,去掉其中最大和最小两个数据后,剩下的28个数据的22%分位数不等于原来数据的22%分位数
B.若事件A,B满足,,且,则事件A,B独立
C.若随机变量服从正态分布,且,则
D.已知具有线性相关关系的变量x,y,其经验回归方程为,若样本点中心为,则
【答案】AB
【分析】根据百分位数的计算即可求解A,根据相互独立的性质即可求解B,根据正态分布的对称性即可求解C,将样本中心代入回归方程即可求解D.
【详解】对于A,将原来30个数从小到大排列,,则30个数的22%分位数为30个数中的第7个数,
去掉其中最大和最小两个数据后,,故剩下的28个数据的22%分位数为28个数中的第7个数字,也是30个数中的第8个数,
故两者不相等,A正确,
对于B,,所以相互独立,因此也相互独立,B正确,
对于C,由于,则,故C错误,
对于D,将代入可得,故,D错误,
故选:AB
1 / 1
1 / 1
学科网(北京)股份有限公司
$$