内容正文:
第四章 概率与统计(复习讲义)
基础目标
能复述条件概率、全概率公式的定义及离散型随机变量相关概念,熟记两种条件概率计算方法、分布列求解步骤与性质;
会判定两点分布、二项分布、超几何分布,复述正态曲线性质、样本相关系数特征及独立性检验步骤;
能直接套用公式求解简单条件概率、分布列及均值方差,完成基础的相关关系判断与正态分布概率计算。
进阶目标
会推导条件概率性质、全概率公式的应用逻辑,能根据实际情境选择合适方法计算条件概率、运用全概率公式求解复杂事件概率;
熟练推导离散型随机变量均值方差公式,能规范求解特殊分布的分布列及数字特征,会利用正态曲线对称性计算复杂概率;
能推导线性回归方程系数公式,完成列联表整理与值计算,实现概率与统计基础知识点的综合应用。
拓展目标
理解并应用概率与统计知识解决实际综合问题,能结合情境分析全概率公式的多原因事件,灵活运用分布列性质求解参数并进行概率范围分析;
能区分二项分布与超几何分布的适用场景并综合应用,利用正态分布3σ原则解决实际决策问题;
能完成非线性回归的变量替换与方程求解,结合残差分析回归模型拟合效果,通过独立性检验结果给出实际问题的合理推断与决策建议。
一、概率计算
(一)条件概率
1.定义法:适用于所有一般情形,先分别计算出事件发生的概率和事件、同时发生的概率,再代入公式计算条件概率。
2.缩小样本空间法:适用于古典概型场景,第一步将原样本空间缩小为事件对应的样本空间,事件相应缩小为;第二步数出和包含的基本事件数;第三步用古典概型公式计算结果。
1.核心性质:设,则
①条件概率的取值范围为;
②若、为互斥事件,满足;
③若与互为对立事件,则。
(二)全概率公式及其应用
1.核心原理:若某一事件的发生由多个互斥的事件引发,则
2.应用场景:当一个事件的发生存在多个不同的前提条件,且各条件互斥时,需分情况计算每个条件下该事件发生的概率,再求和得到总概率。
(三)重伯努利试验与概率计算
解题步骤:
①先根据重伯努利试验的特征,判断所给试验是否符合独立重复、每次仅有两个对立结果的要求;
②分析所求复杂事件,判断是否需要拆分为多个简单互斥/独立事件;
③对每个简单事件,用伯努利试验概率公式求解,最后结合互斥事件加法公式或独立事件乘法公式计算最终概率。
二、离散型随机变量
(一)基础核心解题步骤
1.分布列的求解:
第一步:理解离散型随机变量的实际意义,明确其所有可能取到的数值;
第二步:根据题意,分别求出取每个值时对应的概率;
第三步:以表格形式规范写出的分布列:
2.分布列性质的应用:
①利用“分布列中所有事件的概率之和为1”这一性质,求解分布列中的未知参数,或检验所写分布列的正确性;
②因随机变量取不同值对应的事件两两互斥,可利用互斥事件概率加法公式,求随机变量在某一范围内取值的概率。
3.均值与方差的求解:
第一步:理解随机变量的实际意义,写出其全部取值;
第二步:计算取每个值的对应概率;
第三步:可根据需求写出分布列(简单题型可省略);
第四步:分别代入均值、方差的核心公式计算结果:
(二)三类特殊分布的判定与性质
1.两点分布
判定方法(两步法):①看取值:随机变量仅能取和两个值;②验概率:检验是否成立,两者均满足则为两点分布。
数字特征:若服从两点分布,为成功概率,则,。
2.二项分布
判定关键:①对立性:一次试验中事件发生与否仅有两种结果;②重复性:试验在相同条件下独立重复进行次。
核心要点:若,则,。
3.超几何分布
(1)判定条件:
①总体可明确分为两类不同的对象(如“次品/正品”“男生/女生”);②抽样方式为不放回抽样;
③随机变量表示的是抽取样本中某一类对象的个数。
(2)分布列求解:
①验证是否符合超几何分布特征,确定(总体容量)、(总体中某类个数)、(样本容量)的数值;
②代入超几何分布概率计算公式
③以表格形式列出分布列。
(三)数字特征的实际意义
随机变量的均值反映其取值的平均水平,方差反映其取值围绕均值的波动程度与稳定程度;二者是生产实际中方案取舍的重要理论依据,一般先比较不同方案的均值,若均值相同,再通过比较方差大小确定最优方案(方差越小越稳定)。
三、正态分布
(一)正态密度函数与正态曲线的核心性质
正态密度函数为:
正态曲线为单峰曲线,且关于直线(均值)对称,可结合这一性质与函数图象,求解相关参数或概率区间。
正态曲线在处达到峰值,利用该性质结合图象,可求解、等关键参数。
正态曲线与轴之间的总面积恒为1,是概率计算的重要前提。
(二)正态分布的概率计算
熟记标准正态分布在以下三个特殊区间内的取值概率:
充分利用正态曲线的对称性,将不规则的概率区间转化为特殊区间,结合面积和为1的性质求解复杂概率(例如:;)。
(三)正态分布的实际应用
解答正态分布实际应用题的核心是转化,将实际问题中的数量关系转化为正态分布的概率问题;解题中需熟练掌握三个特殊区间的概率值,同时结合数形结合思想和归纳思想,分析问题并求解。
四、统计分析
(一)变量的相关关系判断
1.散点图法:根据成对样本数据绘制散点图,若点的分布从左下角到右上角,两变量为正相关;若点的分布从左上角到右下角,两变量为负相关。
2.样本相关系数法:样本相关系数记为,
时两变量正相关,时两变量负相关;
的取值范围为,越接近1,线性相关程度越强,越接近0,线性相关程度越弱;
时两变量无线性相关关系。
计算公式为:
(二)回归分析
1.线性回归
核心结论:回归直线方程必过样本点的中心,可利用该结论求解回归方程中的未知参数。
解题步骤:
①绘制散点图,判断两变量是否存在线性相关关系;
②利用公式求解回归方程的系数:,得到经验回归方程;
③通过残差图或决定系数分析模型的拟合效果;
④借助拟合好的回归方程,对实际问题进行分析和预测。
2.非线性回归
解题步骤:
①根据原始样本数据作出散点图,观察点的分布特征;
②根据散点图的形状,选择恰当的非线性拟合函数(如指数型、幂函数型、对数型等);
③通过变量替换(如令、),将非线性问题转化为线性回归问题;
④求解线性回归方程,再通过逆变换,还原得到非线性经验回归方程。
(三)独立性检验
1.核心解题步骤:
①提出零假设:两个研究变量相互独立,并结合实际问题对零假设作出解释;
②根据抽样得到的样本数据,整理出列联表:
类别
类别
总计
类别
类别
总计
代入公式计算统计量的值:
③将计算的值与临界值(查分布表,自由度为1)比较,根据检验规则得出推断结论。
2.检验规则:
若临界值,则推断不成立,即认为两个变量不独立,且该推断犯错误的概率不超过对应临界值的概率;
若临界值,则没有充分的证据推断不成立,可认为两个变量相互独立。
题型一条件概率的求算
例1.一盒子中有大小与质地均相同的6个小球,其中白球4个,黑球2个.从中不放回地随机取3次,每次取1个球.
(1)记取到的黑球个数为随机变量,求的分布列和期望;
(2)已知实验完成后取到的黑球个数为2,求第2次取到白球的概率.
【答案】(1)分布列见解析,1
(2)
【分析】
【详解】(1)由题意知:所有可能的取值为0,1,2,
;
;
;
的分布列为:
0
1
2
∴数学期望.
(2)记事件“取到的黑球个数为2”,事件“第2次抽到白球”,
则事件“第1次和第3次抽到黑球,第2次抽到白球”;
因为.
所以,
即在抽取到2个黑球与1个白球的前提下,第2次抽到白球的概率为.
变式1-1.两位游客慕名来江苏旅游,他们分别从太湖鼋头渚、苏州拙政园、镇江金山寺、常州恐龙园、南京夫子庙、扬州瘦西湖这6个景点中随机选择1个景点游玩.记事件“两位游客中至少有一人选择太湖鼋头渚”,事件“两位游客选择的景点不同”,则 .
【答案】
【详解】依题意,事件“两位游客中至少有一人选择太湖鼋头渚,且两位游客选择的景点不同”,
所以;
事件“两位游客中没有一人选择太湖鼋头渚”,,
所以;
所以.
故答案为:
变式1-2.小龙虾是江汉平原的一种特色美食,它的口味有多种,据调查江汉平原地区喜欢麻辣口味的食客占,喜欢蒜蓉口味的食客占,既喜欢麻辣口味又喜欢蒜蓉口味的食客占,现从不喜欢蒜蓉口味的食客中随机抽取一人,则此人喜欢麻辣口味的概率为 .
【答案】
【详解】记事件:喜欢麻辣口味的食客;记事件:喜欢蒜蓉口味的食客,
则喜欢麻辣口味又喜欢蒜蓉口味的食客为,
由题意可知,
则不喜欢蒜蓉口味的食客的概率为:,
由喜欢麻辣口味但不喜欢蒜蓉口味的食客的事件为:,
则,
所以从不喜欢蒜蓉口味的食客中随机抽取一人,
则此人喜欢麻辣口味的概率为:,
故答案为:.
变式1-3.某电子设备制造厂所用的元件是由甲、乙、丙三家元件制造厂提供的,根据以往的记录有下表所示的数据.设这三家制造厂的产品在仓库中是均匀混合的且无区别标志.
元件制造厂
次品率
提供元件的份额
甲
0.02
0.2
乙
0.01
0.7
丙
0.03
0.1
(1)在仓库中随机取一只元件,求它是次品的概率;
(2)在仓库中随机地取一只元件,若已知取到的是次品,求该次品是由丙制造厂提供的概率.
【答案】(1)0.014
(2)
【分析】
【详解】(1)A表示“取到的是一只次品”,表示“所取到的元件是由甲制造厂提供的”,
表示“取到的元件是由乙制造厂提供的”,表示“取到的元件是由丙制造厂提供的”,
则,,,
,,,
由全概率公式得:
.
(2)该元件出自丙工厂的概率为.
题型二条件概率性质的妙用
例2.设是两个随机事件,已知,,,记,则( )
A. B. C. D.
【答案】C
【详解】由已知得,
注意到,所以相互独立,
故,
,
又因为,故,
所以.
故选:C.
变式2-1.(多选)设,,是同一概率空间中的随机事件,满足,,,,则下列结论正确的是( )
A. B. C. D.
【答案】ABC
【详解】已知,,,,,
选项A:由条件概率公式,
得,故A正确;
选项B:由全概率公式,
得,故B正确;
选项C:由加法公式,
得,故C正确;
选项D:由条件概率公式,
得,故D错误.
故选:ABC.
变式2-2.已知,,,则 .
【答案】/
【详解】由概率的乘法公式可得,
由条件概率公式可得.
故答案为:.
变式2-3.(多选)设A,B为随机事件,且,则下列说法正确的是( )
A.若,则A,B相互独立
B.若,则
C.若,则
D.若,则
【答案】AC
【详解】及,得,即,所以A,B相互独立,故A正确;
由,得,所以,故B错误;
由A知当时,,所以,故C正确;
,
,所以等式不成立,故D错误.
故选:AC.
题型三利用全概率公式求概率
例3.已知1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球.现随机地从1号箱中取出1个球放入2号箱,然后从2号箱中随机取出1个球,则从2号箱取出红球的概率是 ,从2号箱取出红球来自1号箱的概率是 .
【答案】
【详解】①设“从2号箱中取出的是红球”,“从1号箱中取出的是红球”,
则,,
,,
故P(A)=;
②由①得从2号箱取出红球的概率是,
则从2号箱取出的红球来自1号箱的概率为,
则从2号箱取出红球来自1号箱的概率为.
故答案为:;.
变式3-1.跑步运动越来越受大众喜爱.据统计,某校有高一、高二、高三三个年级,这三个年级中喜欢跑步运动的教师分别占该年级教师人数的,且这三个年级的教师人数之比为,现从这三个年级中随机抽取一名教师,则该教师喜欢跑步的概率为( )
A.0.42 B.0.36 C.0.35 D.0.45
【答案】C
【详解】设事件表示“随机抽取一名教师喜欢跑步”,事件分别表示“抽到的教师来自高一、高二、高三年级”,
因为三个年级的教师人数之比为,
所以,,,
因为高一、高二、高三三个年级中喜欢跑步运动的教师分别占该年级教师人数的,
所以,,
根据全概率公式可得.
故选:C
变式3-2.有3台车床加工同一型号的零件,第1,2,3台加工的次品率分别为,,,加工出来的零件混放在一起.已知第1,2,3台车床加工的零件个数分别占总数的,,,若从中任取一个零件,则这个零件是次品的概率为( )
A.0.036 B.0.040 C.0.042 D.0.048
【答案】C
【详解】依题意,定义事件“零件为第台车床加工”,事件“零件为次品”;
所以
即任取一个零件是次品的概率为,
故选:C.
变式3-3.芡实俗称“鸡头米”,是一种不可多得的养生良品,其通过开发可以产出芡实酒.已知,,三家酒厂同时生产一批芡实酒,加工量分别占总量的20%,35%,45%,不合格率分别为0.01,0.015,0.02.现从这批产品中任取一瓶芡实酒,则该瓶酒是不合格的概率为 ;若该瓶芡实酒是不合格品,则该瓶酒是厂生产的概率为 .
【答案】 /
【详解】记事件:任取一瓶芡实酒,该瓶酒不合格.
:任取一瓶芡实酒,该瓶酒由厂生产,,;
:任取一瓶芡实酒,该瓶酒由厂生产,,;
:任取一瓶芡实酒,该瓶酒由厂生产,,.
则.
所以.
故答案为:①;②.
题型四利用贝叶斯公式求概率
例4.(多选)甲、乙两个不透明的袋子中分别装有两种颜色不同但是大小相同的小球,甲袋中装有5个红球和5个绿球;乙袋中装有4个红球和6个绿球.先从甲袋中随机摸出一个小球放入乙袋中,再从乙袋中随机摸出一个小球,记表示事件”从甲袋摸出的是红球”,表示事件“从甲袋摸出的是绿球”,记表示事件“从乙袋摸出的是红球”,表示事件“从乙袋摸出的是绿球”.下列说法正确的是( )
A.,是对立事件 B.
C. D.
【答案】ACD
【详解】对于A,依题意,因为每次只摸出一个球,,
所以,是对立事件,故A正确;
对于B,,故B错误;
对于C,,
故C正确;
对于D,,
,故D正确.
故选:ACD.
变式4-1.某社区有“驿站取件”和“上门配送”两种快递服务方式,居民首次选择服务方式时,选择两种服务方式的概率均为0.5.已知:若首次选了“驿站取件”,第二次继续选择“驿站取件”的概率为0.7.若首次选了“上门配送”,第二次换选择“驿站取件”的概率为0.2.则居民第二次选择“驿站取件”的概率为 ,若已知某居民第二次选择“驿站取件”,则他首次选择是“上门配送”的概率为 .
【答案】
【详解】设表示首次选“驿站取件”,则,
表示首次选“上门配送”,则,
表示第二次选“驿站取件”则,
根据全概率公式可得,
第二空根据贝叶斯公式可得.
故答案为:,
变式4-2.(多选)某商场举行抽奖活动,规则如下:参与者从甲、乙两个箱子中随机选择一个,然后从该箱中有放回地抽取小球两次,每次抽取1个球,已知甲箱中有4个红球和2个白球,乙箱中有3个红球和3个白球,每次抽到红球记1分,抽到白球记0分,设事件“参与者选择甲箱”,事件“两次抽球总得分为2分”,则( )
A. B.
C.与相互独立 D.
【答案】ABD
【详解】设甲箱中每次抽到红球概率为,乙箱中每次抽到红球概率为,
由于参与者选择箱子是随机的,.
在事件发生的条件下(即选择了甲箱),每次抽到红球的概率为,
且各次抽取相互独立.两次总得分为2分,即两次均抽到红球,其概率为,故A正确;
在事件发生的条件下(即选择了乙箱),每次抽到红球的概率为,两次均抽到红球概率为,
由全概率公式,,故B正确;
由于,
显然,因此事件与事件不独立,故C错误;
由贝叶斯公式,,故D正确.
故选:ABD.
变式4-3.某无人机制造有限公司是世界级独角兽企业,其产品优质,畅销全球.该公司2024年有3条新型无人机生产线.
(1)假设新型无人机销售时按整箱出售,每箱10台.采购商在采购时,会随机选择一箱,并从中一次性随机抽取3台进行检查,若此箱产品中恰好有2台次品,求检测到的次品数的分布列和数学期望.
(2)该公司的3条新型无人机生产线的次品率和生产的无人机所占比例如下表:
次品率
占比
1号生产线
0.01
2号生产线
0.02
3号生产线
0.04
现从所生产的无人机中随机抽取1台,用频率估计概率,已知取到的是次品,试求该次品分别由三条生产线所生产的概率,并分析该次品来自哪号生产线的可能性最大.
【答案】(1)分布列见解析,数学期望为
(2)1号生产线所生产的概率为,2号生产线所生产的概率为,3号生产线所生产的概率为,该次品来自第2条生产线的可能性最大
【分析】
【详解】(1)由题意,的可能取值为,
,,
所以的分布列为:
0
1
2
所以的数学期望为,
(2)设表示“取到的是一台次品”,,2,表示“所取到的产品是由第条生产线生产”,
由题意得:,,,
,,,
,
所以,
,
,
故该次品来自第2条生产线的可能性最大.
题型五独立事件的乘法公式
例5.某企业到A大学招聘,小张、小李和小王3位毕业生前去应聘.若小张、小李2人中至少有1人签约的概率是,小王签约的概率是,3人签约事件相互独立,那么3人中至少有1人签约该企业的概率是 .
【答案】
【详解】事件“3人中至少有1人签约该企业”的对立事件是“3人均未签约”,
因为小张、小李2人中至少有1人签约的概率是,
所以小张、小李2人均未签约的概率是;
因为小王签约的概率是,所以小王未签约的概率是,
所以三人均未签约的概率是,
所以3人中至少有1人签约该企业的概率是.
故答案为:
变式5-1.概率论起源于博弈游戏17世纪,曾有一个“赌金分配”的问题:博弈水平相当的甲、乙两人进行博弈游戏每局比赛都能分出胜负,没有平局.双方约定,各出赌金150枚金币,先赢3局者可获得全部赎金;但比赛中途因故终止了,此时甲赢了2局,乙赢了1局.向这300枚金币的赌金该如何分配?数学家费马和帕斯卡都用了现在称之为“概率”的知识,合理地给出了赌金分配方案.该分配方案是( )
A.甲150枚,乙150枚 B.甲225枚,乙75枚
C.甲200枚,乙100枚 D.甲240枚,乙60枚
【答案】B
【详解】由题可知,对单独每一局游戏,甲乙获胜的概率均为,
若游戏继续进行,最多再进行2局即可分出胜负,
①第四局甲赢,比赛结束,甲胜出,概率为;
②第四局乙赢,第五局甲赢,比赛结束,甲胜出,概率为;
③第四局乙赢,第五局乙赢,比赛结束,乙胜出,概率为;
则甲胜出的概率为,则甲应该分得赌金的,
所以枚,乙分得赌金枚.
故选:B.
变式5-2.(多选)有四张同样大小的卡片,上面标有数字,如图所示.从这四张卡片中随机抽取一张,设事件:“抽到的卡片上有数字”,,则下列事件相互独立的是( )
A. B. C. D.
【答案】ABC
【详解】四张卡片的内容:
卡片1:包含数字1,2,3;
卡片2:包含数字1;
卡片3:包含数字2;
卡片4:包含数字3.
含有数字1的卡片:卡片1、卡片2,∴
含有数字2的卡片:卡片1、卡片3,∴
含有数字3的卡片:卡片1、卡片4,∴
同时含有数字1和2的卡片:卡片1,∴
同时含有数字1和3的卡片:卡片1,∴
同时含有数字2和3的卡片:卡片1,∴
同时含有数字1和2和3的卡片:卡片1,∴
∵,∴事件相互独立,A选项正确;
∵,∴事件相互独立,B选项正确;
∵,∴事件相互独立,C选项正确;
∵,∴事件不相互独立,D选项不正确;
故选:ABC.
变式5-3.在学校举行的秋季运动会中,甲、乙两名同学进入乒乓球决赛.决赛规则约定每局胜者得1分,负者得0分,比赛进行到有一人比对方多2分或打满6局时结束.设甲在每局中获胜的概率为,乙在每局中获胜的概率为,且各局胜负相互独立.
(1)求打完两局比赛结束的概率.
(2)求比赛打满6局结束的概率.
(3)若比赛结束时,分数较多的一方获胜,求甲获胜的概率.
【答案】(1)
(2)
(3)
【分析】
【详解】(1)打完两局比赛结束说明甲连胜两局或乙连胜两局,
记甲第局胜为事件,乙第局胜为事件,
所以,打完两局比赛结束的概率为:
(2)打满局结束,当且仅当比赛在前局和前局均未结束,
即前局比分为且前局比分为,
所以,所求概率为:
(3)甲获胜包括:前两局甲获胜,或前4局中甲胜3局乙胜1局,或前4局甲乙各胜两局且第5、6局甲获胜.
所以,甲获胜的概率:
题型六由随机变量的分布列求概率
例6.设离散型随机变量的分布列为:
0
1
2
3
4
0.1
0.4
0.2
0.2
则离散型随机变量的期望
【答案】2
【详解】由可得,
所以,
故答案为:2.
变式6-1.随机变量X的分布列为:
X
1
2
3
P
a
则( )
A. B. C. D.
【答案】C
【详解】由题意可得,解得,
所以.
故选:C.
变式6-2.(多选)已知离散型随机变量的分布列如下所示,则下列说法正确的是( )
-2
1
3
0.25
A. B.
C. D.
【答案】ACD
【详解】由题意:.
所以;
所以;
.
故选:ACD
变式6-3.已知离散型随机变量X的分布列.
(1)求常数的值;
(2)求;
(3)求随机变量的分布列及方差.
【答案】(1)
(2)
(3)分布列见解析,
【分析】
【详解】(1)由题意得随机变量X的分布列如下表所示.
1
由分布列的性质得,解得.
(2).
(3)由题意可知,的所有可能值为、、、,
,,
,,
所以的分布列为:
P
所以,
.
题型七求两点分布分布列及期望与方差
例7.若随机变量X服从两点分布,且,则下列结论错误的是( )
A. B.
C. D.
【答案】C
【详解】由有,所以,故A正确;
,故B正确;
,故C错误;,故D正确.
故选:C.
变式7-1.已知随机变量X,Y均服从伯努利分布,且X,Y的取值为0或1.若,且,则 .
【答案】
【详解】因为随机变量X,Y均服从分布,且,
所以①,
②,
由,即,
则有③,
将③代入①可得:,
将③代入②可得:,
由,
则,
所以.
故答案为:
变式7-2.已知随机变量均服从两点分布,若,则( )
A. B. C. D.
【答案】B
【详解】因为随机变量均服从两点分布,所以,
因为,
所以,
由条件概率公式,
故选:B.
变式7-3.已知随机变量服从两点分布,.若,则 .
【答案】0.44
【详解】由题意可得.
故答案为:
题型八求二项分布分布列及期望与方差
例8.某电子零部件代加工工厂生产的零部件次品率为,现进行多批次抽检,假设各零部件是否为次品相互独立.
(1)从一批产品中随机抽取件,求抽到的零部件中正品数多于次品数的概率;
(2)若从另一批产品中随机抽取件,记抽到的零部件的正品数与次品数差的绝对值为,求的分布列.
【答案】(1)
(2)分布列见解析
【分析】
【详解】(1)从一批产品中随机抽取件,抽到的零部件中正品数多于次品数,
则次品数为件或件,
所以所求概率为.
(2)设抽取的零部件次品数为,
则,
所以可能的取值依次为,,,
,
,
所以的分布列为:
1
3
0.27
0.73
变式8-1.将一枚质地均匀的硬币连掷三次,事件“恰出现2次正面朝上”的概率记为,现采用随机模拟的方法估计的值:用计算机产生了20组随机数,其中出现“0”表示反面朝上,出现“1”表示正面朝上,结果如下,,若出现“恰有2次正面朝上”的频率记为,则( )
A. B. C. D.0
【答案】B
【详解】一枚质地均匀的硬币连掷三次,正面朝上的次数的二项分布,
所以,恰出现2次正面朝上的概率,
20组随机数中,出现“恰有2次正面朝上”的有:011、101、101、011、011、101,共6组,故频率,
所以.
故选:B
变式8-2.某购物中心举行购物抽奖活动,顾客购物达到一定金额后即可获得一次抽奖机会.抽奖时,从装有2个红球,4个绿球(每个球大小和质地相同)的抽奖箱中,每次随机摸取2个球.若两球都是红色,则获得一等奖;若两球不同色,则获得二等奖;若两球都是绿色,则不获奖.每人每次抽球互不影响.
(1)求顾客获得一等奖的概率;
(2)现有3名顾客参与抽奖,求至少两人获奖的概率.
【答案】(1)
(2)
【分析】
【详解】(1)设事件为“顾客获得一等奖”,
从6个球中随机摸取2个球的情况数为种,
从2个红球中随机摸取2个红球的情况数为种
则.
(2)由题意得每次抽奖独立,则不获奖的概率为,则获奖的概率为,
设3名顾客中获奖的人数为,则,
则,
,
所以.
变式8-3.某公司对新产品进行测试,测试分两个环节,第一个环节通过后才能进入第二环节测试,第一环节测试合格的概率为,若第一环节测试通过,则第二环节测试合格的概率为;若第一环节测试不合格,则无法进第二环节,设该产品最终测试合格的概率为,且每次测试结果相互独立.
(1)求的值;
(2)若连续2次进行测试,记为合格的次数,求的分布列及数学期望.
【答案】(1)
(2)分布列见解析,
【分析】
【详解】(1)设事件A表示“第一环节测试合格”,事件B表示“第二环节测试合格”,事件C表示“最终测试合格”,
根据题意,由条件概率公式得,
已知,则,故;
(2)由(1)知,该产品测试合格的概率为,因连续2次测试相互独立,
故服从二项分布,即,
由二项分布概率公式得,
当时,;
当时,;
当时,;
0
1
2
由二项分布期望公式得.
题型九服从二项分布的随机变量概率最大问题
例9.一年之计在于春,一日之计在于晨,春天是播种的季节,是希望的开端.某种植户对一块地的个坑进行播种,每个坑播2粒种子,每粒种子发芽的概率均为,且每粒种子是否发芽相互独立.对每一个坑而言,如果全部的种子发芽,则不需要进行补播种,否则要补播种.
(1)当时,用表示要补播种的坑的个数,求的分布列与数学期望.
(2)当取何值时,有4个坑要补播种的概率最大?最大概率为多少?
【答案】(1)分布列见解析,
(2),
【分析】
【详解】(1)对于一个坑,不需要补播种的概率为,需要补播种的概率为,
由题意可知,的可能取值有,且,
则,,
,,
则的分布列如下:
则数学期望为;
(2)由(1)可知,有4个坑要补播种的概率为,
由,得,
因为为正整数,所以,
则当时,有4个坑要补播种的概率最大,最大概率为.
变式9-1.一个质点在随机外力的作用下,从数轴上数字所对应的位置出发,每隔秒向左或向右移动一个单位,设每次向右移动的概率为,则秒后质点最有可能落在数轴上( )所对应的位置.
A. B. C. D.
【答案】B
【详解】设质点向右移动次,则向左移动次,最终落在,
质点向右移动服从二项分布,
令,其中
即,
即,
整理得,解得,
所以当时,,
当时,,
则最大,
即质点最有可能向右移动次,最终落在,
所以秒后质点最有可能落在数轴上所对应的位置.
故选:B.
变式9-2.(多选)某同学共投篮12次,每次投篮命中的概率为0.8,假设每次投篮相互独立,记他投篮命中的次数为随机变量,下列选项中正确的是( )
A. B.
C. D.该同学投篮最有可能命中9次
【答案】AB
【详解】由二项分布的定义可知,,故A正确,
则,,
所以,故B正确,
,故C错误;
设该同学投篮最有可能命中次,则 ,
则,解得,
又,所以,故D错误;
故选:AB.
变式9-3.某学校组织“学党史、强信念、跟党走”为主题的知识竞赛,每位参加比赛的同学均可参加多轮答题活动,每轮答题结果互不影响.每轮比赛共有两组题,每组都随机抽取两道题作答,先进行组答题,只有组的两道题均答对,方可进行组答题,否则本轮答题结束.已知甲同学组每道题答对的概率均为,组每道题答对的概率均为,两组题至少答对3道题才可获得一张奖券.
(1)设甲同学在一轮比赛中答对的题目数量为,求的分布列与数学期望;
(2)若甲同学进行了10轮答题,试问甲同学获得多少张奖券的概率最大?并说明理由.
【答案】(1)分布列见解析,
(2)同学获得3张奖券的概率最大,理由见解析
【分析】
【详解】(1)甲同学在一轮比赛中答对的题目数量为的可能取值有,
则
所以的分布列为
0
1
2
3
4
故;
(2)由于两组题至少答对3道题才可获得一张奖券,
则甲在一轮答题中获得一张奖券的概率为
,
所以甲同学进行了10轮答题,获得的奖券数,
可得奖券数的概率为,,
假设甲同学获得张奖券的概率最大,
则有:
化简得:,
又因为,所以,即同学获得3张奖券的概率最大.
题型十求超几何分布分布列及期望与方差
例10.2025年春节期间,电影《哪吒之魔童降世2》票房破百亿,整个电影界都为之欢腾,这是中国动画电影的一大步,也是世界电影史上的一次壮丽篇章.现随机抽取100位市民,将市民按年龄分为“青年组”和“非青年组”,同时统计是否看过电影《哪吒之魔童降世2》的样本观测数据整理如下:
看过
没看过
合计
青年组
30
20
50
非青年组
15
35
50
合计
45
55
100
记表示“抽取到的市民没看过《哪吒之魔童降世2》”,其概率为表示“抽取到的市民为非青年组”,其概率为.
(1)给出的估计值;
(2)现从抽取的青年组市民中,按是否看过《哪吒之魔童降世2》用分层抽样的方法选出5人组成一个小组,从抽取的5人中再抽取3人赠送《哪吒之魔童降世2》的电影票,求这3人中看过《哪吒之魔童降世2》的人数的分布列和数学期望.
【答案】(1)的估计值为,的估计值为,的估计值为;
(2)分布列见解析,.
【分析】
【详解】(1)A表示抽取到的市民没看过《哪吒之魔童降世2》,B表示抽取到的市民为非青年组.
样本容量,没看过电影的总人数55,抽取到的市民没看过《哪吒之魔童降世2》的频率为,
因此的估计值为,
抽取到的市民为非青年组的总人数50,抽取到的市民为非青年组的频率为,
因此的估计值为.
法一:,
在抽取到的市民没看过《哪吒之魔童降世2》条件下,抽到的市民为青年组的频率为,
因此的估计值为;
法二:,
在抽取到的市民没看过《哪吒之魔童降世2》条件下,抽到的市民为青年组的频率为,
因此的估计值为;
(2)按照分层抽样,抽取的5人中看过《哪吒之魔童降世2》的有3人,没看过《哪吒之魔童降世2》的有2人,
则看过《哪吒之魔童降世2》的人数的取值范围为,
由题意,看过《哪吒之魔童降世2》的人数,则,
此时,,.
则的分布列为:
X
1
2
3
所以,或.
变式10-1.(多选)一个口袋中有大小相同的2个白球和4个黑球,从中随机取出3个球,记取出的黑球个数为,则下列结论正确的是( )
A.的可能取值为0,1,2,3 B.
C. D.
【答案】BC
【详解】由题可知服从超几何分布,且,,,,.
易知的可能取值为1,2,3,故选项A错误;
,故选项B正确;
由,,,结合超几何分布的均值公式可得,故选项C正确;
由离散型随机变量均值的性质可得,故选项D错误.
故选:BC.
变式10-2.某班组织竞赛活动,规定比赛需要从6道备选题中随机抽取3道题目进行作答.假设在6道备选题中,甲正确完成每道题的概率都是且每道题正确完成与否互不影响,乙能正确完成其中4道题目且另外2道题不能完成.
(1)求甲正确完成其中2道题的概率;
(2)设随机变量X表示乙正确完成题目的个数,求X的分布列及数学期望.
【答案】(1)
(2)分布列见解析;
【分析】
【详解】(1)令事件为甲正确完成其中2道题,
所以;
(2)由已知有:的可能取值为,
所以,
所以的分布列为:
所以.
变式10-3.据文化和旅游部发布的数据显示,近几年国内出游人次显著增加.人们选择的出游方式不尽相同,有自由行,也有跟团游.为了了解年龄因素是否影响出游方式的选择,我们按年龄将成年人群分为青壮年组(大于等于14岁,小于40岁)和中老年组(大于等于40岁).现在市随机抽取170名成年市民进行调查,得到如下表的数据:
青壮年
中老年
合计
自由行
60
跟团游
50
合计
80
170
(1)请补充列联表,并判断能否有的把握认为年龄与出游方式的选择有关;
(2)用分层抽样的方式从跟团游中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
0.10
0.05
0.025
2.706
3.841
5.024
【答案】(1)列联表见解析,有关;
(2)分布列见解析,.
【分析】
【详解】(1)补充列联表:
青壮年
中老年
合计
自由行
60
40
100
跟团游
20
50
70
合计
80
90
170
,
因此有的把握认为年龄与出游方式的选择有关;
(2)用分层抽样从跟团游中抽取14个人,则从青壮年组中抽取人,从中老年组山抽取人,
从14个人中随机抽取7个人,若这7个人青壮年于中老年人数分别为,
则,相应的,则,
则,.
的分布列为的分布列为:
1
3
5
7
.
题型十一利用正态分布3σ原则求概率
例11.西峡猕猴桃是河南特产、中国国家地理标志产品.据统计,西峡县某种植基地新品种猕猴桃的单果质量(单位:g)近似服从正态分布,现有随机采摘的该新品种猕猴桃10000个,估计其中单果质量不低于70g的猕猴桃个数为( )
参考数据:若,则,,.
A.8413 B.9544 C.9772 D.9987
【答案】C
【详解】,,
又,
故,
估计其中单果质量不低于70g的猕猴桃个数为.
故选:C
变式11-1.(多选)设随机变量,则( )
A. B.
C. D.
【答案】ACD
【详解】由题设,则,,A对,B错;
,C对;,D对.
故选:ACD
变式11-2.设随机变量,函数在定义域R上是单调递减函数的概率为,则( )
附:若,则,.
A.0.1355 B.0.1587 C.0.2718 D.0. 3413
【答案】A
【详解】因为,所以,
若对任意实数恒成立,则,所以,
又,所以,,,,,,
所以,,
则.
故选:A.
变式11-3.某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行测试,对其生产的第一批零件的内径进行测量,统计绘制了如图所示的频率分布直方图.
(1)求的值以及这批零件内径的平均值(同一组中的数据用该组区间的中点值作代表);
(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间内的零件个数为,求的分布列以及数学期望;
(3)已知这批零件的内径(单位:mm)服从正态分布,现以这批零件内径的平均数作为的估计值,这批零件内径的标准差作为的估计值,已知的近似值为0.105,则在这批零件中随机抽取200个,记内径在区间上的零件个数为,求的方差.
参考数据:若,则,,.
【答案】(1),2.6
(2)分布列见解析,0.8
(3)26.88
【分析】
【详解】(1)由,得.
这批零件内径的平均值2.6.
(2)由题意知,内径在区间内的频率为,则,
的可能取值为0,1,2,3,4,
则,,,,,
因此可得的分布列:
0
1
2
3
4
0.4096
0.4096
0.1536
0.0256
0.0016
则的数学期望0.8,
或,所以;
(3)由题意知,,,
又,,
则.
由二项分布的定义知,
由二项分布的方差公式知,26.88.
题型十二利用总体均值和方差选取方案
例12.某校组织了“AI人工智能”知识竞赛(满分100分),经统计参赛同学的成绩(单位:分)近似服从正态分布,已知.
(1)从参赛同学中随机抽取3人,设表示这3人中成绩在内的人数,求的分布列和方差;
(2)该校为调动学生参赛的积极性,设置两种抽奖方案:
方案一:参赛同学只能抽奖1次,抽奖获得价值150元、100元、10元的学习用品的概率分别为,,;
方案二:参赛同学的成绩低于只能抽奖1次,不低于的抽奖2次,每次抽奖获得价值100元、40元的学习用品的概率分别为,.
请分析参赛同学采用哪种方案获得学习用品价值金额的期望较大?
【答案】(1)分布列见解析,方差为
(2)若成绩低于,采用方案一获得学习用品价值金额的期望较大;若成绩不低于,采用方案二获得学习用品价值金额的期望较大
【分析】
【详解】(1)由,
可知,
由题意可知的取值范围是,且,
则,
,
,
,
所以的分布列为
ξ
0
1
2
3
则.
(2)若采用方案一,获得学习用品价值金额的期望为元.
若采用方案二,当成绩低于时,获得学习用品价值金额的期望为元;
当成绩不低于时,设获得学习用品价值金额为,则的取值范围为,
,,
所以获得学习用品价值金额的期望为元.
综上,若成绩低于,采用方案一获得学习用品价值金额的期望较大;若成绩不低于,采用方案二获得学习用品价值金额的期望较大
变式12-1.为解决当下人口老龄化以及生育率连年下降等问题,我国于2025年7月28日印发了《育儿补贴制度实施方案》,某地响应国家号召,制订了两套方案以减缓部分家庭由抚养造成的生活压力.两套方案的执行策略如表:
单个家庭生育婴儿数
1
2
3
补贴方案一
每月补助300元,共补贴3年
每月补助1100元,共补贴3年
每月补助2600元,共补贴3年
补贴方案二
每月补助1000元,共补贴3年
通过人口普查,可近似估计该地每个家庭生育婴儿的数量与概率:
单个家庭生育婴儿数
0
1
2
3
概率
由于单个家庭生育四个婴儿及以上的概率过低,可认为此事件为小概率事件,故只需考虑单个家庭生育婴儿总数在0~3的情况.
(1)若采用补贴方案一,随机选取某家庭,其补助不低于1100元/月,求其共生育2个婴儿的概率;
(2)试从期望的角度讨论这两种补贴方案哪套的补贴额更高.
【答案】(1)
(2)采用补贴方案二的补贴额更高
【分析】
【详解】(1)记事件A:单个家庭补助不低于1100元/月,
事件B:单个家庭共生育2个婴儿,
则,
,
;
(2)记根据补贴方案一每月所得的补贴额为,根据补贴方案二每月所得的补贴额为,
,
,
,故采用补贴方案二的补贴额更高.
变式12-2.某商场为了促进消费,推出购物优惠活动、消费者购物每满元可参加一次抽奖,抽奖活动如下:抽奖箱设置个红球和个白球,每次抽取个球.若抽中个白球,返现金元;若抽中个红球和个白球,返现金元;若抽中个红球,返现金元.
(1)顾客恰好消费了元,设他所获得返现金额为随机变量.求的分布列及数学期望;
(2)顾客消费了元:
①顾客获得返现金额为的概率是多少?
②若该商场同时还推出购物享九折优惠活动(减免总金额的),则顾客应选择哪种方案更优惠?(备注:不能同时参加抽奖和打折活动)
【答案】(1)分布列见解析,
(2)①;②打折更划算
【详解】(1)由题意知顾客抽奖一次,肯定会获得三种返现金额中的一种,
设某顾客参加一次抽奖获得返现金额,则的可能取值为,
则,
,
,
则的分布列如下表:
所以.
(2)①由题意知顾客刚好可以抽三次,
获得元返现金额的情况是三次抽奖的返现金额分别为元、元、元各一次,
则概率为.
②若打九折,需支付金额为:(元).
由(1)知每次抽中的返现金额的数学期望为元,
则抽取三次总的返现金额的数学期望为:(元).
因为,故打折更划算.
变式12-3.抓娃娃游戏一直以来吸引着小朋友和成年人,它不仅是一种娱乐活动,更是一种充满策略与技巧的挑战.已知某游戏厅有,,三台抓娃娃机,娃娃机每次中奖的概率为,娃娃机每次中奖的概率为,娃娃机每次中奖的概率为,中奖结果与否互不影响.
(1)若小张分别操作,,抓娃娃机各一次,求小张中奖的概率;
(2)已知小张准备抓娃娃三次,现有两种方案供选择:
方案一:操作,,抓娃娃机各一次;
方案二:操作抓娃娃机三次.
假设,,三台抓娃娃机中奖一次获得娃娃的价值为20元,请根据获得娃娃价值的期望,分析小张选择哪种方案较合适.
【答案】(1)
(2)选择哪种方案都一样.理由见解析.
【分析】
【详解】(1)记小张分别操作,,抓娃娃机能中奖为事件A,B,C,
则,,,,,.
因为每次的结果互不影响,所以小张分别操作,,抓娃娃机能中奖的概率为:.
(2)选择方案一:X可能的取值为0,20,40,60,
,
,
,
所以,
所以
若选择方案二,设他所获奖品的总件数为Z,则,
,,,
因为,所以选择方案一和方案二一样.
题型十三线性回归方程
例13.地球生命来自外星吗?一篇发布在《生物学快讯》上的文章《基因库的增长是生命起源和演化的时钟》可能给出了一种答案.该论文的作者根据生物功能性基因组里的碱基排列数的大小定义了基因库的复杂度y(单位:1),通过研究各个年代的古代生物化石里基因库的复杂度,提出了一个有趣的观点:生物基因库的复杂度近似是随时间呈指数增长的,只要知道生物基因库的复杂度就可以推测该生物体出现的年代.如图是该论文作者根据生物化石(原核生物,真核生物,蠕虫,鱼类,哺乳动物)中的基因复杂度的常用对数与时间(单位:十亿年)的散点图及回归拟合情况(其中回归方程为:,相关指数).根据题干与图中的信息,下列说法错误的是( )
A.根据信息生物基因库的复杂度近似是随时间呈指数增长的情况,不同于作者采取取常用对数的做法,我们也可采用函数模型来拟合
B.根据回归方程可以得到,每过10亿年,生物基因库的复杂度一定增加到原来的倍
C.虽然拟合相关指数为0.97,但是样本点只有5个,不能很好地阐释其统计规律,所以增加可靠的样本点可以更好地完善回归方程
D.根据物理界主流观点:地球的形成始于45亿年前,及拟合信息:地球在诞生之初时生物的复杂度大约为,可以推断地球生命可能并非诞生于地球
【答案】B
【详解】对于A,由,得,
令,满足,A正确;
对于B,观察散点图,所给5个点不全在回归直线上,回归拟合是近似的,
不能说每过10亿年,生物基因库的复杂度一定增加到原来的倍,B错误;
对于C,数据越多,拟合的准确性越高,因此增加可靠的样本点可以更好地完善回归方程,C正确;
对于D,当时,,根据回归方程可知,
当时,,即地球在诞生之初时生物的复杂度大约为,
可以推断地球生命可能并非诞生于地球,D正确.
故选:B
变式13-1.某种肉鸡出栏时平均重量可达3.5千克,在没有人工干预的情况下自然繁殖,其出栏时的平均重量会一代不如一代,最后跟普通肉鸡差别不大.某实验室为了得到这种肉鸡自然繁殖后前一代与后一代的平均重量间的关系,将此种肉鸡视为第1代且又繁殖了10代.最后得到前一代平均重量(千克)与后一代平均重量(千克)之间的线性回归方程.已知第2代至第10代的平均重量之和为20千克,则第11代的平均重量为( )
A.2.4千克 B.2.1千克 C.1.8千克 D.1.5千克
【答案】C
【详解】设第1代至第11代的平均重量分别为,易知;
又,
前一代平均重量,后一代平均重量,
将代入回归方程可得,
解得.
故选:C
变式13-2.对于数据组,如果由线性回归方程得到的对应于自变量的估计值是,那么将称为相应于点的残差.某工厂为研究某种产品产量(吨)与所需某种原材料吨)的相关性,在生产过程中收集4组对应数据如下表所示:
3
4
5
6
2.5
3
4
根据表中数据,得出关于的线性回归方程为,据此计算出样本点(4,3)处的残差为-0.15,则表中的值为( )
A.3.3 B.4.5 C.5 D.5.5
【答案】B
【分析】
【详解】由题意可知,在样本(4,3)处的残差-0.15,则,即,
解得,即,
又,且线性方程过样本中心点(,),
则,则,
解得.
故答案为:B
【点睛】理解残差的定义,实际值减去估计值;线性方程过样本中心(,);要求对基本知识点比较熟练,计算才准确.
变式13-3.某医科大学实习小组为研究实习地昼夜温差与感冒人数之间的关系,分别到当地气象部门和某医院抄录了1月至3月每月5日、20日的昼夜温差情况与因感冒而就诊的人数,得到如表资料:
日期
1月5日
1月20日
2月5日
2月20日
3月5日
3月20日
昼夜温差x(℃)
10
11
13
12
8
6
就诊人数y(个)
22
25
29
26
16
12
该小组确定的研究方案是:先从这6组数据中随机选取4组数据求线性回归方程,再用剩余的2组数据进行检验.
参考公式:,.
(1)求剩余的2组数据都是20日的概率;
(2)若选取的是1月20日、2月5日、2月20日、3月5日这4组数据.
①请根据这4组数据,求出y关于x的线性回归方程;
②若某日的昼夜温差为7℃,请预测当日就诊人数.(结果保留整数).
【答案】(1)
(2)① ;②14人
【分析】
【详解】(1)记6组依次为1,2,3,4,5,6,从这6组中随机选取4组数据,剩余的2组数据所有等可能的情况为,,,,,,,,,,,,,,共15种,
其中2组数据都是20日,即都取自2,4,6组的情况有3种.
根据古典概型概率计算公式,剩余的2组数据都是20日的概率.
(2)①由所选数据,得,,
所以,
所以,
所以y关于x的线性回归方程为.
②当时,,
所以某日的昼夜温差为7℃,预测当日就诊人数约为14人.
题型十四相关系数、相关指数的求算及意义
例14.粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示.
年份代码
1
2
3
4
5
产量/千万吨
13.4
13.6
13.8
13.7
14.0
现规定表示年份代码,表示年份代码为的产量,经计算得,,
(1)求样本的相关系数;(精确到0.01)
(2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望.
附:相关系数,.
【答案】(1)
(2)分布列见解析,
【分析】
【详解】(1),,
故样本相关系数
.
(2)X的取值可以为0,1,2,
则,
,
,
于是X的分布列为
X
0
1
2
P
故.
变式14-1.若变量和的4对观测数据为,两个变量满足一元线性回归模型(随机误差),请写出参数的最小二乘估计值为
【答案】5.1
【详解】依题意,两个变量满足一元线性回归模型,随机误差,
则随机误差平方和
,
易知,随机误差平方和是一个一元二次函数,
当时,随机误差平方和取得最小值,
因此参数的最小二乘估计值为5.1.
故答案为:5.1.
变式14-2.当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响生活的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额(单位:百万元)与其年销售量(单位:千件)的数据统计表.
(百万)
1
2
3
4
5
(千件)
0.5
1
1.5
3
5.5
(1)根据统计表的数据及参考公式计算样本相关系数,推断两个变量的相关程度;
(2)根据(1)问的结果判断是否可以用一元线性回归模型来刻画年销售量和投入额之间的关系?如果可以,根据最小二乘法,建立销售量关于投入额的经验回归方程;如果不可以,请说明理由.
(3)该公司科研团队发现样本数据呈现出明显的非线性相关的特征,得到年销售量关于年投入额的非线性经验回归方程为,并计算出的残差平方和,请根据统计表的数据及参考公式,比较线性经验回归方程和非线性经验回归方程的拟合效果哪种更好?并选择拟合精度更高的方程,预测年投入额为6百万元时,产品的销售量约为多少?(计算结果保留到小数点后两位).
参考公式及数据:,,,,,,.
【答案】(1),正线性相关,且相关程度很强.
(2)可以,
(3)非线性经验回归方程的拟合效果更好,9.68千件
【分析】
【详解】(1)由表得,,,
又因为,
所以,
由于的值接近1,所以可以推断年销售量和年投入额这两个变量正线性相关,且相关程度很强.
(2)由(1)得两个变量的线性相关程度很强,
所以可以用一元线性回归模型来刻画年销售量和投入额之间的关系,
设年销售量关于年投入额的经验回归方程为,
所以,,
所以年销售量关于年投入额的经验回归方程为.
(3)由(2)得,可得如下数据:
1
2
3
4
5
0.5
1
1.5
3
5.5
1.1
2.3
3.5
4.7
所以的残差平方和为,
由于,故非线性经验回归方程拟合效果更好,
当时,(千件),
故当年投入额为6百万元时,产品的销售量约为9.68千件.
变式14-3.某汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入(亿元)与科技改造直接收益(亿元)的数据统计如下:
2
3
4
6
8
10
13
21
22
23
24
25
13
22
31
42
50
56
58
68.5
68
67.5
66
68
当时,建立了y与x的两个回归模型:模型①;模型②:;
(1)根据下列表格中的数据,比较当时模型①、②的相关指数,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为16亿元时的直接收益.
回归模型
模型①
模型②
回归方程
182.4
79.2
(附1:刻画回归效果的相关指数)
(2)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布,公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予鼓励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励4万元.求每台发动机获得奖励的分布列和数学期望.
(附2:随机变量服从正态分布,则,.)
【答案】(1)模型①的小于模型②,模型②
(2)分布列见解析,
【分析】
【详解】(1)由表格中的数据,有182.4>79.2,
因为,
所以模型①的小于模型②,说明回归模型②刻画的拟合效果更好,
所以当亿元时,科技改造直接收益的预测值为:(亿元);
(2)因为,
所以,
因为,
所以,
所以,
设每台发动机获得的奖励为Y(万元),则Y的分布列为:
0
2
4
0.02275
0.8186
0.15865
所以每台发动机获得奖励的数学期望
(万元).
题型十五非线性回归的处理技巧
例15.某经济研究所为了解居民存款余额变化情况,对2009年至2024年居民存款余额进行统计分析,将2009年看成第1年,依次类推,得到第1~16年的居民存款余额(单位:万亿元)的散点图,如图所示:
(1)已知从2021年开始,居民存款余额超过100万亿元,若从2009年至2024年中任取2年,求这2年中恰有一年居民存款余额超过100万亿元的概率;
(2)由散点图知,和的关系可用经验回归模型进行拟合,求关于的经验回归方程.
参考数据:设,则.
参考公式:对于一组数据,其经验回归直线的斜率和截距的最小二乘估计分别为.
【答案】(1)
(2).
【分析】
【详解】(1)由题意,16年中有4年居民存款余额超过100万亿元,
故所求概率为.
(2),
由题知,,
,
,
,故.
变式15-1.某学校数学兴趣小组在探究姜撞奶随着时间变化的降温及凝固情况的数学建模活动中,将时间分钟与温度(摄氏度)的关系用模型(其中为自然对数的底数)拟合.设,变换后得到一组数据:
2
2.5
3
3.5
4
4.04
4.01
3.98
3.96
3.91
由上表可得线性回归方程,则等于( )
A.-4 B. C.4.16 D.
【答案】D
【详解】由表格中数据,得,
则,解得,因此,
由两边取对数,得,又,
所以,即.
故选:D
变式15-2.红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
24
2.9
646
168
422688
50.4
70308
表中,,,;
(1)根据残差图,比较模型①、②的拟合效果,模型 比较合适?
(2)根据(1)中所选择的模型,求出y关于x的回归方程是 .附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
【答案】 ①
【分析】
【详解】(1)模型①更合适,理由如下:模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适;
(2)令,则,
由所给的参考数据可得,,
所以,
所以关于的线性回归方程为,即,
所以产卵数关于温度的回归方程为,
故答案为:①;.
变式15-3.红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度的8组观测数据,制成图l所示的散点图,现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:表中;;;
25
2.9
646
168
422688
50.4
70308
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)求出关于的回归方程.附:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计分别为,,
【答案】(1)模型①;
(2)
【分析】
【详解】(1)模型①更合适.
模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,
所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适.
(2)令与温度x可以用线性回归方程来拟合,则.
于是, ,
因此关于的线性回归方程为,即,
所以产卵数y关于温度x的回归方程为.
题型十六独立性检验(列联表)
例16.某马拉松赛事组委会为研究选手赛前是否进行热身训练与比赛中是否受伤的关联性,随机抽取了200名参赛选手的相关数据,整理得到如下2×2列联表.
单位:人
比赛中受伤
比赛中未受伤
合计
赛前进行热身训练
10
90
100
赛前未进行热身训练
30
70
100
合计
40
160
200
(1)从这200名参赛选手中随机抽取1人,已知此人赛前进行了热身训练,求此人在比赛中受伤的概率;
(2)能否有99.9%的把握认为选手赛前是否进行热身训练与比赛中是否受伤有关?
参考公式:,其中.
参考数据:
()
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)有99.9%的把握
【分析】
【详解】(1)记事件A表示此人赛前进行了热身训练,事件B表示此人在比赛中受伤,
则,,
故.
(2)由题意可得.
因为,所以有99.9%的把握认为选手赛前是否进行热身训练与比赛中是否受伤有关.
变式16-1.某儿童医院用甲、乙两种疗法治疗小儿消化不良.为分析两种疗法效果是否有差异,采取有放回的简单随机抽样的方法对治疗情况进行检查,得到如下数据:
疗法
疗效
未治愈
治愈
甲
15
52
乙
6
63
附常用小概率值及其相应的临界值表为:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算得.则下列说法正确的是:( )
A.以频率估计概率,有
B.以频率估计概率,有
C.若取,可以认为疗效与疗法独立
D.若取,可以认为疗效与疗法独立
【答案】ABD
【详解】由题得下表:
疗法
疗效
总数
未治愈
治愈
甲
15
52
67
乙
6
63
69
总数
21
115
136
以频率估计概率,有,故A正确;
以频率估计概率,有,故B正确;
零假设:认为疗效与疗法独立,由题且,
所以若取小概率值,则零假设不成立,即不可以认为疗效与疗法独立;
若取小概率值,则没有充分的证据推翻零假设,故可以认为疗效与疗法独立,
故C错误,D正确.
故选:ABD
变式16-2.(多选)炎炎夏日,许多城市发出高温预警,凉爽的某市成为众多游客旅游的热门选择.为了解来某市旅游的游客旅行方式与年龄是否有关,随机调查了100名游客,得到如下表格.零假设H0旅行方式与年龄没有关联,则下列说法中,正确的有( )
小于40岁
不小于40岁
自由行
38
19
跟团游
20
23
附:χ2=,其中.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
A.在选择自由行的游客中随机抽取一名,其小于40岁的概率为
B.在选择自由行的游客中按年龄分层随机抽样抽取6人,再从中随机选取2人做进一步的访谈,则2人中至少有1人不小于40岁的概率为
C.根据的独立性检验,推断旅行方式与年龄没有关联,且犯错误概率不超过0.01
D.根据的独立性检验,推断旅行方式与年龄有关联,且犯错误概率不超过0.05
【答案】BD
【详解】对于A,选择自由行的游客人数为,其小于40岁的概率是,故A错误;
对于B,选择自由行中小于40岁和不小于40岁的人数比为2:1,
则按年龄分层抽样抽取的6人中,有4人小于40岁,有2人不小于40岁,
设事件为“2人均小于40岁”,则2人中至少有1人不小于40岁的概率为,故B正确;
对于C,因为,
所以可推断旅行方式与年龄没有关联,但对零假设犯错误的概率是不可知的,故C错误;
对于D,因为,所以推断旅行方式与年龄有关联,且犯错误概率不超过0.05,故D正确.
故选:BD.
变式16-3.某工厂推出一款新产品,为了调查顾客对该新产品的满意程度,厂家分别对甲地的300名使用者和乙地的200名使用者进行问卷调查,统计并得到如下列联表:
甲地使用者
乙地使用者
合计
不满意
100
50
150
满意
200
150
350
合计
300
200
500
(1)根据小概率值的独立性检验,分析使用者的满意度是否与区域有关;
(2)从使用该产品不满意的顾客中,采用分层抽样的方法随机抽取9名使用者,再从这9名使用者中随机抽取4人进一步调研,记4人中乙地人数为,求的分布列和数学期望.
附录:.
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
【答案】(1)认为使用者的满意度与区域无关
(2)分布列见解析,
【分析】
【详解】(1)零假设为:使用者的满意度与区域无关,代入列联表中的数据可得:
根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,
故可认为使用者的满意度与区域无关.
(2)从使用该产品不满意的顾客中,采用分层抽样的方法,得到甲地使用者与乙地使用者的抽样比为,
则9名使用者中甲地6人、乙地3人.
因为4人中乙地人数为,所以的可能取值为,其对应的概率分别为:
,
,
的分布列为:
0
1
2
3
故数学期望为
基础巩固通关测
一、单选题
1.(2025·26高一上·湖南邵阳·期末)已知甲、乙两名运动员进行射击比赛,各射击一次,是否中靶相互独立.若恰好一人中靶的概率为0.26,至少一人中靶的概率为0.98,则甲、乙两人都中靶的概率是( )
A. B. C. D.
【答案】C
【详解】设甲射击一次中靶的概率为,乙射击一次中靶的概率为,
因为甲、乙是否中靶相互独立,且恰好一人中靶的概率为,
所以,
展开得.①
又至少有一人中靶的概率为,即,所以,
展开得.②
由①+②得,解得,即甲、乙两人都中靶的概率是.
故选:C
2.为了研究物理成绩与数学成绩之间的关系,随机抽取100名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A.2.5 B.3.5 C.3.5 D.2.5
【答案】D
【详解】将代入得,
则样本点的残差为.
故选:D
3.(2026·河南南阳·模拟预测)已知,且,则( )
A.0.2 B.0.3 C.0.35 D.0.45
【答案】C
【详解】由正态分布的对称性可知,,,已知,
所以,因为,
且,所以,又因为,
所以,代入,
可得,故,所以.
故选:C.
4.(2025·26高二上·河南南阳·期末)某食品厂生产的袋装饼干的重量(单位:克)服从正态分布,质检部门规定重量在94克到109克之间的产品为合格产品,则从该食品厂生产的袋装饼干中随机抽取1袋饼干,抽到的饼干是合格品的概率约为( )(参考数据:若随机变量,则)
A.0.8185 B.0.9544 C.0.9759 D.0.9974
【答案】C
【详解】因为,所以,.
由题意可知,“”表示事件“饼干是合格品”,
所以
故选:C.
5.(2025·26高二上·福建宁德·期中)甲、乙、丙三位同学进行知识竞赛,每局比赛两人对战,第三人旁观.每局比赛的胜者与旁观者进行下一局比赛,先赢两局者获胜.规定不管是否决出胜者,至多三局结束比赛.根据以往经验,每局比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,每局比赛相互独立且没有平局.经抽签,甲、乙首先对战,丙旁观,设甲、乙、丙在三局内成为胜者的概率分别为,则下列关系正确的是( )
A. B.
C. D.
【答案】C
【详解】甲获胜的概率:甲获胜需局1胜乙且局2胜丙,概率为.
乙获胜的概率:乙获胜需局1胜甲且局2胜丙,概率为.
丙获胜的概率:
丙获胜包含两种情况:
①.局1甲胜乙,局2丙胜甲,局3丙胜乙,
概率为;
②.局1乙胜甲,局2丙胜乙,局3丙胜甲,
概率为;
故.
比较得,即.
故选:C
6.(2025·26高三上·湖北·月考)已知随机变量,设函数,则的图象大致为( )
A. B.
C. D.
【答案】B
【详解】随机变量,,
因为,
因为,所以根据对称性可知,
所以函数的图象关于对称,故排除AC;
当时,,所以排除D.
故选:B
7.(2024·25高二下·北京朝阳·期末)现有三枚质地均匀的骰子,分别为红色、绿色和蓝色.同时抛掷这三枚骰子,已知这三枚骰子朝上面的点数之和为15,设红色骰子掷出的点数为,绿色骰子掷出的点数为,下列结论中正确的是( )
A.
B.
C.
D.
【答案】C
【详解】设蓝色骰子掷出的点数为,同时抛掷这三枚骰子,在的条件下,出现的
结果有:,共10个,
对于A,等价于,只有1个结果,,
,,A错误;
对于B,的结果有,,
的结果有,,B错误;
对于C,的可能取值为,,
因此,C正确;
对于D,,同理,
,D错误.
故选:C
二、多选题
8.(2025·26高二上·广东中山·月考)甲、乙两名射击运动员进行射击比赛,甲的中靶概率为0.8,乙的中靶概率为0.9,甲是否击中对乙没有影响,设“甲中靶”,“乙中靶”,则( )
A.与与,与,与都相互独立
B.与是对立事件
C.
D.
【答案】ACD
【详解】因为两人射击结果没有相互影响,所以与与,与,与都相互独立,故A正确;
因为表示事件“甲中靶且乙未中靶”,表示事件“乙中靶且甲中靶”,所以这两个事件的并集并非全集,
因此二者不是对立事件,故B错误;
因为与相互独立,所以,故C正确;
,故D正确;
故选:ACD.
9.(2025·26高二上·江西鹰潭·期末)下列说法中,正确的是( )
A.6件产品中有4件正品,2件次品,从中任取2件,则至少取到1件次品的概率为0.6
B.由两个分类变量X,Y的成对样本数据计算得到,依据的独立性检验(),可判断X,Y独立
C.已知A,B为随机事件,,若A,B相互独立,则
D.样本点的经验回归方程为,若样本点与的残差相等,则
【答案】ACD
【详解】对于A,从6件产品中任取2件,即,
“至少取到1件次品”的对立事件是“取到2件正品”为,
因此,至少取到件次品件正品,A正确.
对于B,由可得出“零假设与独立”不成立,
所以有的把握说X,Y有关,故B错误;
对于C,若A,B相互独立,则,
所以,故C正确;
对于D,由题意可得样本点与的残差分别为和,
所以,则,故D正确.
故选:ACD.
10.(2026高三·全国·专题练习)(多选)已知投资两种项目获得的收益分别为,,分布列如下表,则下列说法正确的是( )
百万
0
2
0.2
0.6
百万
0
1
2
0.3
0.4
A.
B.
C.投资两种项目的收益期望一样多
D.投资项目的风险比项目高
【答案】ACD
【详解】依题意可得,所以,
,所以,所以,故A正确;
,
则,故B错误;
,所以,故C正确;
因为,
,
即,所以投资项目的风险比项目高,故D正确.
故选:ACD.
三、填空题
11.(2026·四川·模拟预测)已知正四棱锥的底面边长和高都为2.现从该棱锥的5个顶点中随机选取3个点构成三角形,设随机变量表示所得三角形的面积,则其数学期望 .
【答案】.
【详解】由题意,的可能取值为.
从5个顶点中随机选取3个点构成三角形,共有种取法.
其中的三角形如,这类三角形共有个,因此.
其中的三角形如,这类三角形共有个,因此.
其中的三角形有两个,和.因此.
所以随机变量的概率分布列为:
2
所求数学期望.
故答案为:.
12.(2025高三·全国·专题练习)甲、乙、丙三个人依次参加摸奖活动,在一个不透明的摸奖箱中有六个同样大小、同样光滑的小球,每个小球标有一个编号,编号分别为1,2,3,4,5,6.活动规则:每个人从这个摸奖箱中连续摸三次,每次摸一个球,每次摸完后,记下小球上的编号再将其放回箱中,充分搅拌后再进行下一次的摸取.三次摸完后将三个编号相加,若三个编号的和为4的倍数,则能得到一个纪念品.记获得纪念品的人数为,则的数学期望为 .
【答案】
【详解】三个编号之和的取值是区间中的整数,其中4的倍数可能为4,8,12,16.
4的组合为(112);
8的组合为(116),(125),(134),(224),(332);
12的组合为(156),(246),(336),(345),(552),(444);
16的组合为(664),(556).
()结构的情况可出现种,()结构的情况可出现种,()结构的只有一种情况,则共有55种.
每个人获得纪念品的概率为,而,则.
故答案为:
13.(2020高三·全国·专题练习)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若有的把握认为是否喜欢韩剧和性别有关,求男生至少有 人.
【答案】
【解析】设男生人数为,依题意填写列联表,计算观测值,列出不等式求出的取值范围,再根据题意求出男生的人数.
【详解】设男生人数为,由题意可得列联表如下:
喜欢韩剧
不喜欢韩剧
总计
男生
女生
总计
若有的把握认为是否喜欢韩剧和性别有关,
则,
即,
解得.
因为各部分人数均为整数,所以若有的把握认为是否喜欢韩剧和性别有关,则男生至少有人.
故答案为:.
【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题.
四、解答题
14.(2024·25高二下·湖北武汉·期末)为了研究高二学生数学和物理成绩的相关情况,学校在高二学生中采用随机抽样的方法抽取了150名学生,调查他们平时的数学与物理成绩情况,统计数据如下.
数学成绩优秀
数学成绩不优秀
合计
物理成绩优秀
55
20
75
物理成绩不优秀
30
45
75
合计
85
65
150
(1)依据列联表判断,能否有99.9%的把握认为数学成绩优秀与物理成绩优秀有关?
(2)从调查的物理成绩不优秀的学生中,按照数学成绩是否优秀采用分层随机抽样的方法抽取15人.若从这15人中随机抽取2人,记X为数学成绩优秀的人数,求X的分布列及数学期望.参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)能;
(2)分布列见解析,数学期望为.
【分析】
【详解】(1)由题意可知,
由查表可得,由于,
所以能有的把握认为数学成绩优秀与物理成绩优秀有关.
(2)由于物理成绩不优秀的学生中,数学成绩优秀与数学成绩不优秀的人数比为,
所以采用分层抽样的方法抽取的15人中,数学成绩优秀的有6人,数学成绩不优秀的有9人,
可知可取0,1,2,
,
所以的分布列为
X
0
1
2
P
从而.
15.(2024·25高二下·河北保定·月考)某农科研究所想要研究某种农产品的亩产量(单位:吨)与施肥量(单位:千克)之间的关系,通过调研得到一些数据如下表:
施肥量
5
7
9
11
13
15
亩产量
6
8
11
12
已知且,且,的相关系数,说明,满足线性回归.
参考数据:,,参考公式:,,.
(1)求的值;
(2)求关于的回归直线方程;
(3)若施肥量为9,11时的残差分别为,,求的值.
【答案】(1);
(2);
(3).
【分析】
【详解】(1),可得,
所以,则,即;
(2)由,且,
所以,可得,结合,,,所以,
则,
,
所以,则,
所以回归直线为;
(3)当,,则,
当,,则,
所以.
16.(2025·26高三上·江苏·月考)如图,一个质点在随机外力的作用下,从原点出发,每次等可能地向左或向右移动一个单位.
(1)移动4次后,质点最终所在的位置的坐标为多少的概率最大?
(2)若移动次后,质点最终所在位置的坐标为,求的数学期望与方差.
【答案】(1)
(2)数学期望为,方差为
【分析】
【详解】(1)设随机变量为次移动后的坐标值,可取值为:,,,,
,
,
·
所以质点最终所在的位置的坐标为的概率最大
(2)设随机变量为次移动后的坐标值,质点次移动中向右移动的次数为,则 ,
,
则的期望为: ,
则的方差为; ,
所以移动 次后,质点最终所在位置的坐标的数学期望为,方差为.
17.(2021·广东·模拟预测)2020年国庆节期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握国庆节期间车辆出行的高峰情况,在某高速公路收费站点记录了3日上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费站点,它们通过该收费站点的时刻的频率分布直方图如下图所示,其中时间段9:20~9:40记作、9:40~10:00记作,10:00~10:20记作,10:20~10:40记作,例如:10点04分,记作时刻64.
(1)估计这600辆车在9:20~10:40时间内通过该收费站点的时刻的平均值(同一组中的数据用该组区间的中点值代表);
(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车随机抽取4辆,设抽到的4辆车中,在9:20~10:00之间通过的车辆数为X,求X的分布列;
(3)根据大数据分析,车辆在每天通过该收费站点的时刻T服从正态分布,其中可用3日数据中的600辆车在9:20~10:40之间通过该收费站点的时刻的平均值近似代替,用样本的方差近似代替(同一组中的数据用该组区间的中点值代表).假如4日全天共有1000辆车通过该收费站点,估计在9:46~10:40之间通过的车辆数(结果保留到整数).
附:若随机变量T服从正态分布,则,,.
【答案】(1)10∶04
(2)分布列见解析
(3)819
【分析】
【详解】(1)解:这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值为:
,即10∶04;
(2)由频率分布直方图和分层抽样的方法可知,抽取的10辆车中,在10:00前通过的车辆数就是位于时间分组中在20,60这一区间内的车辆数,
即,
所以X的可能的取值为0,1,2,3,4.
所以,,,
,.
所以X的分布列为:
X
0
1
2
3
4
P
(3)由(1)得,
所以,
估计在9:46~10:40之间通过的车辆数也就是在46,100通过的车辆数,
由,得
,
所以估计在之间通过的车辆数为.
能力提升进阶练
1.(2025·26高三上·河南·期末)为比较甲、乙两所学校学生的数学水平,采用了如下方法:
第1步,科学抽样.采用简单随机抽样方法从两所学校共抽取88名学生,且对这88名学生进行测验;
第2步,收集数据.测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生有7名学生数学成绩优秀,并做出了如下的列联表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
第3步,提出零假设.零假设:两校学生的数学成绩优秀率无差异,
第4步,计算.计算得到,
第5步:判断.根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为两校的数学成绩优秀率没有差异.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
若将列联表中所有数据都扩大到原来的10倍,则下列说法正确的是( )
A.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
B.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
C.有99%的把握认为学生的数学成绩是否优秀与学校有关
D.学生的数学成绩是否优秀与学校有关,该推断犯错误的概率不超过0.001
【答案】C
【详解】由题,列出新的列联表如下:
学校
数学成绩
合计
不优秀
优秀
甲校
330
100
430
乙校
380
70
450
合计
710
170
880
代入卡方公式:
,其中,
所以,
,
所以认为 “学生的数学成绩是否优秀与学校有关”,且有的把握,
故AB错误.
且推断犯错误的概率不超过0.01,不是0.001,故错误.
故选:C.
2.(2025·26高三上·河北承德·期末)甲、乙两名同学进行乒乓球比赛,采用5局3胜制(先胜3局者获胜,比赛结束),已知每局比赛甲获胜的概率为,且各局比赛的结果相互独立,则在已知甲最终获胜的条件下,甲第一局获胜的概率是 .
【答案】
【详解】由题意可得,在已知甲最终获胜的条件下甲第一局获胜的情况有
①甲以3:0获胜,概率为;
②甲以3:1获胜,概率为;
③甲以3:2获胜,概率为.
所以甲最终获胜的条件下甲第一局获胜的概率为.
甲获胜的总概率为.
所以条件概率为.
故答案为:.
3.(2025·26高三上·安徽蚌埠·期末)在一次独立性检验中得到如下列联表:
总计
200
800
1000
180
m
总计
380
已知,,根据上面的列联表,若依据小概率值的独立性检验,可以认为这两个分类变量A和B没有关系,则下列选项中m可能取到的为( )
A.200 B.720 C.100 D.800
【答案】BD
【详解】由题意得,
对于A,当时,,
对于B,当时,,
对于C,当时,,
对于D,当时,,
故只有B,D符合题意,可以认为这两个分类变量A和B没有关系,
故选:BD
4.已知盒子中共有个大小相同的球,有红、黄、黑三种颜色,其中黄球有个,随机不放回依次取出一个球,直到将球全部取出.
(1)求第二次取出的球是黄球的概率.
(2)若,且红球和黑球的个数比为,求黄球最先被全部取出(取出最后一个黄球时盒子里还有红球和黑球)的概率.
(3)记随机变量为最后一个黄球取出时总共所取出球的个数,是的数学期望,证明:.
【答案】(1)
(2)
(3)证明见解析
【分析】
【详解】(1)记“第二次取出的球是黄球”为事件,
将个黄球的安排情况作为样本空间,则样本点总数为,
事件表示第二次取出的球是黄球,其他个黄球在剩余个位置中随机安排,则事件包含的样本点数为,
故.
(2)设红球个,由题意得,解得.
所以红球5个,黑球有10个.
记“最后一次取出球是红球”为事件,“最后一次取出球是黑球”为事件,
显然事件互斥,记“黄球最先被全部取出”为事件,则.
当事件发生时,只需考虑取出所有黄球和黑球时最后取出的是黑球,
则.
当事件发生时,只需考虑取出所有黄球和红球时最后取出的是红球,
则.
所以.
(3)由题知随机变量的取值为,
则随机变量的分布列为
所以随机变量的期望
.
所以.
5.(2025·26高一上·山东日照·期末)近年来足球赛事中,单败淘汰赛制(输一局就淘汰)与新兴的双败赛制并存,为比赛增添了许多看点.现有四支队伍A、B、C、D参与赛事,其中是强队,对阵B、C、D的获胜概率均为,,而B、C、D彼此之间对阵时获胜概率均为.经抽签,第一轮比赛时,和对阵,和对阵.
双败赛制规则如下图所示:
(1)若赛前要从4支队伍中随机选出2支队伍打一场热身赛,求选出的两支队伍恰好是和的概率;
(2)若,在单败淘汰赛赛制下,获得冠军的概率是多少?
(3)分别计算两种赛制下获得冠军的概率(用表示),并据此证明双败赛制对强队更有利.
【答案】(1)
(2)
(3)答案见解析
【详解】(1)从4支队伍中随机选出2支,总共有6种可能:AB、AC、AD、BC、BD、CD,
其中选出的两支队伍恰好是A和B只有1种情况,
因此,选出的两支队伍恰好是A和B的概率为.
(2)设事件“A对阵B或C或D时,A赢”,,;
设事件“B对阵C或D时,B赢”,设事件“C对阵B或D时,C赢”,
设事件“D对阵B或C时,D赢”,
则,事件M,B,C,D之间相互独立.
设事件“单败淘汰赛制下,B获得冠军”,则事件N包含两种情况:
①A、C对阵时A赢,B、D对阵时B赢,最后A、B对阵时B赢,即事件:,
.
②A、C对阵时C赢,B、D对阵时B赢,最后C、B对阵时B赢,即事件:,
.
因为事件与事件互斥,且事件,
因此,,
所以在单败淘汰赛赛制下,获得冠军的概率是.
(3)在单败淘汰赛赛制下,A要想获得冠军,有两种情况:
①A、C对阵时A赢,B、D对阵时B赢,A再与B对阵时A赢,即事件,
,
②A、C对阵时A赢,B、D对阵时D赢,A再与D对阵时A赢;即事件,
,
因为事件与事件互斥,所以A获得冠军的概率为:
,
在双败赛赛制下,A要想获得冠军,从每场A参与的比赛中A的输赢角度出发,有三种情况:
①A、C对阵时A赢,A与B、D对阵中的胜者比赛时A赢,最后一场决赛A赢,即事件,
②A、C对阵时A赢,A与B、D对阵中的胜者比赛时A输,B、D对阵中负者与C对阵时胜者与A对阵时A赢,
最后一场决赛A赢,即事件,
,
③A、C对阵时A输,A与B、D对阵中的负者比赛时A赢,B、D对阵中的胜者与C对阵时负者与A对阵时A赢,
最后一场决赛A赢,即事件,
,
所以获得冠军概率为:
,
因为,
当时,有.
因此,双败赛制对强队更有利.
1/3
学科网(北京)股份有限公司
$
第四章 概率与统计(复习讲义)
基础目标
能复述条件概率、全概率公式的定义及离散型随机变量相关概念,熟记两种条件概率计算方法、分布列求解步骤与性质;
会判定两点分布、二项分布、超几何分布,复述正态曲线性质、样本相关系数特征及独立性检验步骤;
能直接套用公式求解简单条件概率、分布列及均值方差,完成基础的相关关系判断与正态分布概率计算。
进阶目标
会推导条件概率性质、全概率公式的应用逻辑,能根据实际情境选择合适方法计算条件概率、运用全概率公式求解复杂事件概率;
熟练推导离散型随机变量均值方差公式,能规范求解特殊分布的分布列及数字特征,会利用正态曲线对称性计算复杂概率;
能推导线性回归方程系数公式,完成列联表整理与值计算,实现概率与统计基础知识点的综合应用。
拓展目标
理解并应用概率与统计知识解决实际综合问题,能结合情境分析全概率公式的多原因事件,灵活运用分布列性质求解参数并进行概率范围分析;
能区分二项分布与超几何分布的适用场景并综合应用,利用正态分布3σ原则解决实际决策问题;
能完成非线性回归的变量替换与方程求解,结合残差分析回归模型拟合效果,通过独立性检验结果给出实际问题的合理推断与决策建议。
一、概率计算
(一)条件概率
1.定义法:适用于所有一般情形,先分别计算出事件发生的概率和事件、同时发生的概率,再代入公式计算条件概率。
2.缩小样本空间法:适用于古典概型场景,第一步将原样本空间缩小为事件对应的样本空间,事件相应缩小为;第二步数出和包含的基本事件数;第三步用古典概型公式计算结果。
1.核心性质:设,则
①条件概率的取值范围为;
②若、为互斥事件,满足;
③若与互为对立事件,则。
(二)全概率公式及其应用
1.核心原理:若某一事件的发生由多个互斥的事件引发,则
2.应用场景:当一个事件的发生存在多个不同的前提条件,且各条件互斥时,需分情况计算每个条件下该事件发生的概率,再求和得到总概率。
(三)重伯努利试验与概率计算
解题步骤:
①先根据重伯努利试验的特征,判断所给试验是否符合独立重复、每次仅有两个对立结果的要求;
②分析所求复杂事件,判断是否需要拆分为多个简单互斥/独立事件;
③对每个简单事件,用伯努利试验概率公式求解,最后结合互斥事件加法公式或独立事件乘法公式计算最终概率。
二、离散型随机变量
(一)基础核心解题步骤
1.分布列的求解:
第一步:理解离散型随机变量的实际意义,明确其所有可能取到的数值;
第二步:根据题意,分别求出取每个值时对应的概率;
第三步:以表格形式规范写出的分布列:
2.分布列性质的应用:
①利用“分布列中所有事件的概率之和为1”这一性质,求解分布列中的未知参数,或检验所写分布列的正确性;
②因随机变量取不同值对应的事件两两互斥,可利用互斥事件概率加法公式,求随机变量在某一范围内取值的概率。
3.均值与方差的求解:
第一步:理解随机变量的实际意义,写出其全部取值;
第二步:计算取每个值的对应概率;
第三步:可根据需求写出分布列(简单题型可省略);
第四步:分别代入均值、方差的核心公式计算结果:
(二)三类特殊分布的判定与性质
1.两点分布
判定方法(两步法):①看取值:随机变量仅能取和两个值;②验概率:检验是否成立,两者均满足则为两点分布。
数字特征:若服从两点分布,为成功概率,则,。
2.二项分布
判定关键:①对立性:一次试验中事件发生与否仅有两种结果;②重复性:试验在相同条件下独立重复进行次。
核心要点:若,则,。
3.超几何分布
(1)判定条件:
①总体可明确分为两类不同的对象(如“次品/正品”“男生/女生”);②抽样方式为不放回抽样;
③随机变量表示的是抽取样本中某一类对象的个数。
(2)分布列求解:
①验证是否符合超几何分布特征,确定(总体容量)、(总体中某类个数)、(样本容量)的数值;
②代入超几何分布概率计算公式
③以表格形式列出分布列。
(三)数字特征的实际意义
随机变量的均值反映其取值的平均水平,方差反映其取值围绕均值的波动程度与稳定程度;二者是生产实际中方案取舍的重要理论依据,一般先比较不同方案的均值,若均值相同,再通过比较方差大小确定最优方案(方差越小越稳定)。
三、正态分布
(一)正态密度函数与正态曲线的核心性质
正态密度函数为:
正态曲线为单峰曲线,且关于直线(均值)对称,可结合这一性质与函数图象,求解相关参数或概率区间。
正态曲线在处达到峰值,利用该性质结合图象,可求解、等关键参数。
正态曲线与轴之间的总面积恒为1,是概率计算的重要前提。
(二)正态分布的概率计算
熟记标准正态分布在以下三个特殊区间内的取值概率:
充分利用正态曲线的对称性,将不规则的概率区间转化为特殊区间,结合面积和为1的性质求解复杂概率(例如:;)。
(三)正态分布的实际应用
解答正态分布实际应用题的核心是转化,将实际问题中的数量关系转化为正态分布的概率问题;解题中需熟练掌握三个特殊区间的概率值,同时结合数形结合思想和归纳思想,分析问题并求解。
四、统计分析
(一)变量的相关关系判断
1.散点图法:根据成对样本数据绘制散点图,若点的分布从左下角到右上角,两变量为正相关;若点的分布从左上角到右下角,两变量为负相关。
2.样本相关系数法:样本相关系数记为,
时两变量正相关,时两变量负相关;
的取值范围为,越接近1,线性相关程度越强,越接近0,线性相关程度越弱;
时两变量无线性相关关系。
计算公式为:
(二)回归分析
1.线性回归
核心结论:回归直线方程必过样本点的中心,可利用该结论求解回归方程中的未知参数。
解题步骤:
①绘制散点图,判断两变量是否存在线性相关关系;
②利用公式求解回归方程的系数:,得到经验回归方程;
③通过残差图或决定系数分析模型的拟合效果;
④借助拟合好的回归方程,对实际问题进行分析和预测。
2.非线性回归
解题步骤:
①根据原始样本数据作出散点图,观察点的分布特征;
②根据散点图的形状,选择恰当的非线性拟合函数(如指数型、幂函数型、对数型等);
③通过变量替换(如令、),将非线性问题转化为线性回归问题;
④求解线性回归方程,再通过逆变换,还原得到非线性经验回归方程。
(三)独立性检验
1.核心解题步骤:
①提出零假设:两个研究变量相互独立,并结合实际问题对零假设作出解释;
②根据抽样得到的样本数据,整理出列联表:
类别
类别
总计
类别
类别
总计
代入公式计算统计量的值:
③将计算的值与临界值(查分布表,自由度为1)比较,根据检验规则得出推断结论。
2.检验规则:
若临界值,则推断不成立,即认为两个变量不独立,且该推断犯错误的概率不超过对应临界值的概率;
若临界值,则没有充分的证据推断不成立,可认为两个变量相互独立。
题型一条件概率的求算
例1.一盒子中有大小与质地均相同的6个小球,其中白球4个,黑球2个.从中不放回地随机取3次,每次取1个球.
(1)记取到的黑球个数为随机变量,求的分布列和期望;
(2)已知实验完成后取到的黑球个数为2,求第2次取到白球的概率.
变式1-1.两位游客慕名来江苏旅游,他们分别从太湖鼋头渚、苏州拙政园、镇江金山寺、常州恐龙园、南京夫子庙、扬州瘦西湖这6个景点中随机选择1个景点游玩.记事件“两位游客中至少有一人选择太湖鼋头渚”,事件“两位游客选择的景点不同”,则 .
变式1-2.小龙虾是江汉平原的一种特色美食,它的口味有多种,据调查江汉平原地区喜欢麻辣口味的食客占,喜欢蒜蓉口味的食客占,既喜欢麻辣口味又喜欢蒜蓉口味的食客占,现从不喜欢蒜蓉口味的食客中随机抽取一人,则此人喜欢麻辣口味的概率为 .
变式1-3.某电子设备制造厂所用的元件是由甲、乙、丙三家元件制造厂提供的,根据以往的记录有下表所示的数据.设这三家制造厂的产品在仓库中是均匀混合的且无区别标志.
元件制造厂
次品率
提供元件的份额
甲
0.02
0.2
乙
0.01
0.7
丙
0.03
0.1
(1)在仓库中随机取一只元件,求它是次品的概率;
(2)在仓库中随机地取一只元件,若已知取到的是次品,求该次品是由丙制造厂提供的概率.
题型二条件概率性质的妙用
例2.设是两个随机事件,已知,,,记,则( )
A. B. C. D.
变式2-1.(多选)设,,是同一概率空间中的随机事件,满足,,,,则下列结论正确的是( )
A. B. C. D.
变式2-2.已知,,,则 .
变式2-3.(多选)设A,B为随机事件,且,则下列说法正确的是( )
A.若,则A,B相互独立
B.若,则
C.若,则
D.若,则
题型三利用全概率公式求概率
例3.已知1号箱中有2个白球和4个红球,2号箱中有5个白球和3个红球.现随机地从1号箱中取出1个球放入2号箱,然后从2号箱中随机取出1个球,则从2号箱取出红球的概率是 ,从2号箱取出红球来自1号箱的概率是 .
变式3-1.跑步运动越来越受大众喜爱.据统计,某校有高一、高二、高三三个年级,这三个年级中喜欢跑步运动的教师分别占该年级教师人数的,且这三个年级的教师人数之比为,现从这三个年级中随机抽取一名教师,则该教师喜欢跑步的概率为( )
A.0.42 B.0.36 C.0.35 D.0.45
变式3-2.有3台车床加工同一型号的零件,第1,2,3台加工的次品率分别为,,,加工出来的零件混放在一起.已知第1,2,3台车床加工的零件个数分别占总数的,,,若从中任取一个零件,则这个零件是次品的概率为( )
A.0.036 B.0.040 C.0.042 D.0.048
变式3-3.芡实俗称“鸡头米”,是一种不可多得的养生良品,其通过开发可以产出芡实酒.已知,,三家酒厂同时生产一批芡实酒,加工量分别占总量的20%,35%,45%,不合格率分别为0.01,0.015,0.02.现从这批产品中任取一瓶芡实酒,则该瓶酒是不合格的概率为 ;若该瓶芡实酒是不合格品,则该瓶酒是厂生产的概率为 .
题型四利用贝叶斯公式求概率
例4.(多选)甲、乙两个不透明的袋子中分别装有两种颜色不同但是大小相同的小球,甲袋中装有5个红球和5个绿球;乙袋中装有4个红球和6个绿球.先从甲袋中随机摸出一个小球放入乙袋中,再从乙袋中随机摸出一个小球,记表示事件”从甲袋摸出的是红球”,表示事件“从甲袋摸出的是绿球”,记表示事件“从乙袋摸出的是红球”,表示事件“从乙袋摸出的是绿球”.下列说法正确的是( )
A.,是对立事件 B.
C. D.
变式4-1.某社区有“驿站取件”和“上门配送”两种快递服务方式,居民首次选择服务方式时,选择两种服务方式的概率均为0.5.已知:若首次选了“驿站取件”,第二次继续选择“驿站取件”的概率为0.7.若首次选了“上门配送”,第二次换选择“驿站取件”的概率为0.2.则居民第二次选择“驿站取件”的概率为 ,若已知某居民第二次选择“驿站取件”,则他首次选择是“上门配送”的概率为 .
变式4-2.(多选)某商场举行抽奖活动,规则如下:参与者从甲、乙两个箱子中随机选择一个,然后从该箱中有放回地抽取小球两次,每次抽取1个球,已知甲箱中有4个红球和2个白球,乙箱中有3个红球和3个白球,每次抽到红球记1分,抽到白球记0分,设事件“参与者选择甲箱”,事件“两次抽球总得分为2分”,则( )
A. B.
C.与相互独立 D.
变式4-3.某无人机制造有限公司是世界级独角兽企业,其产品优质,畅销全球.该公司2024年有3条新型无人机生产线.
(1)假设新型无人机销售时按整箱出售,每箱10台.采购商在采购时,会随机选择一箱,并从中一次性随机抽取3台进行检查,若此箱产品中恰好有2台次品,求检测到的次品数的分布列和数学期望.
(2)该公司的3条新型无人机生产线的次品率和生产的无人机所占比例如下表:
次品率
占比
1号生产线
0.01
2号生产线
0.02
3号生产线
0.04
现从所生产的无人机中随机抽取1台,用频率估计概率,已知取到的是次品,试求该次品分别由三条生产线所生产的概率,并分析该次品来自哪号生产线的可能性最大.
题型五独立事件的乘法公式
例5.某企业到A大学招聘,小张、小李和小王3位毕业生前去应聘.若小张、小李2人中至少有1人签约的概率是,小王签约的概率是,3人签约事件相互独立,那么3人中至少有1人签约该企业的概率是 .
变式5-1.概率论起源于博弈游戏17世纪,曾有一个“赌金分配”的问题:博弈水平相当的甲、乙两人进行博弈游戏每局比赛都能分出胜负,没有平局.双方约定,各出赌金150枚金币,先赢3局者可获得全部赎金;但比赛中途因故终止了,此时甲赢了2局,乙赢了1局.向这300枚金币的赌金该如何分配?数学家费马和帕斯卡都用了现在称之为“概率”的知识,合理地给出了赌金分配方案.该分配方案是( )
A.甲150枚,乙150枚 B.甲225枚,乙75枚
C.甲200枚,乙100枚 D.甲240枚,乙60枚
变式5-2.(多选)有四张同样大小的卡片,上面标有数字,如图所示.从这四张卡片中随机抽取一张,设事件:“抽到的卡片上有数字”,,则下列事件相互独立的是( )
A. B. C. D.
变式5-3.在学校举行的秋季运动会中,甲、乙两名同学进入乒乓球决赛.决赛规则约定每局胜者得1分,负者得0分,比赛进行到有一人比对方多2分或打满6局时结束.设甲在每局中获胜的概率为,乙在每局中获胜的概率为,且各局胜负相互独立.
(1)求打完两局比赛结束的概率.
(2)求比赛打满6局结束的概率.
(3)若比赛结束时,分数较多的一方获胜,求甲获胜的概率.
题型六由随机变量的分布列求概率
例6.设离散型随机变量的分布列为:
0
1
2
3
4
0.1
0.4
0.2
0.2
则离散型随机变量的期望
变式6-1.随机变量X的分布列为:
X
1
2
3
P
a
则( )
A. B. C. D.
变式6-2.(多选)已知离散型随机变量的分布列如下所示,则下列说法正确的是( )
-2
1
3
0.25
A. B.
C. D.
变式6-3.已知离散型随机变量X的分布列.
(1)求常数的值;
(2)求;
(3)求随机变量的分布列及方差.
题型七求两点分布分布列及期望与方差
例7.若随机变量X服从两点分布,且,则下列结论错误的是( )
A. B.
C. D.
变式7-1.已知随机变量X,Y均服从伯努利分布,且X,Y的取值为0或1.若,且,则 .
变式7-2.已知随机变量均服从两点分布,若,则( )
A. B. C. D.
变式7-3.已知随机变量服从两点分布,.若,则 .
题型八求二项分布分布列及期望与方差
例8.某电子零部件代加工工厂生产的零部件次品率为,现进行多批次抽检,假设各零部件是否为次品相互独立.
(1)从一批产品中随机抽取件,求抽到的零部件中正品数多于次品数的概率;
(2)若从另一批产品中随机抽取件,记抽到的零部件的正品数与次品数差的绝对值为,求的分布列.
变式8-1.将一枚质地均匀的硬币连掷三次,事件“恰出现2次正面朝上”的概率记为,现采用随机模拟的方法估计的值:用计算机产生了20组随机数,其中出现“0”表示反面朝上,出现“1”表示正面朝上,结果如下,,若出现“恰有2次正面朝上”的频率记为,则( )
A. B. C. D.0
变式8-2.某购物中心举行购物抽奖活动,顾客购物达到一定金额后即可获得一次抽奖机会.抽奖时,从装有2个红球,4个绿球(每个球大小和质地相同)的抽奖箱中,每次随机摸取2个球.若两球都是红色,则获得一等奖;若两球不同色,则获得二等奖;若两球都是绿色,则不获奖.每人每次抽球互不影响.
(1)求顾客获得一等奖的概率;
(2)现有3名顾客参与抽奖,求至少两人获奖的概率.
变式8-3.某公司对新产品进行测试,测试分两个环节,第一个环节通过后才能进入第二环节测试,第一环节测试合格的概率为,若第一环节测试通过,则第二环节测试合格的概率为;若第一环节测试不合格,则无法进第二环节,设该产品最终测试合格的概率为,且每次测试结果相互独立.
(1)求的值;
(2)若连续2次进行测试,记为合格的次数,求的分布列及数学期望.
题型九服从二项分布的随机变量概率最大问题
例9.一年之计在于春,一日之计在于晨,春天是播种的季节,是希望的开端.某种植户对一块地的个坑进行播种,每个坑播2粒种子,每粒种子发芽的概率均为,且每粒种子是否发芽相互独立.对每一个坑而言,如果全部的种子发芽,则不需要进行补播种,否则要补播种.
(1)当时,用表示要补播种的坑的个数,求的分布列与数学期望.
(2)当取何值时,有4个坑要补播种的概率最大?最大概率为多少?
变式9-1.一个质点在随机外力的作用下,从数轴上数字所对应的位置出发,每隔秒向左或向右移动一个单位,设每次向右移动的概率为,则秒后质点最有可能落在数轴上( )所对应的位置.
A. B. C. D.
变式9-2.(多选)某同学共投篮12次,每次投篮命中的概率为0.8,假设每次投篮相互独立,记他投篮命中的次数为随机变量,下列选项中正确的是( )
A. B.
C. D.该同学投篮最有可能命中9次
变式9-3.某学校组织“学党史、强信念、跟党走”为主题的知识竞赛,每位参加比赛的同学均可参加多轮答题活动,每轮答题结果互不影响.每轮比赛共有两组题,每组都随机抽取两道题作答,先进行组答题,只有组的两道题均答对,方可进行组答题,否则本轮答题结束.已知甲同学组每道题答对的概率均为,组每道题答对的概率均为,两组题至少答对3道题才可获得一张奖券.
(1)设甲同学在一轮比赛中答对的题目数量为,求的分布列与数学期望;
(2)若甲同学进行了10轮答题,试问甲同学获得多少张奖券的概率最大?并说明理由.
题型十求超几何分布分布列及期望与方差
例10.2025年春节期间,电影《哪吒之魔童降世2》票房破百亿,整个电影界都为之欢腾,这是中国动画电影的一大步,也是世界电影史上的一次壮丽篇章.现随机抽取100位市民,将市民按年龄分为“青年组”和“非青年组”,同时统计是否看过电影《哪吒之魔童降世2》的样本观测数据整理如下:
看过
没看过
合计
青年组
30
20
50
非青年组
15
35
50
合计
45
55
100
记表示“抽取到的市民没看过《哪吒之魔童降世2》”,其概率为表示“抽取到的市民为非青年组”,其概率为.
(1)给出的估计值;
(2)现从抽取的青年组市民中,按是否看过《哪吒之魔童降世2》用分层抽样的方法选出5人组成一个小组,从抽取的5人中再抽取3人赠送《哪吒之魔童降世2》的电影票,求这3人中看过《哪吒之魔童降世2》的人数的分布列和数学期望.
变式10-1.(多选)一个口袋中有大小相同的2个白球和4个黑球,从中随机取出3个球,记取出的黑球个数为,则下列结论正确的是( )
A.的可能取值为0,1,2,3 B.
C. D.
变式10-2.某班组织竞赛活动,规定比赛需要从6道备选题中随机抽取3道题目进行作答.假设在6道备选题中,甲正确完成每道题的概率都是且每道题正确完成与否互不影响,乙能正确完成其中4道题目且另外2道题不能完成.
(1)求甲正确完成其中2道题的概率;
(2)设随机变量X表示乙正确完成题目的个数,求X的分布列及数学期望.
变式10-3.据文化和旅游部发布的数据显示,近几年国内出游人次显著增加.人们选择的出游方式不尽相同,有自由行,也有跟团游.为了了解年龄因素是否影响出游方式的选择,我们按年龄将成年人群分为青壮年组(大于等于14岁,小于40岁)和中老年组(大于等于40岁).现在市随机抽取170名成年市民进行调查,得到如下表的数据:
青壮年
中老年
合计
自由行
60
跟团游
50
合计
80
170
(1)请补充列联表,并判断能否有的把握认为年龄与出游方式的选择有关;
(2)用分层抽样的方式从跟团游中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
0.10
0.05
0.025
2.706
3.841
5.024
题型十一利用正态分布3σ原则求概率
例11.西峡猕猴桃是河南特产、中国国家地理标志产品.据统计,西峡县某种植基地新品种猕猴桃的单果质量(单位:g)近似服从正态分布,现有随机采摘的该新品种猕猴桃10000个,估计其中单果质量不低于70g的猕猴桃个数为( )
参考数据:若,则,,.
A.8413 B.9544 C.9772 D.9987
变式11-1.(多选)设随机变量,则( )
A. B.
C. D.
变式11-2.设随机变量,函数在定义域R上是单调递减函数的概率为,则( )
附:若,则,.
A.0.1355 B.0.1587 C.0.2718 D.0. 3413
变式11-3.某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行测试,对其生产的第一批零件的内径进行测量,统计绘制了如图所示的频率分布直方图.
(1)求的值以及这批零件内径的平均值(同一组中的数据用该组区间的中点值作代表);
(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间内的零件个数为,求的分布列以及数学期望;
(3)已知这批零件的内径(单位:mm)服从正态分布,现以这批零件内径的平均数作为的估计值,这批零件内径的标准差作为的估计值,已知的近似值为0.105,则在这批零件中随机抽取200个,记内径在区间上的零件个数为,求的方差.
参考数据:若,则,,.
题型十二利用总体均值和方差选取方案
例12.某校组织了“AI人工智能”知识竞赛(满分100分),经统计参赛同学的成绩(单位:分)近似服从正态分布,已知.
(1)从参赛同学中随机抽取3人,设表示这3人中成绩在内的人数,求的分布列和方差;
(2)该校为调动学生参赛的积极性,设置两种抽奖方案:
方案一:参赛同学只能抽奖1次,抽奖获得价值150元、100元、10元的学习用品的概率分别为,,;
方案二:参赛同学的成绩低于只能抽奖1次,不低于的抽奖2次,每次抽奖获得价值100元、40元的学习用品的概率分别为,.
请分析参赛同学采用哪种方案获得学习用品价值金额的期望较大?
变式12-1.为解决当下人口老龄化以及生育率连年下降等问题,我国于2025年7月28日印发了《育儿补贴制度实施方案》,某地响应国家号召,制订了两套方案以减缓部分家庭由抚养造成的生活压力.两套方案的执行策略如表:
单个家庭生育婴儿数
1
2
3
补贴方案一
每月补助300元,共补贴3年
每月补助1100元,共补贴3年
每月补助2600元,共补贴3年
补贴方案二
每月补助1000元,共补贴3年
通过人口普查,可近似估计该地每个家庭生育婴儿的数量与概率:
单个家庭生育婴儿数
0
1
2
3
概率
由于单个家庭生育四个婴儿及以上的概率过低,可认为此事件为小概率事件,故只需考虑单个家庭生育婴儿总数在0~3的情况.
(1)若采用补贴方案一,随机选取某家庭,其补助不低于1100元/月,求其共生育2个婴儿的概率;
(2)试从期望的角度讨论这两种补贴方案哪套的补贴额更高.
变式12-2.某商场为了促进消费,推出购物优惠活动、消费者购物每满元可参加一次抽奖,抽奖活动如下:抽奖箱设置个红球和个白球,每次抽取个球.若抽中个白球,返现金元;若抽中个红球和个白球,返现金元;若抽中个红球,返现金元.
(1)顾客恰好消费了元,设他所获得返现金额为随机变量.求的分布列及数学期望;
(2)顾客消费了元:
①顾客获得返现金额为的概率是多少?
②若该商场同时还推出购物享九折优惠活动(减免总金额的),则顾客应选择哪种方案更优惠?(备注:不能同时参加抽奖和打折活动)
变式12-3.抓娃娃游戏一直以来吸引着小朋友和成年人,它不仅是一种娱乐活动,更是一种充满策略与技巧的挑战.已知某游戏厅有,,三台抓娃娃机,娃娃机每次中奖的概率为,娃娃机每次中奖的概率为,娃娃机每次中奖的概率为,中奖结果与否互不影响.
(1)若小张分别操作,,抓娃娃机各一次,求小张中奖的概率;
(2)已知小张准备抓娃娃三次,现有两种方案供选择:
方案一:操作,,抓娃娃机各一次;
方案二:操作抓娃娃机三次.
假设,,三台抓娃娃机中奖一次获得娃娃的价值为20元,请根据获得娃娃价值的期望,分析小张选择哪种方案较合适.
题型十三线性回归方程
例13.地球生命来自外星吗?一篇发布在《生物学快讯》上的文章《基因库的增长是生命起源和演化的时钟》可能给出了一种答案.该论文的作者根据生物功能性基因组里的碱基排列数的大小定义了基因库的复杂度y(单位:1),通过研究各个年代的古代生物化石里基因库的复杂度,提出了一个有趣的观点:生物基因库的复杂度近似是随时间呈指数增长的,只要知道生物基因库的复杂度就可以推测该生物体出现的年代.如图是该论文作者根据生物化石(原核生物,真核生物,蠕虫,鱼类,哺乳动物)中的基因复杂度的常用对数与时间(单位:十亿年)的散点图及回归拟合情况(其中回归方程为:,相关指数).根据题干与图中的信息,下列说法错误的是( )
A.根据信息生物基因库的复杂度近似是随时间呈指数增长的情况,不同于作者采取取常用对数的做法,我们也可采用函数模型来拟合
B.根据回归方程可以得到,每过10亿年,生物基因库的复杂度一定增加到原来的倍
C.虽然拟合相关指数为0.97,但是样本点只有5个,不能很好地阐释其统计规律,所以增加可靠的样本点可以更好地完善回归方程
D.根据物理界主流观点:地球的形成始于45亿年前,及拟合信息:地球在诞生之初时生物的复杂度大约为,可以推断地球生命可能并非诞生于地球
变式13-1.某种肉鸡出栏时平均重量可达3.5千克,在没有人工干预的情况下自然繁殖,其出栏时的平均重量会一代不如一代,最后跟普通肉鸡差别不大.某实验室为了得到这种肉鸡自然繁殖后前一代与后一代的平均重量间的关系,将此种肉鸡视为第1代且又繁殖了10代.最后得到前一代平均重量(千克)与后一代平均重量(千克)之间的线性回归方程.已知第2代至第10代的平均重量之和为20千克,则第11代的平均重量为( )
A.2.4千克 B.2.1千克 C.1.8千克 D.1.5千克
变式13-2.对于数据组,如果由线性回归方程得到的对应于自变量的估计值是,那么将称为相应于点的残差.某工厂为研究某种产品产量(吨)与所需某种原材料吨)的相关性,在生产过程中收集4组对应数据如下表所示:
3
4
5
6
2.5
3
4
根据表中数据,得出关于的线性回归方程为,据此计算出样本点(4,3)处的残差为-0.15,则表中的值为( )
A.3.3 B.4.5 C.5 D.5.5
变式13-3.某医科大学实习小组为研究实习地昼夜温差与感冒人数之间的关系,分别到当地气象部门和某医院抄录了1月至3月每月5日、20日的昼夜温差情况与因感冒而就诊的人数,得到如表资料:
日期
1月5日
1月20日
2月5日
2月20日
3月5日
3月20日
昼夜温差x(℃)
10
11
13
12
8
6
就诊人数y(个)
22
25
29
26
16
12
该小组确定的研究方案是:先从这6组数据中随机选取4组数据求线性回归方程,再用剩余的2组数据进行检验.
参考公式:,.
(1)求剩余的2组数据都是20日的概率;
(2)若选取的是1月20日、2月5日、2月20日、3月5日这4组数据.
①请根据这4组数据,求出y关于x的线性回归方程;
②若某日的昼夜温差为7℃,请预测当日就诊人数.(结果保留整数).
题型十四相关系数、相关指数的求算及意义
例14.粮食是一个国家发展的基石,保障粮食安全是维护社会稳定的重要因素.小麦是我国两大口粮作物之一,其自身的稳定供应保障了数亿人口的食物需求,并通过产业链延伸带动了相关产业发展,促进了我国北方地区的经济发展.将2020~2024年记为年份代码1~5,我国小麦产量如下表所示.
年份代码
1
2
3
4
5
产量/千万吨
13.4
13.6
13.8
13.7
14.0
现规定表示年份代码,表示年份代码为的产量,经计算得,,
(1)求样本的相关系数;(精确到0.01)
(2)现从这5年中随机抽取2年,记这2年中小麦产量不低于13.7千万吨的年数为,求的分布列与期望.
附:相关系数,.
变式14-1.若变量和的4对观测数据为,两个变量满足一元线性回归模型(随机误差),请写出参数的最小二乘估计值为
变式14-2.当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响生活的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额(单位:百万元)与其年销售量(单位:千件)的数据统计表.
(百万)
1
2
3
4
5
(千件)
0.5
1
1.5
3
5.5
(1)根据统计表的数据及参考公式计算样本相关系数,推断两个变量的相关程度;
(2)根据(1)问的结果判断是否可以用一元线性回归模型来刻画年销售量和投入额之间的关系?如果可以,根据最小二乘法,建立销售量关于投入额的经验回归方程;如果不可以,请说明理由.
(3)该公司科研团队发现样本数据呈现出明显的非线性相关的特征,得到年销售量关于年投入额的非线性经验回归方程为,并计算出的残差平方和,请根据统计表的数据及参考公式,比较线性经验回归方程和非线性经验回归方程的拟合效果哪种更好?并选择拟合精度更高的方程,预测年投入额为6百万元时,产品的销售量约为多少?(计算结果保留到小数点后两位).
参考公式及数据:,,,,,,.
变式14-3.某汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入(亿元)与科技改造直接收益(亿元)的数据统计如下:
2
3
4
6
8
10
13
21
22
23
24
25
13
22
31
42
50
56
58
68.5
68
67.5
66
68
当时,建立了y与x的两个回归模型:模型①;模型②:;
(1)根据下列表格中的数据,比较当时模型①、②的相关指数,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为16亿元时的直接收益.
回归模型
模型①
模型②
回归方程
182.4
79.2
(附1:刻画回归效果的相关指数)
(2)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布,公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予鼓励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励4万元.求每台发动机获得奖励的分布列和数学期望.
(附2:随机变量服从正态分布,则,.)
题型十五非线性回归的处理技巧
例15.某经济研究所为了解居民存款余额变化情况,对2009年至2024年居民存款余额进行统计分析,将2009年看成第1年,依次类推,得到第1~16年的居民存款余额(单位:万亿元)的散点图,如图所示:
(1)已知从2021年开始,居民存款余额超过100万亿元,若从2009年至2024年中任取2年,求这2年中恰有一年居民存款余额超过100万亿元的概率;
(2)由散点图知,和的关系可用经验回归模型进行拟合,求关于的经验回归方程.
参考数据:设,则.
参考公式:对于一组数据,其经验回归直线的斜率和截距的最小二乘估计分别为.
变式15-1.某学校数学兴趣小组在探究姜撞奶随着时间变化的降温及凝固情况的数学建模活动中,将时间分钟与温度(摄氏度)的关系用模型(其中为自然对数的底数)拟合.设,变换后得到一组数据:
2
2.5
3
3.5
4
4.04
4.01
3.98
3.96
3.91
由上表可得线性回归方程,则等于( )
A.-4 B. C.4.16 D.
变式15-2.红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
24
2.9
646
168
422688
50.4
70308
表中,,,;
(1)根据残差图,比较模型①、②的拟合效果,模型 比较合适?
(2)根据(1)中所选择的模型,求出y关于x的回归方程是 .附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
变式15-3.红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度的8组观测数据,制成图l所示的散点图,现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:表中;;;
25
2.9
646
168
422688
50.4
70308
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)求出关于的回归方程.附:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计分别为,,
题型十六独立性检验(列联表)
例16.某马拉松赛事组委会为研究选手赛前是否进行热身训练与比赛中是否受伤的关联性,随机抽取了200名参赛选手的相关数据,整理得到如下2×2列联表.
单位:人
比赛中受伤
比赛中未受伤
合计
赛前进行热身训练
10
90
100
赛前未进行热身训练
30
70
100
合计
40
160
200
(1)从这200名参赛选手中随机抽取1人,已知此人赛前进行了热身训练,求此人在比赛中受伤的概率;
(2)能否有99.9%的把握认为选手赛前是否进行热身训练与比赛中是否受伤有关?
参考公式:,其中.
参考数据:
()
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
变式16-1.某儿童医院用甲、乙两种疗法治疗小儿消化不良.为分析两种疗法效果是否有差异,采取有放回的简单随机抽样的方法对治疗情况进行检查,得到如下数据:
疗法
疗效
未治愈
治愈
甲
15
52
乙
6
63
附常用小概率值及其相应的临界值表为:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
计算得.则下列说法正确的是:( )
A.以频率估计概率,有
B.以频率估计概率,有
C.若取,可以认为疗效与疗法独立
D.若取,可以认为疗效与疗法独立
变式16-2.(多选)炎炎夏日,许多城市发出高温预警,凉爽的某市成为众多游客旅游的热门选择.为了解来某市旅游的游客旅行方式与年龄是否有关,随机调查了100名游客,得到如下表格.零假设H0旅行方式与年龄没有关联,则下列说法中,正确的有( )
小于40岁
不小于40岁
自由行
38
19
跟团游
20
23
附:χ2=,其中.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
A.在选择自由行的游客中随机抽取一名,其小于40岁的概率为
B.在选择自由行的游客中按年龄分层随机抽样抽取6人,再从中随机选取2人做进一步的访谈,则2人中至少有1人不小于40岁的概率为
C.根据的独立性检验,推断旅行方式与年龄没有关联,且犯错误概率不超过0.01
D.根据的独立性检验,推断旅行方式与年龄有关联,且犯错误概率不超过0.05
变式16-3.某工厂推出一款新产品,为了调查顾客对该新产品的满意程度,厂家分别对甲地的300名使用者和乙地的200名使用者进行问卷调查,统计并得到如下列联表:
甲地使用者
乙地使用者
合计
不满意
100
50
150
满意
200
150
350
合计
300
200
500
(1)根据小概率值的独立性检验,分析使用者的满意度是否与区域有关;
(2)从使用该产品不满意的顾客中,采用分层抽样的方法随机抽取9名使用者,再从这9名使用者中随机抽取4人进一步调研,记4人中乙地人数为,求的分布列和数学期望.
附录:.
0.15
0.1
0.05
0.025
0.01
0.001
2.072
2.706
3.841
5.024
6.635
10.828
基础巩固通关测
一、单选题
1.(2025·26高一上·湖南邵阳·期末)已知甲、乙两名运动员进行射击比赛,各射击一次,是否中靶相互独立.若恰好一人中靶的概率为0.26,至少一人中靶的概率为0.98,则甲、乙两人都中靶的概率是( )
A. B. C. D.
2.为了研究物理成绩与数学成绩之间的关系,随机抽取100名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A.2.5 B.3.5 C.3.5 D.2.5
3.(2026·河南南阳·模拟预测)已知,且,则( )
A.0.2 B.0.3 C.0.35 D.0.45
4.(2025·26高二上·河南南阳·期末)某食品厂生产的袋装饼干的重量(单位:克)服从正态分布,质检部门规定重量在94克到109克之间的产品为合格产品,则从该食品厂生产的袋装饼干中随机抽取1袋饼干,抽到的饼干是合格品的概率约为( )(参考数据:若随机变量,则)
A.0.8185 B.0.9544 C.0.9759 D.0.9974
5.(2025·26高二上·福建宁德·期中)甲、乙、丙三位同学进行知识竞赛,每局比赛两人对战,第三人旁观.每局比赛的胜者与旁观者进行下一局比赛,先赢两局者获胜.规定不管是否决出胜者,至多三局结束比赛.根据以往经验,每局比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,每局比赛相互独立且没有平局.经抽签,甲、乙首先对战,丙旁观,设甲、乙、丙在三局内成为胜者的概率分别为,则下列关系正确的是( )
A. B.
C. D.
6.(2025·26高三上·湖北·月考)已知随机变量,设函数,则的图象大致为( )
A. B.
C. D.
7.(2024·25高二下·北京朝阳·期末)现有三枚质地均匀的骰子,分别为红色、绿色和蓝色.同时抛掷这三枚骰子,已知这三枚骰子朝上面的点数之和为15,设红色骰子掷出的点数为,绿色骰子掷出的点数为,下列结论中正确的是( )
A.
B.
C.
D.
二、多选题
8.(2025·26高二上·广东中山·月考)甲、乙两名射击运动员进行射击比赛,甲的中靶概率为0.8,乙的中靶概率为0.9,甲是否击中对乙没有影响,设“甲中靶”,“乙中靶”,则( )
A.与与,与,与都相互独立
B.与是对立事件
C.
D.
9.(2025·26高二上·江西鹰潭·期末)下列说法中,正确的是( )
A.6件产品中有4件正品,2件次品,从中任取2件,则至少取到1件次品的概率为0.6
B.由两个分类变量X,Y的成对样本数据计算得到,依据的独立性检验(),可判断X,Y独立
C.已知A,B为随机事件,,若A,B相互独立,则
D.样本点的经验回归方程为,若样本点与的残差相等,则
10.(2026高三·全国·专题练习)(多选)已知投资两种项目获得的收益分别为,,分布列如下表,则下列说法正确的是( )
百万
0
2
0.2
0.6
百万
0
1
2
0.3
0.4
A.
B.
C.投资两种项目的收益期望一样多
D.投资项目的风险比项目高
三、填空题
11.(2026·四川·模拟预测)已知正四棱锥的底面边长和高都为2.现从该棱锥的5个顶点中随机选取3个点构成三角形,设随机变量表示所得三角形的面积,则其数学期望 .
12.(2025高三·全国·专题练习)甲、乙、丙三个人依次参加摸奖活动,在一个不透明的摸奖箱中有六个同样大小、同样光滑的小球,每个小球标有一个编号,编号分别为1,2,3,4,5,6.活动规则:每个人从这个摸奖箱中连续摸三次,每次摸一个球,每次摸完后,记下小球上的编号再将其放回箱中,充分搅拌后再进行下一次的摸取.三次摸完后将三个编号相加,若三个编号的和为4的倍数,则能得到一个纪念品.记获得纪念品的人数为,则的数学期望为 .
13.(2020高三·全国·专题练习)针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若有的把握认为是否喜欢韩剧和性别有关,求男生至少有 人.
四、解答题
14.(2024·25高二下·湖北武汉·期末)为了研究高二学生数学和物理成绩的相关情况,学校在高二学生中采用随机抽样的方法抽取了150名学生,调查他们平时的数学与物理成绩情况,统计数据如下.
数学成绩优秀
数学成绩不优秀
合计
物理成绩优秀
55
20
75
物理成绩不优秀
30
45
75
合计
85
65
150
(1)依据列联表判断,能否有99.9%的把握认为数学成绩优秀与物理成绩优秀有关?
(2)从调查的物理成绩不优秀的学生中,按照数学成绩是否优秀采用分层随机抽样的方法抽取15人.若从这15人中随机抽取2人,记X为数学成绩优秀的人数,求X的分布列及数学期望.参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
15.(2024·25高二下·河北保定·月考)某农科研究所想要研究某种农产品的亩产量(单位:吨)与施肥量(单位:千克)之间的关系,通过调研得到一些数据如下表:
施肥量
5
7
9
11
13
15
亩产量
6
8
11
12
已知且,且,的相关系数,说明,满足线性回归.
参考数据:,,参考公式:,,.
(1)求的值;
(2)求关于的回归直线方程;
(3)若施肥量为9,11时的残差分别为,,求的值.
16.(2025·26高三上·江苏·月考)如图,一个质点在随机外力的作用下,从原点出发,每次等可能地向左或向右移动一个单位.
(1)移动4次后,质点最终所在的位置的坐标为多少的概率最大?
(2)若移动次后,质点最终所在位置的坐标为,求的数学期望与方差.
17.(2021·广东·模拟预测)2020年国庆节期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握国庆节期间车辆出行的高峰情况,在某高速公路收费站点记录了3日上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费站点,它们通过该收费站点的时刻的频率分布直方图如下图所示,其中时间段9:20~9:40记作、9:40~10:00记作,10:00~10:20记作,10:20~10:40记作,例如:10点04分,记作时刻64.
(1)估计这600辆车在9:20~10:40时间内通过该收费站点的时刻的平均值(同一组中的数据用该组区间的中点值代表);
(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车随机抽取4辆,设抽到的4辆车中,在9:20~10:00之间通过的车辆数为X,求X的分布列;
(3)根据大数据分析,车辆在每天通过该收费站点的时刻T服从正态分布,其中可用3日数据中的600辆车在9:20~10:40之间通过该收费站点的时刻的平均值近似代替,用样本的方差近似代替(同一组中的数据用该组区间的中点值代表).假如4日全天共有1000辆车通过该收费站点,估计在9:46~10:40之间通过的车辆数(结果保留到整数).
附:若随机变量T服从正态分布,则,,.
能力提升进阶练
1.(2025·26高三上·河南·期末)为比较甲、乙两所学校学生的数学水平,采用了如下方法:
第1步,科学抽样.采用简单随机抽样方法从两所学校共抽取88名学生,且对这88名学生进行测验;
第2步,收集数据.测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生有7名学生数学成绩优秀,并做出了如下的列联表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
第3步,提出零假设.零假设:两校学生的数学成绩优秀率无差异,
第4步,计算.计算得到,
第5步:判断.根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为两校的数学成绩优秀率没有差异.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
若将列联表中所有数据都扩大到原来的10倍,则下列说法正确的是( )
A.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
B.根据小概率值的独立性检验,两校的数学成绩优秀率没有差异
C.有99%的把握认为学生的数学成绩是否优秀与学校有关
D.学生的数学成绩是否优秀与学校有关,该推断犯错误的概率不超过0.001
2.(2025·26高三上·河北承德·期末)甲、乙两名同学进行乒乓球比赛,采用5局3胜制(先胜3局者获胜,比赛结束),已知每局比赛甲获胜的概率为,且各局比赛的结果相互独立,则在已知甲最终获胜的条件下,甲第一局获胜的概率是 .
3.(2025·26高三上·安徽蚌埠·期末)在一次独立性检验中得到如下列联表:
总计
200
800
1000
180
m
总计
380
已知,,根据上面的列联表,若依据小概率值的独立性检验,可以认为这两个分类变量A和B没有关系,则下列选项中m可能取到的为( )
A.200 B.720 C.100 D.800
4.已知盒子中共有个大小相同的球,有红、黄、黑三种颜色,其中黄球有个,随机不放回依次取出一个球,直到将球全部取出.
(1)求第二次取出的球是黄球的概率.
(2)若,且红球和黑球的个数比为,求黄球最先被全部取出(取出最后一个黄球时盒子里还有红球和黑球)的概率.
(3)记随机变量为最后一个黄球取出时总共所取出球的个数,是的数学期望,证明:.
5.(2025·26高一上·山东日照·期末)近年来足球赛事中,单败淘汰赛制(输一局就淘汰)与新兴的双败赛制并存,为比赛增添了许多看点.现有四支队伍A、B、C、D参与赛事,其中是强队,对阵B、C、D的获胜概率均为,,而B、C、D彼此之间对阵时获胜概率均为.经抽签,第一轮比赛时,和对阵,和对阵.
双败赛制规则如下图所示:
(1)若赛前要从4支队伍中随机选出2支队伍打一场热身赛,求选出的两支队伍恰好是和的概率;
(2)若,在单败淘汰赛赛制下,获得冠军的概率是多少?
(3)分别计算两种赛制下获得冠军的概率(用表示),并据此证明双败赛制对强队更有利.
1/3
学科网(北京)股份有限公司
$