内容正文:
重难点35 概率与统计的综合问题
【全国通用】
【题型1 概率的综合问题】 3
【题型2 二项分布与超几何分布的综合应用】 6
【题型3 正态分布的综合问题】 10
【题型4 概率与其它知识的交汇问题】 15
【题型5 离散型随机变量与其他知识综合】 17
【题型6 回归分析与其他知识综合】 23
【题型7 独立性检验与其他知识综合】 28
【题型8 概率、统计与数列的综合问题】 33
1、概率与统计的综合问题
概率与统计是历年高考的重点、热点内容,概率与统计专题相关的知识点错综复杂又环环相扣,往往多个知识点结合考查.从近几年的高考情况来看,题量通常为“两小一大”,选择题、填空题考查比较全面,侧重基础知识,难度不大;解答题重点考查概率统计主干知识,主要涉及古典概型、离散型随机变量的分布列和数学期望、回归分析、独立性检验等内容,试题难度中等;复习时加强这部分内容的练习,灵活求解.
知识点1 概率问题及其解题策略
1.古典概型中基本事件的求解方法
(1)枚举法:适合于给定的样本点个数较少且易一一列举出的问题.
(2)树状图法:适合于较为复杂的问题,注意在确定样本点时(x, y)可看成是有序的,如(1,2)与(2,1)不同,有时也可看成是无序的,如(1,2)与(2,1)相同.
(3)排列组合法:在求一些较复杂的样本点个数时,可利用排列或组合的知识.
2.求条件概率的常用方法
(1)利用定义,分别求P(A)和P(AB),得.
(2)借助古典概型概率公式,先求事件A包含的基本事件数n( A),再在事件A发生的条件下求事件B包含的基本事件数,即n( AB),得.
3.利用全概率公式的解题思路
(1)按照确定的标准,将一个复合事件分解为若干个互斥事件Ai(i=1,2,…,n);
(2)求P(Ai)和所求事件B在各个互斥事件Ai发生条件下的概率P(B|Ai);
(3)代入全概率公式计算.
知识点2 频率分布直方图中的数字特征
1.众数、中位数、平均数的应用要点
中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.
2.频率分布直方图的数字特征
(1)众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
(3)平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
知识点3 离散型随机变量及其分布的解题策略
1.离散型随机变量分布列的求解步骤
(1)明取值:明确随机变量的可能取值有哪些,且每一个取值所表示的意义;
(2)求概率:要弄清楚随机变量的概率类型,利用相关公式求出变量所对应的概率;
(3)画表格:按规范要求形式写出分布列;
(4)做检验:利用分布列的性质检验分布列是否正确.
2.求离散型随机变量ξ的均值与方差的步骤
(1)理解ξ的意义,写出ξ可能的全部值.
(2)求ξ取每个值的概率.
(3)写出ξ的分布列.
(4)由均值的定义求E(ξ).
(5)由方差的定义求D(ξ).
知识点4 二项分布与超几何分布、正态分布的解题策略
1.判断某随机变量是否服从二项分布的关键点:
(1)在每一次试验中,事件发生的概率相同.
(2)各次试验中的事件是相互独立的.
(3)在每一次试验中,试验的结果只有两个,即发生与不发生.
2.超几何分布的应用
(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.
超几何分布的特征是:
①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的概率分布.
(2)超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.
3.正态分布问题的解题策略
解决正态分布问题有三个关键点:
(1)对称轴x=μ;
(2)标准差σ;
(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0.
知识点5 回归分析、独立性检验的解题策略
1.回归分析的三大常用结论
(1)求解经验回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心.
(2)根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
(3)根据的值可以判断两个分类变量有关的可信程度,若越大,则两分类变量有关的把握越大.
2.独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【题型1 概率的综合问题】
【例1】(2025·辽宁·三模)某高中开发了三个不同的“美育”课程和两个不同的“劳动教育”课程,甲同学从五门课程中任选了两门,已知有一门是“美育”课程,则另一门也是“美育”课程的概率为( )
A. B. C. D.
【答案】B
【解题思路】根据条件概率公式来求解,先分别求出(至少有一门是“美育”课程的概率)和(两门都是“美育”课程的概率),再代入公式计算.
【解答过程】设事件A:至少有一门是“美育”课程,事件AB:两门都是“美育”课程,
从五门课程中任选两门的选法数为种.
“至少有一门是‘美育’课程”的对立事件是“两门都是‘劳动教育’课程”.
两门都是“劳动教育”课程的选法数为种.
所以至少有一门是“美育”课程的选法数为种.则.
从三个不同的“美育”课程中选两门的选法数为种,所以.
由条件概率公式,将,代入可得:
.
故选:B.
【变式1-1】(24-25高二下·山东烟台·期中)某公司有甲,乙两个部门,每个部门各有7名员工,其中甲部门有5名经验丰富的员工和2名新员工,乙部门有4名经验丰富的员工和3名新员工,现从甲部门和乙部门各随机选出一名员工进行交换,交换完成后,再从甲部门随机选出一名员工,则该员工是经验丰富的员工的概率为( )
A. B. C. D.
【答案】C
【解题思路】先分类求出甲部分员工情况及对应概率,再根据题意求解即可.
【解答过程】从甲部门和乙部门各随机选出一名员工进行交换,有以下四种情况:
第一种,甲部门经验丰富的员工与乙部门经验丰富的员工交换,则概率为,
第二种,甲部门新员工与乙部门新员工交换,则概率为,
第三种,甲部门经验丰富的员工与乙部门新员工交换,则概率为,
第四种,甲部门新员工与乙部门经验丰富的员工交换,则概率为,
第一种与第二种甲部门有5名经验丰富的员工和2名新员工,则随机选出一名员工,为经验丰富的员工的概率为,
第三种甲部门有4名经验丰富的员工和3名新员工,则随机选出一名员工,为经验丰富的员工的概率为,
第四种甲部门有6名经验丰富的员工和1名新员工,则随机选出一名员工,为经验丰富的员工的概率为,
故甲部门随机选出一名员工,则该员工是经验丰富的员工的概率为.
故选:C.
【变式1-2】(2025·湖北·三模)某技术部门招工需经过四项考核,已知能够通过第一、二、三、四项考核的概率分别为0.6,0.8,0.9,0.65,各项考核是相互独立的,每个应聘者都要经过四项考核,只要有一项考核不通过即被淘汰.
(1)求该部门招工的淘汰率;
(2)求通过第一、三项考核但是仍被淘汰的概率.
【答案】(1)0.7192
(2)0.48.
【解题思路】(1)对于独立事件,它们同时发生的概率等于各事件发生概率的乘积;运用乘法公式和对立事件概率公式计算即可;
(2)可通过条件概率和对立事件的概率和为1来计算.
【解答过程】(1)设B表示最终通过考核,分别表示通过第一、二、三、四项考核.
因为各项考核是相互独立的,所以该部门招工的通过率为,因此该部门招工的淘汰率为.
(2)在通过第一、三项考核的情况下考核全部通过的概率为 ,
因此,通过第一、三项考核但是仍被淘汰的概率为.
【变式1-3】(2025·山东·二模)甲乙二人进行比赛,已知在每局比赛中,甲获胜的概率为,乙获胜的概率为,各局比赛的结果相互独立.为决出最终获胜的一方,有以下两种方案可供选择:
方案一:规定每局比赛的胜方得1分,败方得0分,则首次比对手高两分的一方获胜.
方案二:首次连胜两局比赛的一方获胜.
(1)若,且采用方案一,求第四场比赛结束时恰好分出胜负的概率.
(2)若,为使甲获胜的概率更大,则应该选择哪种比赛方案?请说明理由.
附:当0 < q < 1时,.
【答案】(1)
(2)方案二,理由见解析
【解题思路】(1)根据题意,列出满足题意的所有事件,根据概率的加法公式即可求解;
(2)根据概率公式分别求得选方案一和方案二时甲获胜的概率,作商比较大小即可求解.
【解答过程】(1)第四场结束恰好分出胜负对应的事件为:
:甲贏第1,3,4局,乙赢第2局,
:甲赢第2,3,4局,乙赢第1局,
:乙赢第1,3,4局,甲赢第2局,
:乙赢第2,3,4局,甲赢第1局,
对应概率:;
(2)设事件:甲最终获胜,事件:甲乙在前两局结束后得分相同.
记使用方案一,二时甲胜出的概率分别为.
对于方案一,根据条件概率公式:
,
因为每场比赛的结果相互独立,所以在前两局甲,乙各胜出一局达到同分的条件下,甲从第三局开始出现优先超过乙两分的概率恰为,即,
故,
从而.
对于方案二,甲最终获胜对应的事件只可能是甲乙相互获胜且最后甲连胜两局,即每局胜者按照“甲乙甲乙…甲乙甲甲”或“乙甲乙甲…乙甲甲”的规律.
从而甲获胜的概率
,
显然,令,
有,即,
因为,所以
所以应选择方案二.
【题型2 二项分布与超几何分布的综合应用】
【例2】(24-25高三下·陕西西安·阶段练习)盲盒中有大小相同的3个红球,2个黑球,随机有放回的摸两次球,记X为摸到黑球的个数,随机无放回的摸两次球,记Y为摸到黑球的个数,则( )
A., B.,
C., D.,
【答案】B
【解题思路】根据二项分布求,根据超几何分布求,即可得结果.
【解答过程】由题意可知:,则,
且Y的可能取值为0,1,2,
则,
可得,
,
所以,.
故选:B.
【变式2-1】(24-25高二下·吉林·期中)一个袋子中有100个大小相同的球,其中有40个黄球、60个白球;进行如下两个试验,试验一:逐个不放回地随机摸出20个球,记取到黄球的个数为,期望方差分别为,;试验二:逐个有放回地随机摸出20个球,记取到黄球的个数为,期望和方差分别为,,则下列判断错误的是( )
A.
B.
C.
D.变量分布列是,
【答案】B
【解题思路】根据超几何分布和二项分布的定义判断两个试验,再根据不同的分布计算概率、期望和方差,判断各个选项;
【解答过程】试验一:从袋子中逐个不放回地随机摸出20个球是超几何分布模型,
记取到黄球的个数为,,
则变量分布列是,,
,.
试验二:从袋子中逐个有放回地随机摸出20个球是二项分布模型;
记取到黄球的个数为,则,则期望和方差分别为,,
对于A,试验二是二项分布模型,A正确;对于B,,B错误;
对于C,,C正确;D正确;
故选:B.
【变式2-2】(2025·北京通州·一模)某艺术研究中心对春节档6部影片观众满意度进行调查,评分如下
第一部
第二部
第三部
第四部
第五部
第六部
普通观众评分
87.2
85.4
84.9
84.9
84.7
83.6
专业观众评分
88.7
80.0
81.6
77.4
76.1
72.2
(1)从这6部影片中随机选取1部,恰好选到普通观众评分与专业观众评分都低于85分的影片的概率;
(2)现有4名观众,每位观众从这6部影片中各随机选取1部观看.
(ⅰ)若不同观众可选相同影片(假设每位观众的选择相互独立),记X为选到普通观众评分与专业观众评分都低于85分的影片的人数,求X的分布列及数学期望.
(ⅱ)若任意2名观众不能选看相同影片,记Y为选到普通观众评分与专业观众评分都低于85分的影片的人数,试比较这种情况下数学期望与(ⅰ)中的大小关系,(结论不要求证明)
【答案】(1)
(2)(ⅰ)分布列见解析;(ⅱ)
【解题思路】(1)运用古典概型概率公式计算;
(2)(ⅰ)中求的分布列就是确定的所有可能取值,结合二项分布求每个取值的概率.进而得到分布列和均值;(ⅱ)运用超几何分布求出,与比较即可.
【解答过程】(1)已知事件为“抽到的影片普通观众评分与专业观众评分都低于85分”,题中给出有部影片满足该条件,而影片总数为部.
根据古典概型概率公式,所以.
(2)(ⅰ)依题意,的可能取值为,,,,.因为每次抽取事件相互独立,且抽到普通观众评分与专业观众评分都低于85分的影片的概率为,共抽取次,所以服从参数,的二项分布,即.
根据二项分布概率公式可得:
,
, ,
,
,
列出的分布列:
.
(ⅱ)确定服从的分布及参数:6部影片中有4部普通观众评分与专业观众评分都低于85分的影片,4名观众任意2名观众不能选看相同影片,所以服从超几何分布,其中,,.
求:根据超几何分布的数学期望公式,可得.
比较大小:因为,,所以.
【变式2-3】(2025·上海长宁·二模)为响应国家促进消费的政策,某大型商场举办了“消费满减乐翻天”的优惠活动,顾客消费满800元(含800元)可抽奖一次,抽奖方案有两种(顾客只能选择其中的一种)
方案1:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,有放回地依次摸出3个球.每摸出1次红球,立减150元,若3次都摸到红球,则额外再减200元(即总共减650元);
方案2:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,不放回地依次摸出3个球.中奖规则为:若摸出3个红球,享受免单优惠;若摸出2个红球,则打5折;其余情况无优惠.
(1)顾客A选择抽奖方案2,已知他第一次摸出红球,求他能够享受优惠的概率;
(2)顾客B恰好消费了800元,
①若他选择抽奖方案1,求他实付金额的分布列和期望(结果精确到0.01);
②试从实付金额的期望值分析顾客B选择何种抽奖方案更合理.
【答案】(1)
(2)①分布列见解析,;②选择方案
【解题思路】(1)设事件表示“第一次摸到红球”,事件表示“能够享受优惠”,求解在第一次摸到红球后,从7个球中不放回摸2个球的情况和摸出两球为红球和一红一蓝两种情况的种数,即可求解;
(2)①设顾客B选择抽奖方案1时实付金额为元,由二项分布即可求解;②设顾客B选择抽奖方案2时实付金额为元,根据超几何分布求得均值,比较随机变量和的均值即可判断.
【解答过程】(1)设事件表示“第一次摸到红球”,事件表示“能够享受优惠”,
在第一次摸到红球后,抽奖盒中还剩4个红球和3个蓝球,共7个球,
享受优惠包含摸出2个红球和摸出3个红球这两种情况,
从7个球中不放回摸2个球,总情况有种,
摸出两个红球的情况有种,
摸出1红1蓝的情况有种,
所以;
(2)①设顾客B选择抽奖方案1时实付金额为元,
从装有5个红球,3个蓝球的抽奖盒中摸一个球,摸到红球的概率为,摸到蓝球的概率为,
当摸出0个红球时,,
当摸出1个红球时,,
当摸出2个红球时,,
当摸出3个红球时,,
所以实付金额的分布列为
800
650
500
150
实付金额的期望为
;
②设顾客B选择抽奖方案2时实付金额为元,
当摸出0个红球或1个红球时,,
当摸出2个红球时,,
当摸出3个红球时,,
所以,
所以,所以从实付金额的期望值分析,顾客B选择抽奖方案2更合理.
【题型3 正态分布的综合问题】
【例3】(2025·广东·模拟预测)已知随机变量X服从正态分布,且,则( )
A. B. C. D.
【答案】C
【解题思路】结合题意与正态分布的性质求出和,最后结合条件概率公式求解即可.
【解答过程】由题可知该正态分布的均值为,其图象的对称轴为直线,
则,又,
由对称性可知,
由条件概率公式得.
故选:C.
【变式3-1】(2025·湖北黄冈·模拟预测)已知某批零件的尺寸服从正态分布,其中的零件为合格品,且,现从这批零件中随机抽取200个,用表示这200个零件中合格品的个数,则( )
A.180 B.185 C.190 D.195
【答案】C
【解题思路】利用正态分布的对称性求得,进而有,应用二项分布的期望公式求期望.
【解答过程】由,可得,
则,故.
故选:C.
【变式3-2】(2025·河南·三模)为丰富学生的课余生活,某地举办了2025年数学文化知识挑战赛,举办方从中随机抽取了100名学生的成绩,并进行统计整理,现将成绩(满分100分)划分为四个分数段:,,,.已知,各分数段人数的频数统计如下表:
分数段
频数
10
30
m
n
(1)求m,n的值;
(2)按成绩进行分层,采用分层随机抽样的方法从这100人中抽取10人,再从这10人中随机抽取4人,设抽到的4人中成绩在内的人数为X,求X的分布列与期望;
(3)由以往比赛成绩的数据分析可知,学生成绩.已知今年该地共有20000名学生参加比赛,估计成绩在内的学生人数.
参考数据:若,则,,.
【答案】(1)
(2)分布列见解析,
(3)
【解题思路】(1)根据频数总和为样本总数的性质来求解和的值.
(2)先根据分层随机抽样的特征,确定抽取的10人中,成绩在内的人数,再确定的取值,通过组合数公式计算每个取值的概率,进而得到分布列和期望.
(3)先求出和,再利用正态分布的性质和参考数据计算成绩在内的概率,最后根据总人数估计该区间内的学生人数.
【解答过程】(1)已知抽取的学生总数为100名,即各分数段频数之和为100,可得到方程,化简得.
又因为,解得,.
(2)计算分层抽样后成绩在内的人数:成绩在内的频数为人.从100人中抽取10人,
根据分层抽样的特征,抽取的10人中成绩在内的人数为人,那么成绩不在内的人数为人.
表示抽到的人中成绩在内的人数,所以的可能取值为,,,,.
计算取各个值的概率:
.
.
.
.
.
列出的分布列:
可得.
(3)已知,则,.
,.
.
今年该地共20000名学生参加比赛,所以成绩在内的学生人数约为人.
【变式3-3】(2025·陕西商洛·模拟预测)在双碳战略之下,新能源汽车发展成为乘用车市场转型升级的重要方向,2024年我国新能源汽车销量继续走高.为了解新能源汽车车主对新能源汽车的满意程度,某市某品牌的新能源汽车经销商从购买了该品牌新能源汽车的车主中随机选取了100人进行问卷调查,并根据其满意度评分(单位:分,总分100分)制作了如下的频数分布表:
满意度评分
频数
10
15
20
30
15
10
(1)计算满意度评分的样本平均数和样本中位数;(每组数据以该组区间的中点值为代表)
(2)根据频数分布表可以认为该市该品牌新能源汽车车主对新能源汽车的满意度评分近似地服从正态分布,其中近似为样本平均数近似为样本的标准差,并求得.若该市恰有1万名该品牌的新能源汽车车主,试估计这些车主中满意度评分位于区间的人数;
(3)为提升新能源汽车的销量,该品牌4S店针对购买该品牌新能源汽车的顾客设置了抽奖环节,抽奖规则如下:每人可参加2次抽奖,每次抽奖都从装有3个红球、3个白球(形状、大小、质地完全相同)的抽奖箱里一次性摸出3个球,若摸出3个红球,则返还2000元现金;若摸出2个红球,则返还1000元现金,其余情况不返还任何现金(两次抽奖返现金额叠加).已知小王参加了抽奖,记他获得的返现金额为,求随机变量的分布列和数学期望.
参考数据:若随机变量,则.
【答案】(1),样本中位数为
(2)8186
(3)分布列见解析,
【解题思路】(1)结合题设数据,根据平均数和中位数的定义求解即可;
(2)由题意,,,进而根据正态分布特殊区间的概率求解即可;
(3)由题意可得的所有取值为,再求出顾客每次抽奖返还2000元现金的概率,顾客每次抽奖返还1000元现金的概率,顾客每次抽奖不返还任何现金的概率,进而求解分布列和数学期望.
【解答过程】(1)由题意,平均数,
前3组的频率为,前4组的频数为,
所以样本中位数位于,设为,
则,解得,则样本中位数为.
(2)由题意,近似地服从正态分布,且,,
由于
,
因此估计这些车主中满意度评分位于区间的人数为
.
(3)由题意,的所有取值为,
顾客每次抽奖返还2000元现金的概率为,
顾客每次抽奖返还1000元现金的概率为,
顾客每次抽奖不返还任何现金的概率为,
则,,
,
,
,
则的分布列为:
0
1000
2000
3000
4000
所以.
【题型4 概率与其它知识的交汇问题】
【例4】(2025·陕西安康·模拟预测)已知集合,从集合A的非空子集中任取两个集合,,则它们的交集为空集的概率为( )
A. B. C. D.
【答案】C
【解题思路】解一元二次不等式,求出集合中的元素,计算集合的所有非空子集的个数,分类讨论其中两个集合,交集为空集的情况数,计算概率即可.
【解答过程】由,解得,所以,共有个非空子集,
当中有一个元素时,是剩下三个元素的非空子集,则有种情况,
当中有两个元素时,是剩下两个元素的非空子集,则有种情况,
当中有三个元素时,是剩下一个元素的非空子集,则有种情况,
根据对称性可知,其中有一半是重复的情况,则,交集为空实际有种不同情况,
任取两个集合,交集为空集的概率为.
故选:C.
【变式4-1】(2025·湖南长沙·一模)已知一组数据0,9,7,4,5,从1到10中的整数里随机选择2个不同的数加入这组数据,则得到的新数据与原数据中位数相同的概率为( )
A. B. C. D.
【答案】B
【解题思路】根据题意,得到原数据的中位数为5,要使得新数据与原数据中位数相同,可分为两类:两数中不含5和两数中含5,求得不同的选法的种数,结合古典摡型的概率计算公式,即可求解.
【解答过程】数据0,9,7,4,5,从小到大排列为0,4,5,7,9,可得其中位数为5,
从1到10中的整数里随机选择2个不同的数加入这组数据有种选法,
要使得新数据与原数据中位数相同,则可分为两类:
若两数中不含5,不同的选法有种;
若两数中含5,则不同的选法有种,
所以共有种不同的选法,所以概率为
故选:B.
【变式4-2】(2025·辽宁丹东·模拟预测)有5个相同的球,分别标有数字1,2,3,4,5.
(1)若任取出3个球,求1号球被取到的概率;
(2)从中有放回地随机取3次,每次取出1个球,记为这5个球中从未被取出的球的个数,求的分布列和数学期望.
【答案】(1);
(2)分布列见解析,数学期望为.
【解题思路】(1)利用古典概型计算概率即可;
(2)利用古典概型计算每个随机变量取值的概率即可.
【解答过程】(1)设“1号球被取到”为事件,
则.
(2) 可取 2、3、4,
:有2个球没有被取出,
,
:有4个球没有被取出,
,
由分布列的性质得:
,
故的分布列为:
2
3
4
.
【变式4-3】(24-25高二下·广东深圳·期末)是由中国杭州的公司开发的人工智能模型,其技术在多领域有着普惠应用.为提高的应用能力,某公司组织全体员工参加培训.培训结束之后,公司举行了一次专业知识比赛,比赛分为预赛与决赛,预赛通过后才能参加决赛预赛从8道题中随机抽取4道作答,答对3道及以上则进入决赛,否则被淘汰.
(1)若这8道题中甲能答对其中5道,计算甲进入决赛的概率;
(2)已知甲进入了决赛,决赛需要回答3道题目,若全部答对则获得一等奖,奖励300元;若答对2道题目则获得二等奖,奖励150元;若答对1道题目则获得三等奖,奖励50元;若全部答错则没有奖励.若甲答对每道题目的概率均为,且每次答题相互独立,设甲获得奖金为,求的分布列及数学期望.
【答案】(1)
(2)分布列见解析,数学期望为元.
【解题思路】(1)由题知的取值为,而甲进入决赛有可能答3或4道题,利用组合数计算概率即可.
(2)由题可知的取值为,再利用二项分布计算概率,写出分布列,计算期望即可.
【解答过程】(1)记为甲在预赛答对的题数,则的取值为,
,,
记甲进入决赛为事件,
则甲进入决赛的概率为.
(2)由题可知的取值为,
所以,,
,,
所以的分布列如下:
(元),
即甲获得奖金的数学期望为元.
【题型5 离散型随机变量与其他知识综合】
【例5】(2025·湖南郴州·一模)湘绣,是中国优秀的民族传统工艺之一,有着两千多年的历史.湘绣的制作工艺繁杂,一幅湘绣作品要经过设计图案和刺绣两大主要环节,且只有设计图案通过后才能进行刺绣,两个环节相互独立.只有同时通过这两个环节才能成为成品.某绣坊准备制作三幅不同的湘绣作品,已知三幅作品通过设计图案环节的概率依次为,通过刺绣环节的概率依次为.
(1)求三幅中恰有一幅作品通过设计图案环节的概率;
(2)若已知三幅中恰有一幅作品通过设计图案环节,求通过的作品为的概率;
(3)经过设计图案和刺绣两个环节后,三幅作品成为成品作品的件数为.求随机变量的分布列及数学期望.
【答案】(1)
(2)
(3)分布列见解析,
【解题思路】(1)由概率乘法公式进行求解;
(2)由条件概率公式求解;
(3)记三幅作品成为成品的事件分别为,则,由可取,求出对应的概率,列出分布列即可求解数学期望.
【解答过程】(1)记三幅作品通过设计图案环节分别为事件,记三幅中恰有一幅作品通过设计图案环节为事件,
则.
(2).
(3)记三幅作品成为成品的事件分别为,
则,
由可取,
则,
,
,
,
则的分布列为
0
1
2
3
则数学期望.
【变式5-1】(2025·全国·模拟预测)已知某种业公司培育了新品种的橙子,现从某批次收获的果实中随机抽取了100个橙子(直径位于70mm至100mm之间)作为样本,统计得到如图所示的频率分布直方图.
(1)根据长期检测结果发现橙子直径服从正态分布,并将直径的橙子定为特级品.此批次样本橙子直径的标准差,用标准差作为的估计值,用样本平均数作为的近似值.现从该批次中任取一个,试估计该橙子为特级品的概率(保留小数点后两位数字);(同一组中的数据用该组区间的中点值代表)
(2)在样本中,从直径在区间,,上的橙子中利用按比例分配样本的分层抽样随机抽取7个橙子进行检测,再从中抽取3个橙子作进一步检测.记这3个橙子中直径在区间上的个数为,求的分布列与数学期望.
附参考数据:若随机变量服从正态分布,则,,.
【答案】(1)0.16
(2)分布列见解析,
【解题思路】(1)先利用频率分布直方图求出样本平均数,再根据正态分布的性质求解即可;
(2)根据频率分布直方图可知所取样本7个,直径在的车厘子有2个,得到X的所有可能取值,根据古典概型的概率公式求分布列,再根据分布列和期望公式求期望即可.
【解答过程】(1)由题意,估计该批次的橙子中随机抽取100个的直径的平均数为:
,
则,,所以直径,
则,
所以从该批次的橙子中任取一个,该橙子为特级品的概率约为0.16.
(2)由题意知直径在区间,,上的频率之比为,
所以这7个橙子中抽取的直径在区间,,上的橙子个数分别为4,2,1.
由题意知的所有可能取值为0,1,2,
则,,,
所以的分布列为
0
1
2
所以.
【变式5-2】(2025·广东广州·三模)为减少环境污染,保护生态环境,某校进行了“垃圾分类知识普及活动”,并对高一、高二全体学生进行了相关知识测试.现从高一、高二各随机抽取了20名学生,对他们的成绩(百分制)进行了整理和分析后得到如下信息:
高一年级成绩分布表
成绩
人数
1
2
3
4
10
高二年级成绩频率分布直方图
(1)从高一和高二样本中各抽取一人,求这两人成绩都不低于90分的概率;
(2)用频率估计概率,分别从高一全体学生中抽取一人,从高二全体学生中抽取两人,随机变量表示这三人中成绩不低于90分的人数,求的分布列和数学期望.
【答案】(1)
(2)分布列见解析;.
【解题思路】(1)首先求出高一年级成绩不低于90分的概率,然后求出高二年级成绩不低于90分的概率,最后根据独立事件概率公式求出高一年级高二年级各抽取1人成绩都不低于90分的概率.
(2)首先确定的可能取值,然后对每个取值情况下求取概率值,最后根据数学期望的公式求出的期望.
【解答过程】(1)从高一年级成绩分布表可以看出,成绩不低于90分的概率为.
从高二年级成绩频率分布直方图中可以看出,成绩不低于90分的概率为.
所以从高一和高二样本中各抽取1人,这两人的成绩都不低于90分的概率为:
.
(2)根据题意可知,的可能取值为0,1,2,3.
当时,即这三个人中成绩都低于90分,此时概率为:
.
当时,即这三个人中成绩只有1人的成绩是不低于90分的,此时概率为:
.
当时,即这三个人中成绩只有2人的成绩是不低于90分的,此时概率为:
.
当时,即这三个人的成绩都是不低于90分的,此时概率为:
.
所以的分布列为:
0
1
2
3
所以数学期望为.
【变式5-3】(25-26高三上·河北邢台·阶段练习)甲有两辆自行车,且每天都去体育馆锻炼.若甲去体育馆时,只要不下雨且家里有自己的自行车,他就会骑自行车过去.若甲回家时,只要不下雨且体育馆有自己的自行车,他就会骑自行车回家.其他情况下均走路去体育馆或回家.假设甲每天去体育馆时,回家时下雨的概率均为,不下雨的概率均为,且每次下雨与否互不影响.当前甲的自行车一辆在家里,一辆在体育馆.
(1)设甲第一天去体育馆锻炼回到家后,家中自行车的数量为,求的分布列与期望.
(2)设甲连续天去体育馆锻炼回到家后,家中自行车的数量为0,1的概率分别为,.
①求;
②证明:.
【答案】(1)分布列见解析;1
(2)①,;②证明见解析
【解题思路】(1)确定X的可能的取值,由题意求出每个值相应的概率,即可求得分布列以及期望;
(2)①结合(1)的结论求解,即得答案;②设为连续天去体育馆锻炼回到家后,家中有2辆自行车的概率,可得,从而可得,,相加后化简即可证明结论.
【解答过程】(1)由题意可知的取值可能为,
当时,表示甲第一天去体育馆锻炼时不下雨,回家时下雨,
则,
当时,表示甲第一天去体育馆锻炼时不下雨,回家时也不下雨,
或甲第一天去体育馆锻炼时下雨,回家时也下雨,
则;
当时,表示甲第一天去体育馆锻炼时下雨,回家时不下雨,
则,
故X的分布列为:
X
0
1
2
P
则.
(2)①由(1)可知,
则;
;
②设为连续天去体育馆锻炼回到家后,家中有2辆自行车的概率,则,
则,,
故
.
【题型6 回归分析与其他知识综合】
【例6】(2025·全国·模拟预测)某公司在5个月期间的广告支出x(万元)与销售额y(万元)的数据如下:
月份
1
2
3
4
5
广告支出x
2
4
5
8
11
销售额y
10
20
30
40
50
(1)从这5个月中随机抽取三个月份,记销售额高于30万元的月份的个数为X,求随机变量X的分布列及数学期望;
(2)求y关于x的线性回归方程,并预测广告支出为10万元时的销售额.
参考公式:,.
【答案】(1)分布列见解析,;
(2),当万元时,销售额为万元.
【解题思路】(1)由题意可得,分别求出对应概率,列出分布列,即可计算其期望;
(2)求出、,根据的公式,求出、,即可得回归方程,代入,即可得对应的销售额.
【解答过程】(1)由题意可得,
所以,,,
分布列如下:
0
1
2
所以;
(2)因为,,
所以,
,
所以,
又因为,
所以y关于x的线性回归方程为;
当时,;
所以y关于x的线性回归方程为,当万元时,销售额为万元.
【变式6-1】(2025·山东·一模)某工厂的某生产车间2020年至2024年生产的年利润(百万元),统计数据如表所示:
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
年利润
2.8
3.4
3.6
4.4
4.8
(1)已知变量具有线性相关关系,求年利润(百万元)关于年份代号的经验回归方程,并预测2025年该车间的年利润;
(2)已知该工厂共有6个车间,根据每个车间的年利润分为“类车间”和“类车间”两类,其中“类车间”4个,“类车间”2个,现从这6个车间中任取3个车间,记随机变量为“类车间”的个数,求的分布列及其数学期望.
参考公式:,.
【答案】(1),5.3百万元.
(2)分布列见解析,2
【解题思路】(1)由最小二乘法即可求解回归方程,代入方程即可预测,
(2)利用超几何分布的概率公式求解概率,即可得分布列,进而由期望公式得解.
【解答过程】(1)由题意,根据表格中的数据,可得:
,,
,可得.
所以,
故的线性回归方程,
令,得,故2025年该车间年利润约为5.3百万元.
(2)随机变量的可能值为,
可得,,,
所以的分布列为:
1
2
3
所以期望为:.
【变式6-2】(2025·河北邢台·三模)某学校为了解入学新生的身高情况,随机抽取了50名新生,测得他们的身高(单位:),并分成以下5组:,,,,,绘制成如图所示的频率分布直方图.
(1)补全频率分布直方图,并求出样本中学生身高的中位数.(保留小数点后两位)
(2)该学校体育教研室为了解身高是否在一定的范围内与参加弹跳运动时长有关,调研得到以下5组数据:
参加弹跳运动时长(单位:年)
1
2
3
4
5
身高(单位:)
158
162
166
170
184
表中的数据显示,与之间存在线性相关关系,试求出关于的回归方程.
附:回归直线中斜率和截距的最小二乘估计公式分别为,.
【答案】(1)频率分布直方图见解析,165.36
(2)
【解题思路】(1)利用频率和为可求出,利用中位数为分位数可求出频率分布直方图的中位数,
(2)利用最小二乘法先求出参数,再利回归方程经过样本中心点,可求出参数,从而可求回归直线方程.
【解答过程】(1)由频率分布直方图可知,
,解得,
所以补全后的频率分布直方图如图所示,
又因为,,
所以中位数在区间内,设其值为,
所以,解得,
所以样本中学生身高的中位数约为165.36.
(2)由题意可知,,,
,
,
根据公式,可求得,则,
所以所求回归直线方程为.
【变式6-3】(2025·四川绵阳·模拟预测)某汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入(亿元)与科技改造直接收益(亿元)的数据统计如下:
2
3
4
6
8
10
13
21
22
23
24
25
13
22
31
42
50
56
58
68.5
68
67.5
66
68
当时,建立了y与x的两个回归模型:模型①;模型②:;
(1)根据下列表格中的数据,比较当时模型①、②的相关指数,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为16亿元时的直接收益.
回归模型
模型①
模型②
回归方程
182.4
79.2
(附1:刻画回归效果的相关指数)
(2)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布,公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予鼓励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励4万元.求每台发动机获得奖励的分布列和数学期望.
(附2:随机变量服从正态分布,则,.)
【答案】(1)模型①的小于模型②,模型②
(2)分布列见解析,
【解题思路】(1)利用表格数据比较两个模型的相关指数的大小,把数据代入模型可得答案;
(2)利用正态分布求出概率,结合期望公式可得答案.
【解答过程】(1)由表格中的数据,有182.4>79.2,
因为,
所以模型①的小于模型②,说明回归模型②刻画的拟合效果更好,
所以当亿元时,科技改造直接收益的预测值为:(亿元);
(2)因为,
所以,
因为,
所以,
所以,
设每台发动机获得的奖励为Y(万元),则Y的分布列为:
0
2
4
0.02275
0.8186
0.15865
所以每台发动机获得奖励的数学期望
(万元).
【题型7 独立性检验与其他知识综合】
【例7】(2025·广东·模拟预测)为了研究生活习惯 M 与患有疾病N的关系,某疾控中心随机调查了其他条件都基本相同的340人,调查数据如表所示.
无习惯M者
有习惯M者
合计
没患疾病N者
120
160
280
患有疾病N者
15
45
60
合计
135
205
340
(1)根据小概率值的独立性检验,判断患有疾病N与有生活习惯M是否有关?
(2)常用表示在事件A发生的条件下事件B发生的优势,在统计中称为似然比.现从340人中任选一人,A表示“选到的人是有习惯M者”,B表示“选到的人患有疾病N者”,请利用样本数据,估计的值.
附:,
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)认为患有疾病N与有生活习惯M有关;
(2).
【解题思路】(1)根据给定数表,求出的观测值,再与临界值比对作答.
(2)由给定公式,利用条件概率公式列式求解.
【解答过程】(1)零假设:患有疾病N与有生活习惯M无关,
依据列联表中的数据,经计算得,
根据小概率的独立性检验,推断零假设不成立,
即认为患有疾病N与有生活习惯M有关.
(2).
【变式7-1】(25-26高三上·江苏南通·阶段练习)为促进消费,扩大内需,江苏省体育局主办了年城市足球联赛,简称“苏超”.随着赛事的进行,引发全省乃至全国人民的关注,城市旅游人数显著提升.下表是比赛五个月来的某城市旅游人数(百万)与第个月的数据:
(月份)
(人数)
(1)已知可用线性回归模型拟合与的关系,请建立关于的线性回归方程;
(2)该市随机抽取了部分市民及游客,调查他们对赛事的关注情况,得到如下列联表:
性别
不关注赛事
关注赛事
男性
女性
请依据小概率值的独立性检验,能否认为关注“苏超”赛事与性别有关.
参考公式:,,其中.
【答案】(1)
(2)能,理由见解析
【解题思路】(1)求出、的值,结合最小二乘法公式求出、,即可得出线性回归方程;
(2)零假设关注“苏超”赛事与性别无关,计算出的观测值,结合临界值表可得出结论.
【解答过程】(1)由表格中的数据可得,,
所以,
,
故关于的线性回归方程为.
(2)零假设关注“苏超”赛事与性别无关,
由表格中的数据可得,
依据小概率值的独立性检验,能认为关注“苏超”赛事与性别有关.
【变式7-2】(2025·贵州·模拟预测)某车企为了调查新能源汽车的款式与买车的客户性别的关联性,调查了200名客户的购买情况,得到如下列联表:
性别
车型款式
合计
A款新能源汽车
B款新能源汽车
男性客户
90
120
女性客户
10
合计
200
(1)求出,的值.
(2)将上面列联表补充完整,依据小概率值的独立性检验,能否认为选购新能源汽车的款式与性别有关联?
(3)假设用样本估计总体,用频率估计概率,所有人选购新能源汽车的款式情况相互独立.若从购买者中随机抽取3人,设被抽取的3人中购买了A款新能源汽车的人数为X,求X的数学期望.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)列联表见解析,可以认为选购新能源汽车的款式与性别有关联
(3)
【解题思路】(1)根据所给数据完善列联表得解;
(2)计算,根据所给临界值表得出结论;
(3)由题意得出的可能取值,求对应概率得解,也可直接由二项分布得解.
【解答过程】(1)由已知得,
样本中选购B款新能源汽车的女性客户人数为,
所以.
(2)得到完整数据的列联表如下:
性别
车型款式
合计
A款新能源汽车
B款新能源汽车
男性客户
30
90
120
女性客户
10
70
80
合计
40
160
200
零假设为:选购新能源汽车的款式与性别无关联.
根据列联表中的数据,
可得,
根据小概率值的独立性检验,推断不成立,即可以认为选购新能源汽车的款式与性别有关联,此推断犯错误的概率不大于.
(3)随机抽取1人购买A款新能源汽车的概率为.
解法一:的所有可能取值为,
则,,
,,
所以.
解法二:写成,所以.
【变式7-3】(25-26高三上·河北衡水·开学考试)林芝第二十一届桃花旅游文化节于2024年3月31日晚正式拉开帷幕.某研究小组为了了解开幕式文艺演出时林芝市民的观看情况,从全市随机调查了50名市民(男女各25名),统计到全程观看、部分观看和没有观看的人数如下表:
观看情况
全程观看
部分观看
没有观看
男性人数
9
4
女性人数
18
4
(1)求出表中x,y的值;
(2)从样本中没有观看的人中随机抽取2人进一步了解情况,求恰好男女各1人的概率;
(3)根据表中统计的数据,完成下面的2×2列联表,依据小概率值的独立性检验,分析全程观看是否与性别有关?
性别
观看情况
合计
全程观看
非全程观看
男性
女性
合计
附:,.
0.10
0.05
0.01
2.706
3.841
6.635
【答案】(1),.
(2)
(3)表格见解析,无关.
【解题思路】(1)根据男女人数各为25人,即可求出表中x,y的值;
(2)利用古典概型即可求解;
(3)填写列表,计算卡方,与比较,得到结论.
【解答过程】(1)由题意得,解得,
,解得.
(2)由(1)知没有观看的人数为7,男4女3,设男生编号为a,b,c,d,女生编号为1,2,3.
从7人中抽2人,所有可能的结果为
,,,a1,a2,a3,,,b1,b2,b3,,c1,c2,c3,d1,d2,d3,12,13,23,共21种,
恰好男女各1人的结果为a1,a2,a3,b1,b2,b3,c1,c2,c3,d1,d2,d3,共12种.
所以从没有观看的人中随机抽取2人,恰好男女各1人的概率.
(3)完整列联表如下
性别
观看情况
合计
全程观看
非全程观看
男性
12
13
25
女性
18
7
25
合计
30
20
50
零假设为:是否全程观看与性别无关.
根据表中的数据,计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即是否全程观看与性别无关.
【题型8 概率、统计与数列的综合问题】
【例8】(2025·湖南常德·一模)从1,2,3,4,5,6,7这7个数任选3个不同数排成一个数列,则得到的数列为等差数列的概率为( )
A. B. C. D.
【答案】A
【解题思路】根据给定条件,利用排列计数问题求出试验及事件的基本事件数,再求出古典概率.
【解答过程】从给定的7个数中任取3个的试验有个基本事件,
能构成等差数列的事件含有:公差为的个,公差为的个,公差为有个,共18个基本事件,
所以得到的数列为等差数列的概率为.
故选:A.
【变式8-1】(2025·四川·模拟预测)若随机变量的分布列如下表,表中数列是公比为2的等比数列,则( )
1
2
3
A. B. C. D.
【答案】D
【解题思路】根据等比数列通项公式用表示、,再结合概率和为求出,最后根据期望公式计算.
【解答过程】已知数列是公比为的等比数列,可得,.
因为随机变量的所有概率之和为,即,将,代入可得:
,合并同类项得,解得.
根据离散型随机变量的期望公式,把,,代入可得:
.
故选:D.
【变式8-2】(2025·江苏宿迁·模拟预测)甲、乙两盒子中各有2枚形状、大小完全相同的棋子,一红一黄.称一次操作是从甲、乙盒中随机取出一枚棋子交换,记次操作后,甲、乙盒中仍各有一红一黄棋子的概率为.
(1)求的值.
(2)求数列的通项公式,并求使不等式成立的的最小值.
(3)若随机变量X服从两点分布,且,则 .记前次(即从第1次到第次交换)中甲、乙两盒中仍各有一红一黄棋子的次数为,求.
【答案】(1),;
(2),14;
(3).
【解题思路】(1)设事件第次操作时,从甲盒中取出的是红色棋子为,事件第次操作时,从乙盒中取出的是红色棋子为,则事件第一次操作后甲、乙盒中仍各有一红一黄棋子可表示为,根据概率加法和乘法公式求,再根据关系求.
(2)由条件可得,证明数列为等比数列,结合等比数列求出通项公式;结合(2)的结论化简不等式可得,结合指数函数单调性及,可得结论.
(3)利用给定期望公式,结合等比数列前项和公式求解.
【解答过程】(1)设事件第次操作时,从甲盒中取出的是红色棋子为,
事件第次操作时,从乙盒中取出的是红色棋子为,
则事件第一次操作后甲、乙盒中仍各有一红一黄棋子可表示为,
又,事件与事件互为互斥事件,事件与事件独立,
则,
所以,
若第1次操作后甲、乙盒中各有一红一黄棋子,
则第二次操作后甲、乙盒中仍各有一红一黄棋子的概率为,
若第1次操作后甲盒中为两个红色棋子,乙盒中为两个黄色棋子或甲盒中为两个黄色棋子,乙盒中为两个红色棋子,
则第二次操作后甲、乙盒中仍各有一红一黄棋子的概率为,
所以.
(2)依题意,,则,,
又,因此数列为首项为,公比为的等比数列,
于是,所以;
由,得,则,,
而,,函数为增函数,
所以的最小值为.
(3)前次(即从第1次到第次交换)中甲、乙两盒中仍各有一红一黄棋子的次数为,则服从两点分布,
,
因此
.
【变式8-3】(2025·湖南长沙·模拟预测)某中学国学小组共有个同学,分别编号为.在一次小组活动中,指导老师设计了两道问答题,并给出如下两个答题规则.
规则一:①第1号同学首先答第一题.②若第号同学答对第一题,则该生继续答第二题;若第号同学答错或不会答第一题,则由第号同学接替答第一题.③若第号同学答对第二题,则答题活动结束;若第号同学答错或不会答第二题,则由第号同学接替答第二题.④若答题轮到第号同学,则当该生遇到答错或不会答的情况时,答题活动也结束.
规则二:①,②同规则一.③若第号同学答对第二题,则答题活动结束;若第号同学答错或不会答第二题,则由第号同学接替答题,且重新从第一题开始作答.④同规则一.
假设每个同学答对第一题的概率都为,答对第二题的概率都为,且各同学的答题相互独立.
(1)若,且按规则一答题,当答题活动结束时,求答题人数不超过2人的概率;
(2)若,为使第3号同学答题后答题活动结束的概率较大,应选择哪个规则答题;
(3)若按规则二答题,记答题活动结束时参与答题的总人数为,证明:数列为等比数列.
【答案】(1)
(2)应选择规则一答题
(3)证明见解析
【解题思路】(1)设事件“答题人数为1人”,“答题人数为2人”,进而结合独立事件乘法公式、互斥事件概率求解即可;
(2)结合题意,分别求出按规则一答题和按规则二答题所对应的概率,进而判断即可;
(3)由题意可得的可能取值为,进而结合数学期望的公式、错位相减法求和求出,结合数学期望的性质可得,进而求证即可.
【解答过程】(1)当答题活动结束时,设事件“答题人数为1人”,“答题人数为2人”,则与互斥.
由已知可得,,
则,所以答题人数不超过2人的概率为.
(2)若按规则一答题,则第3号队员答题后答题活动结束需进行4次答题,
其中前3次第1,2号队员第一题至多答对1次,
第二题都答错或不会答,第4次第3号队员答对第二题,
其概率为.
若按规则二答题,因为每个同学两题都答对的概率为,
则第3号队员答题后答题活动结束的概率为.
因为,所以应选择规则一答题.
(3)按规则二答题,的可能取值为,
当时,,
当时,.
则.
设,
则,
两式相减,得
.
所以.
由题设,,则,
当时,,所以数列是首项为,公比为的等比数列.
一、单选题
1.(2025·天津宁河·模拟预测)下列说法中,正确的有( )
①回归直线恒过点,且至少过一个样本点:
②根据列列联表中的数据计算得出,而,则有的把握认为两个分类变量有关系,即有的可能性使得“两个分类变量有关系”的推断出现错误;
③在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好;
④某项测量结果服从正态分布,若,则
A.个 B.个 C.个 D.个
【答案】C
【解题思路】利用回归直线的特点可判断①;利用独立型检验可判断②;利用决定系数与模型拟合效果的关系可判断③;利用正态分布可判断④.即可得出合适的选项.
【解答过程】对于①,回归直线恒过点,不一定过样本点,①错;
对于②,根据列列联表中的数据计算得出,而,
则有的把握认为两个分类变量有关系,
即有的可能性使得“两个分类变量有关系”的推断出现错误,②对;
对于③,在做回归分析时,可以用决定系数刻画模型的回归效果,
若越大,则说明模型拟合的效果越好,③对;
对于④,某项测量结果服从正态分布,若,
则,④对.
故选:C.
2.(2025·湖南湘潭·一模)跑步运动越来越受大众喜爱.据统计,某校有高一、高二、高三三个年级,这三个年级中喜欢跑步运动的教师分别占该年级教师人数的 40%,30%,35%,且这三个年级的教师人数之比为3:3:4,现从这三个年级中随机抽一名教师,则该教师喜欢跑步的概率为( )
A.0.35 B.0.32 C.0.45 D.0.36
【答案】A
【解题思路】首先明确各年级教师人数的比例以及各年级中喜欢跑步的教师比例,然后利用全概率公式计算从三个年级中随机抽一名教师喜欢跑步的概率即可
【解答过程】设事件表示“随机抽一名教师喜欢跑步”,事件分别表示“抽到的教师来自高一、高二、高三年级”,
∵三个年级的教师人数之比为3:3:4,
∴,
∵高一、高二、高三三个年级中喜欢跑步运动的教师分别占该年级教师人数的40%,30%,35%,
∴,
根据全概率公式,
故选:A.
3.(2025·海南·模拟预测)某次社会实践活动中,甲、乙两个班的同学共同在一个社区进行民意调查,参加活动的甲、乙两班的人数之比为,其中甲班的女生占,乙班中女生占.则该社区居民遇到一位进行民意调查的同学恰好是女生的概率为( )
A. B. C. D.
【答案】D
【解题思路】由题意设出事件,写出事件的概率以及条件概率,利用全概率公式,可得答案.
【解答过程】记事件“居民所遇到的一位进行民意调查的同学是甲班的”,
事件“居民所遇到的一位进行民意调查的同学是乙班的”,
“居民所遇到的一位进行民意调查的同学是女生”,
则,且,互斥,,
由题意可知,,且,
由全概率公式可知,
即该社区居民遇到一位进行民意调查的同学恰好是女生的概率为.
故选:D.
4.(2025·广东广州·模拟预测)某学校高三学生共有900人,其中男生500人,为获取该校高三学生的身高信息,现采用按性别比例分配的分层随机抽样的方法,抽取了容量为90的样本.计算得男生样本的身高均值为170,方差为19,女生样本的身高均值为161,方差为19,则下列说法正确的是( )
A.抽取男生的样本量为40
B.估计该校高三学生身高的均值为165
C.抽样时女生甲被抽到的概率为
D.估计该校高三学生身高的方差为19
【答案】C
【解题思路】应用分层抽样判断A,应用分层抽样的均值及方差计算判断B,D,再应用分层抽样的概率计算判断C.
【解答过程】某学校高三学生共有900人,其中男生500人,采用按性别比例分配的分层随机抽样的方法,抽取了容量为90的样本.
则抽取男生的样本量为,A选项错误;
男生样本的身高均值为170,方差为19,女生样本的身高均值为161,方差为19,
则估计该校高三学生身高的均值为,B选项错误;
抽样时女生甲被抽到的概率为,C选项正确;
估计该校高三学生身高的方差为,D选项错误;
故选:C.
5.(2025·湖南长沙·三模)已知某个群体中对某活动持满意态度的人数比例为,从该群体中随机抽取10人,设这10人中持满意态度的人数为,随机变量,则( )
A.1.8 B.3.6 C.4.2 D.4.8
【答案】B
【解题思路】判断出随机变量服从二项分布,利用二项分布的方差公式求出.然后,根据随机变量,依据随机变量线性变换后的方差性质(其中、为常数),求出.
【解答过程】已知从群体中随机抽取10人,对某活动持满意态度的人数比例为,
设这10人中持满意态度的人数为,那么服从参数为(试验次数),(每次试验成功的概率)的二项分布,即.
对于二项分布,其方差公式为.
将,代入公式可得:.
已知随机变量,根据随机变量线性变换后的方差性质,
所以.由前面已求得,则.
所以.
故选:B.
6.(2025·江西新余·模拟预测)某品牌啤酒厂,进行市场调研,发现该品牌啤酒在某地的月销量随着每瓶啤酒的定价不同而发生变化,连续调研5个月得到的数据如下表所示:
第1个月
第2个月
第3个月
第4个月
第5个月
单价/元
6
6.5
7
7.5
8
销量/万瓶
90
85
80
75
70
根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程,则( )
A.相关系数 B.点一定在经验回归直线上
C. D.当每瓶啤酒为9.5元时,月销量一定为50万瓶
【答案】B
【解题思路】根据相关系数的概念可以判断A;求出样本中心点即可判断B;根据线性回归方程过样本中心点即可判断C;根据线性回归方程的性质即可判断D.
【解答过程】由可得与具有负相关,故A错误;
由表中数据可得,
所以样本中心点为,将代入得,
解得,故C错误.
则回归方程为,当时,,故在回归直线上,故B正确:
当时,,这是一个估计值,不是精确值,故D错误.
故选:B.
7.(2025·广东·模拟预测)一个盒子里有3个相同的球,分别标有数字2,3,4,若每次不放回地从盒子中随机取出一个球,直到取出的所有球的数字之积大于或等于8为止.记此时取出的所有球的数字之和为,则( )
A. B.7 C. D.6
【答案】A
【解题思路】先求的分布列,再求的期望.
【解答过程】由题意,的值可以为:6,7,9
表示取出的两个球上的数字为2,4,相当于将三个球排序,2,4排在前两位,所以;
表示取出的两个球上的数字为3,4,相当于将三个球排序,3,4排在前两位,所以;
表示三个球全部取出,相当于将三个球排序,2,3排在前两位,所以.
所以的分布列为:
6
7
9
所以.
故选:A.
8.(2025·全国·模拟预测)为了解某学校学生每周阅读课外书籍的数量,采用样本量比例分配的分层随机抽样方法.现抽取高一学生20人,其每周阅读课外书籍数量的均值为4本,方差为4;抽取高二学生30人,其每周阅读课外书籍数量的均值为3本,方差为2.则该学校高一、高二学生每周阅读课外书籍数量的总体均值和方差分别是( )
A.总体平均数为3.4本,总体方差为3.24 B.总体平均数为3.5本,总体方差为3.04
C.总体平均数为3.4本,总体方差为3.04 D.总体平均数为3.5本,总体方差为3.24
【答案】C
【解题思路】由条件结合分层抽样的平均数公式和方差公式由各层的平均数,方差求总体的平均数和方差即可判断.
【解答过程】高一学生人数,均值,方差.
高二学生人数,均值,方差.
所以总体均值.
总体方差 .
故选:C.
二、多选题
9.(2025·广东揭阳·模拟预测)为保护学生视力、促进学生身心健康发展,某中学研究型学习小组从该校学生中按男、女生比例,采用分层随机抽样的方法选取了100名学生(其中男生60人,女生40人),调查他们每日使用手机的时间.若每日使用手机时间超过40分钟,则认为该生手机成瘾.根据统计数据得到如图所示的等高堆积条形图,用样本估计总体,用频率估计概率,下列说法正确的有( )
附:.
0.1
0.01
0.001
2.706
6.635
10.828
A.该校男生和女生人数之比约为3:2
B.根据小概率值a=0.01的独立性检验,可以认为手机是否成瘾与学生性别有关
C.从该校学生中随机抽取一名学生,则该生手机成瘾的概率为
D.从该校学生中抽到一名手机成瘾的学生,则该生是男生的概率为
【答案】AC
【解题思路】利用分层抽样的抽样比可判断A;根据独立性检验的基本理论可判断B;按照古典概型的概率公式可判断C;利用条件概率可判断D.
【解答过程】根据分层随机抽样的抽样比可知,样本中男生和女生人数之比为,
用样本估计总体可知全校男生和女生人数之比约为,故A正确;
样本中男生有人手机成瘾,有人不成瘾,
女生有人手机成瘾,有人不成瘾,
零假设:手机是否成瘾与学生的性别无关,
故,
根据根据小概率值的独立性检验,没有充分的证据推断不成立,
因此可以认为成立,即手机是否成瘾与学生的性别无关,故B错误;
结合样本数据以及等高堆积条形图可知,
即样本的100人中有28人手机成瘾,所以样本中学生手机成瘾的频率为,
用频率估计概率可知,从该校学生中随机抽取一名学生,该生手机成瘾的概率为,
故C正确;
根据条件概率可知,在样本中抽样到一名手机成瘾的学生,该生是男生的概率为,
用样本估计总体可知该校学生中抽样到一名手机成瘾的学生,该生是男生的概率也为,
故D错误.
故选:AC.
10.(2025·广西柳州·模拟预测)某人工智能公司近5年的利润情况如下表所示:
第年
1
2
3
4
5
利润/亿元
2
3
4
5
7
已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,则下列说法正确的是( )
A. B.变量与之间的线性相关系数
C.预测该人工智能公司第6年的利润约为7.8亿元 D.残差绝对值的最大值为0.4
【答案】ACD
【解题思路】首先求出、,根据回归直线方程必过,即可求出,即可判断A;从而得到回归直线方程,根据与成正相关,即可得到相关系数,即可判断B;再令求出,即可预测第6年的利润,即可判断C,最后根据残差的定义求解判断D.
【解答过程】依题意,,
因为回归直线方程为必过样本中心点,
则,解得,故A正确;
回归直线方程为,则与成正相关,即相关系数,故B错误;
当时,,即该人工智能公司第6年的利润约为7.8亿元,故C正确;
当时,,残差绝对值为,
当时,,残差绝对值为,
当时,,残差绝对值为,
当时,,残差绝对值为,
当时,,残差绝对值为,
所以残差绝对值的最大值为0.4,故D正确;
故选:ACD.
11.(2025·广西北海·模拟预测)某班级有60%的学生报名参加了数学竞赛,40%的学生报名参加了物理竞赛.报名参加数学竞赛的学生中,有30%同时也报名参加了物理竞赛.从该班级中随机抽取一名学生,记事件为“该学生报名参加数学竞赛”,事件为“该学生报名参加物理竞赛”.则以下说法正确的是( )
A.事件和事件是独立事件 B.
C. D.
【答案】BCD
【解题思路】根据给定条件,利用相互独立事件的定义、条件概率公式及概率的基本性质逐项求解判断.
【解答过程】依题意,,
对于C,在报名参加数学竞赛的学生中,同时报名参加物理竞赛的概率,C正确;
对于A, ,
由于,事件和事件不是独立事件,A错误;
对于B,,B正确;
对于D,,D正确.
故选:BCD.
三、填空题
12.(2025·上海黄浦·三模)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人.
0.050
0.010
0.001
3.841
6.635
10.828
参考数据及公式如下:参考公式:,其中.
【答案】48
【解题思路】设男生人数为,依题意列出列联表,分析出根据小概率值的独立性检验,判断中学生追星与性别有关,则,再代入的公式求出的范围,再根据的实际意义即可求出男生的最少人数.
【解答过程】设男生人数为,依题意可得列联表为
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,
由,解得.
由题意知,应为6的整数倍,
所以若根据小概率值的独立性检验,
判断中学生追星与性别有关,则男生至少有48人.
故答案为:48.
13.(2025·湖南长沙·模拟预测)某水泥厂流水线上生产的一批袋装水泥,其重量指标X(单位kg)可以看作一个随机变量,且,对于或的产品即为不合格,且,现从这批袋装水泥中随机抽取500袋,用Y表示这500袋水泥的重量指标X位于区间的袋数,则随机变量Y的方差是 .
【答案】45
【解题思路】根据给定条件,利用二项分布方差公式计算得解.
【解答过程】由正态分布的性质得,重量指标在区间的概率为,
即1件产品的重量指标位于区间的概率为0.9,则,
所以随机变量Y的方差.
故答案为:45.
14.(2025·甘肃白银·模拟预测)汤圆是汉族传统小吃的代表之一,同时也是中国的传统节日元宵节最具有特色的食物,表达了人民对幸福生活的一种向往和期盼.在广东省流行四式汤圆,这四式汤圆指的是四种不同的馅:绿豆、红豆、糖冬瓜、芋头,小王在今年元宵节时,盛了一碗(10个)汤圆,其中绿豆馅、红豆馅的汤圆各4个,糖冬瓜馅、芋头馅的各1个,则小王在碗里随机取的4个汤圆中,在吃到1个芋头馅的前提下,4个汤圆中恰有3种不同馅的概率为 .
【答案】
【解题思路】根据条件概率公式来求解,先分别求出(吃到个芋头馅的概率)和(吃到个芋头馅且个汤圆中恰有种不同馅的概率),再代入公式计算.
【解答过程】设事件A:吃到个芋头馅.事件B:个汤圆中恰有种不同馅.
从10个汤圆中随机取个的总组合数为.
吃到个芋头馅,即从个芋头馅汤圆中选个,再从剩下的个汤圆中选个,组合数为,,所以.
吃到个芋头馅且个汤圆中恰有种不同馅有两种情况:
情况一:芋头馅个,绿豆馅个,红豆馅个,组合数为,
情况二:芋头馅个,绿豆馅个,红豆馅个,组合数为.
情况三:芋头馅个,糖冬瓜馅个,绿豆馅个,组合数为.
情况四:芋头馅个,糖冬瓜馅个,红豆馅个,组合数为.
则.
根据条件概率公式,将,代入可得:
.
故答案为:.
四、解答题
15.(2025·广东·模拟预测)已知某企业加工某零件,根据长期检测结果,得知该企业生产的零件的质量指标值服从正态分布.现从该企业生产的零件中随机抽取100件,其质量指标值的样本数据统计情况如图所示.
(1)求这100件零件的质量指标值的样本平均数和样本方差.(同一组的数据用该组区间的中点值作代表)
(2)用这100件零件的质量指标值的样本平均数作为的估计值,样本标准差作为的估计值.若质量指标值在内的产品为优等品,根据正态分布,求该企业生产的产品为优等品的概率.
附:取,
,,.
【答案】(1),
(2)0.9545
【解题思路】(1)根据频率分布直方图计算样本平均数及方差的方法,求出样本均值和方差即可;
(2)根据正态分布的性质,由方差和均值,判断结果即可.
【解答过程】(1).
.
(2)由题意知,样本方差,故,
所以该企业生产的零件的质量指标值服从正态分布.
,
所以该企业生产的产品为优等品的概率为0.9545.
16.(2025·宁夏石嘴山·模拟预测)现有甲、乙两名运动员进行乒乓球比赛(三局两胜制),其中每局中甲获胜的概率为,乙获胜的概率为,每局比赛都是相互独立的.
(1)求比赛只需打两局的概率;
(2)求甲在比赛中获胜的概率;
(3)已知甲在第一局比赛中获胜,求甲在比赛中获胜的概率.
【答案】(1)
(2)
(3)
【解题思路】(1)理解“比赛只需打两局”包括“两局甲全赢或乙全赢”利用独立事件的概率乘法公式计算即得;
(2)理解 “甲在比赛中获胜”包括甲前两局获胜,或者“共打三局,最后一句甲胜前两局甲赢一局”两类情况,利用互斥事件的概率加法公式计算即可;
(3)利用条件概率公式计算即可.
【解答过程】(1)比赛需打两局,则这两局甲全赢或乙全赢,故比赛需打两局的概率为.
(2)若甲在比赛中获胜,则甲可以前两局获胜,也可以打三局,最后一句甲胜前两局甲赢一局,
故甲在比赛中获胜的概率为.
(3)记事件A:甲在第一局中获胜,事件B:甲赢得比赛,
则,,
故.
17.(2025·湖南·模拟预测)近日,2025年湖南省城市足球联赛(被球迷称为“湘超”)如火如荼地进行,引发广泛关注.某地区随机抽取了部分市民,调查他们对赛事的关注情况,得到如下表格:
性别
不关注赛事
关注赛事
男性
25
150
女性
50
75
(1)列出列联表并根据小概率值的独立性检验,能否认为关注“湘超”赛事与性别有关?
(2)现从被调查的关注赛事的市民中,按照性别比例采用分层抽样的方法随机抽取3名市民参加“湘超”赛事知识问答.已知男性、女性市民顺利完成知识问答的概率分别为,,每个人是否顺利完成相互独立.求在有且仅有2人顺利完成的条件下,这2人的性别不同的概率.
附:.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,认为关注“湘超”赛事与性别有关
(2)
【解题思路】(1)由题意可得列联表,再计算,对比临界值表即可得解;
(2)根据题意,求出有且仅有2人顺利完成知识问答的概率和这2人性别不同的概率,再根据条件概率公式求解即可.
【解答过程】(1)列联表如下:
性别
不关注赛事
关注赛事
合计
男性
25
150
175
女性
50
75
125
合计
75
225
300
零假设为:关注“湘超”赛事与性别无关.
故依据小概率值的独立性检验,推断零假设不成立,
即认为关注“湘超”赛事与性别有关.
(2)由分层抽样可知,抽取男性市民2人,女性市民1人,
记“有且仅有2人顺利完成知识问答”为事件A,“这2人的性别不同”为事件B,
则,
,
则,
所以在有且仅有2人顺利完成知识问答的条件下,这2人的性别不同的概率为.
18.(2025·山西·三模)无人驾驶技术是汽车研发领域的一个重要方向.某学校技术俱乐部研发了一个感知路况障碍的小汽车模型,该模型通过三个传感器共同判断路段是否有路障.在对该模型进行测试中,该俱乐部同学寻找了80个不同的路段作为测试样本,数据如下表:
测试结果真实路况
传感器1
传感器2
传感器3
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
无障碍
4
15
1
1
15
4
8
12
0
有障碍
40
10
10
45
5
10
45
10
5
假设用频率估计概率,且三个传感器对路况的判断相互独立.
(1)从这80个路段中随机抽取一个路段,求传感器2对该路况判断正确的概率;
(2)从这80个路段中随机抽取一个无障碍的路段进行测试,设为传感器1和传感器2判断正确的总路段数,求的分布列和数学期望;
(3)现有一辆小汽车同时装载了以上3种传感器.在通过某路段时,只要3个传感器中一个判断有障碍或无法识别,则小汽车减速.那么是否可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于?(结论不要求证明)
【答案】(1)
(2)分布列见解析,
(3)可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于.
【解题思路】(1)利用古典概型的概率公式可求得所求事件的概率;
(2)分析可知,随机变量的取值集合为,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值;
(3)计算出三个传感器判断无障碍的概率,比较大小后可得出结论.
【解答过程】(1)80个路段中,传感器2判断正确的路段有个.
设“传感器2对该路况判断正确”为事件,则;
(2)80个路段中共有20个无障碍的路段.20个无障碍的路段中,传感器1判断正确的路段有15个,错误的路段有个,
传感器2判断正确的路段有15个,判断错误的路段有个,
的取值集合为.
,
,
,
故的分布列为
0
1
2
随机变量的数学期望;
(3)可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于.
分析:共有20个无障碍的路段,传感器1判断无障碍的有15个,
由频率估计概率,故无障碍路段上,估计传感器1判断无障碍的概率为.
传感器2判断无障碍的有15个,由频率估计概率,故无障碍路段上,
估计传感器2判断无障碍的概率为.
若传感器3在无障碍路段上,判断为无障碍的概率为1.
小汽车在无障碍的道路上减速的概率:.
故可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于.
19.(2025·甘肃武威·模拟预测)某高科技公司开发了一款AI学习机,为了解市场销售情况,该公司统计了过去5个月的月广告投入(单位:十万元)与该款学习机的月销量(单位:千台)的数据,如表所示.
月份代码
1
2
3
4
5
10
20
30
40
50
58
59
60
64
65
(1)求和的样本相关系数,并判断与是否具有较强的线性相关性;(结果精确到0.01,若,则认为与具有较强的线性相关性)
(2)求关于的经验回归方程,并估计月广告投入600万元时该款学习机的月销量;
(3)该款学习机目前售价为3000元/台,为提升销量,经销该款学习机的某专卖店针对该款学习机推出了两种促销方案.方案一:买一台立减400元;方案二:一次性购买两台可抽奖三次,每次中奖的概率均为,且每次抽奖相互独立,中奖一次立减600元/台,中奖两次立减800元/台,中奖三次立减1000元/台,若三次均未中奖,仍可享基础优惠300元/台.某家长准备在该店购买两台该款学习机,请从付款总金额数学期望的角度分析选哪种方案更优惠.
参考公式:对于经验回归方程,,;样本相关系数.
参考数据:,,.
【答案】(1)0.96,与具有较强的线性相关性;
(2);当时,千台;
(3)选第二种方案更优惠,理由见解析.
【解题思路】(1)根据公式算出线性相关系数,并根据判断标准作出判断即可;
(2)根据最小二乘法求得,进而求得关于的经验回归方程,代入可得月广告投入600万元时,该款学习机的月销量;
(3)分别计算两种方案的付款期望,并比较大小,可得选第二种方案更优惠.
【解答过程】(1)由题可知,,所以
所以.
所以y与x具有较强的线性相关性.
(2)由(1)知.
因为,,
所以.
关于的经验回归方程为,故当时,.
所以估计当月广告投入600万元时,该款学习机的月销量约为千台.
(3)家长准备在该店购买两台该款学习机,选第二种方案更优惠.理由如下:
若采用方案一,可享受优惠(元);付款总金额数学期望为(元);
若采用方案二,记中奖次数为X,则.
;;
;;
记该家长购买两台学习机可享受优惠共为Y元,则Y的分布列如下:
Y
600
1200
1600
2000
P
所以(元).
所以若采用方案二,付款总金额数学期望为(元).
因为,所以选第二种方案更优惠.
2 / 30
学科网(北京)股份有限公司
$
重难点35 概率与统计的综合问题
【全国通用】
【题型1 概率的综合问题】 3
【题型2 二项分布与超几何分布的综合应用】 4
【题型3 正态分布的综合问题】 5
【题型4 概率与其它知识的交汇问题】 7
【题型5 离散型随机变量与其他知识综合】 8
【题型6 回归分析与其他知识综合】 10
【题型7 独立性检验与其他知识综合】 13
【题型8 概率、统计与数列的综合问题】 16
1、概率与统计的综合问题
概率与统计是历年高考的重点、热点内容,概率与统计专题相关的知识点错综复杂又环环相扣,往往多个知识点结合考查.从近几年的高考情况来看,题量通常为“两小一大”,选择题、填空题考查比较全面,侧重基础知识,难度不大;解答题重点考查概率统计主干知识,主要涉及古典概型、离散型随机变量的分布列和数学期望、回归分析、独立性检验等内容,试题难度中等;复习时加强这部分内容的练习,灵活求解.
知识点1 概率问题及其解题策略
1.古典概型中基本事件的求解方法
(1)枚举法:适合于给定的样本点个数较少且易一一列举出的问题.
(2)树状图法:适合于较为复杂的问题,注意在确定样本点时(x, y)可看成是有序的,如(1,2)与(2,1)不同,有时也可看成是无序的,如(1,2)与(2,1)相同.
(3)排列组合法:在求一些较复杂的样本点个数时,可利用排列或组合的知识.
2.求条件概率的常用方法
(1)利用定义,分别求P(A)和P(AB),得.
(2)借助古典概型概率公式,先求事件A包含的基本事件数n( A),再在事件A发生的条件下求事件B包含的基本事件数,即n( AB),得.
3.利用全概率公式的解题思路
(1)按照确定的标准,将一个复合事件分解为若干个互斥事件Ai(i=1,2,…,n);
(2)求P(Ai)和所求事件B在各个互斥事件Ai发生条件下的概率P(B|Ai);
(3)代入全概率公式计算.
知识点2 频率分布直方图中的数字特征
1.众数、中位数、平均数的应用要点
中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.
2.频率分布直方图的数字特征
(1)众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
(3)平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
知识点3 离散型随机变量及其分布的解题策略
1.离散型随机变量分布列的求解步骤
(1)明取值:明确随机变量的可能取值有哪些,且每一个取值所表示的意义;
(2)求概率:要弄清楚随机变量的概率类型,利用相关公式求出变量所对应的概率;
(3)画表格:按规范要求形式写出分布列;
(4)做检验:利用分布列的性质检验分布列是否正确.
2.求离散型随机变量ξ的均值与方差的步骤
(1)理解ξ的意义,写出ξ可能的全部值.
(2)求ξ取每个值的概率.
(3)写出ξ的分布列.
(4)由均值的定义求E(ξ).
(5)由方差的定义求D(ξ).
知识点4 二项分布与超几何分布、正态分布的解题策略
1.判断某随机变量是否服从二项分布的关键点:
(1)在每一次试验中,事件发生的概率相同.
(2)各次试验中的事件是相互独立的.
(3)在每一次试验中,试验的结果只有两个,即发生与不发生.
2.超几何分布的应用
(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.
超几何分布的特征是:
①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的概率分布.
(2)超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.
3.正态分布问题的解题策略
解决正态分布问题有三个关键点:
(1)对称轴x=μ;
(2)标准差σ;
(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0.
知识点5 回归分析、独立性检验的解题策略
1.回归分析的三大常用结论
(1)求解经验回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心.
(2)根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
(3)根据的值可以判断两个分类变量有关的可信程度,若越大,则两分类变量有关的把握越大.
2.独立性检验的应用问题的解题策略
解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式计算;
(3)通过比较与临界值的大小关系来作统计推断.
【题型1 概率的综合问题】
【例1】(2025·辽宁·三模)某高中开发了三个不同的“美育”课程和两个不同的“劳动教育”课程,甲同学从五门课程中任选了两门,已知有一门是“美育”课程,则另一门也是“美育”课程的概率为( )
A. B. C. D.
【变式1-1】(24-25高二下·山东烟台·期中)某公司有甲,乙两个部门,每个部门各有7名员工,其中甲部门有5名经验丰富的员工和2名新员工,乙部门有4名经验丰富的员工和3名新员工,现从甲部门和乙部门各随机选出一名员工进行交换,交换完成后,再从甲部门随机选出一名员工,则该员工是经验丰富的员工的概率为( )
A. B. C. D.
【变式1-2】(2025·湖北·三模)某技术部门招工需经过四项考核,已知能够通过第一、二、三、四项考核的概率分别为0.6,0.8,0.9,0.65,各项考核是相互独立的,每个应聘者都要经过四项考核,只要有一项考核不通过即被淘汰.
(1)求该部门招工的淘汰率;
(2)求通过第一、三项考核但是仍被淘汰的概率.
【变式1-3】(2025·山东·二模)甲乙二人进行比赛,已知在每局比赛中,甲获胜的概率为,乙获胜的概率为,各局比赛的结果相互独立.为决出最终获胜的一方,有以下两种方案可供选择:
方案一:规定每局比赛的胜方得1分,败方得0分,则首次比对手高两分的一方获胜.
方案二:首次连胜两局比赛的一方获胜.
(1)若,且采用方案一,求第四场比赛结束时恰好分出胜负的概率.
(2)若,为使甲获胜的概率更大,则应该选择哪种比赛方案?请说明理由.
附:当0 < q < 1时,.
【题型2 二项分布与超几何分布的综合应用】
【例2】(24-25高三下·陕西西安·阶段练习)盲盒中有大小相同的3个红球,2个黑球,随机有放回的摸两次球,记X为摸到黑球的个数,随机无放回的摸两次球,记Y为摸到黑球的个数,则( )
A., B.,
C., D.,
【变式2-1】(24-25高二下·吉林·期中)一个袋子中有100个大小相同的球,其中有40个黄球、60个白球;进行如下两个试验,试验一:逐个不放回地随机摸出20个球,记取到黄球的个数为,期望方差分别为,;试验二:逐个有放回地随机摸出20个球,记取到黄球的个数为,期望和方差分别为,,则下列判断错误的是( )
A.
B.
C.
D.变量分布列是,
【变式2-2】(2025·北京通州·一模)某艺术研究中心对春节档6部影片观众满意度进行调查,评分如下
第一部
第二部
第三部
第四部
第五部
第六部
普通观众评分
87.2
85.4
84.9
84.9
84.7
83.6
专业观众评分
88.7
80.0
81.6
77.4
76.1
72.2
(1)从这6部影片中随机选取1部,恰好选到普通观众评分与专业观众评分都低于85分的影片的概率;
(2)现有4名观众,每位观众从这6部影片中各随机选取1部观看.
(ⅰ)若不同观众可选相同影片(假设每位观众的选择相互独立),记X为选到普通观众评分与专业观众评分都低于85分的影片的人数,求X的分布列及数学期望.
(ⅱ)若任意2名观众不能选看相同影片,记Y为选到普通观众评分与专业观众评分都低于85分的影片的人数,试比较这种情况下数学期望与(ⅰ)中的大小关系,(结论不要求证明)
【变式2-3】(2025·上海长宁·二模)为响应国家促进消费的政策,某大型商场举办了“消费满减乐翻天”的优惠活动,顾客消费满800元(含800元)可抽奖一次,抽奖方案有两种(顾客只能选择其中的一种)
方案1:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,有放回地依次摸出3个球.每摸出1次红球,立减150元,若3次都摸到红球,则额外再减200元(即总共减650元);
方案2:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,不放回地依次摸出3个球.中奖规则为:若摸出3个红球,享受免单优惠;若摸出2个红球,则打5折;其余情况无优惠.
(1)顾客A选择抽奖方案2,已知他第一次摸出红球,求他能够享受优惠的概率;
(2)顾客B恰好消费了800元,
①若他选择抽奖方案1,求他实付金额的分布列和期望(结果精确到0.01);
②试从实付金额的期望值分析顾客B选择何种抽奖方案更合理.
【题型3 正态分布的综合问题】
【例3】(2025·广东·模拟预测)已知随机变量X服从正态分布,且,则( )
A. B. C. D.
【变式3-1】(2025·湖北黄冈·模拟预测)已知某批零件的尺寸服从正态分布,其中的零件为合格品,且,现从这批零件中随机抽取200个,用表示这200个零件中合格品的个数,则( )
A.180 B.185 C.190 D.195
【变式3-2】(2025·河南·三模)为丰富学生的课余生活,某地举办了2025年数学文化知识挑战赛,举办方从中随机抽取了100名学生的成绩,并进行统计整理,现将成绩(满分100分)划分为四个分数段:,,,.已知,各分数段人数的频数统计如下表:
分数段
频数
10
30
m
n
(1)求m,n的值;
(2)按成绩进行分层,采用分层随机抽样的方法从这100人中抽取10人,再从这10人中随机抽取4人,设抽到的4人中成绩在内的人数为X,求X的分布列与期望;
(3)由以往比赛成绩的数据分析可知,学生成绩.已知今年该地共有20000名学生参加比赛,估计成绩在内的学生人数.
参考数据:若,则,,.
【变式3-3】(2025·陕西商洛·模拟预测)在双碳战略之下,新能源汽车发展成为乘用车市场转型升级的重要方向,2024年我国新能源汽车销量继续走高.为了解新能源汽车车主对新能源汽车的满意程度,某市某品牌的新能源汽车经销商从购买了该品牌新能源汽车的车主中随机选取了100人进行问卷调查,并根据其满意度评分(单位:分,总分100分)制作了如下的频数分布表:
满意度评分
频数
10
15
20
30
15
10
(1)计算满意度评分的样本平均数和样本中位数;(每组数据以该组区间的中点值为代表)
(2)根据频数分布表可以认为该市该品牌新能源汽车车主对新能源汽车的满意度评分近似地服从正态分布,其中近似为样本平均数近似为样本的标准差,并求得.若该市恰有1万名该品牌的新能源汽车车主,试估计这些车主中满意度评分位于区间的人数;
(3)为提升新能源汽车的销量,该品牌4S店针对购买该品牌新能源汽车的顾客设置了抽奖环节,抽奖规则如下:每人可参加2次抽奖,每次抽奖都从装有3个红球、3个白球(形状、大小、质地完全相同)的抽奖箱里一次性摸出3个球,若摸出3个红球,则返还2000元现金;若摸出2个红球,则返还1000元现金,其余情况不返还任何现金(两次抽奖返现金额叠加).已知小王参加了抽奖,记他获得的返现金额为,求随机变量的分布列和数学期望.
参考数据:若随机变量,则.
【题型4 概率与其它知识的交汇问题】
【例4】(2025·陕西安康·模拟预测)已知集合,从集合A的非空子集中任取两个集合,,则它们的交集为空集的概率为( )
A. B. C. D.
【变式4-1】(2025·湖南长沙·一模)已知一组数据0,9,7,4,5,从1到10中的整数里随机选择2个不同的数加入这组数据,则得到的新数据与原数据中位数相同的概率为( )
A. B. C. D.
【变式4-2】(2025·辽宁丹东·模拟预测)有5个相同的球,分别标有数字1,2,3,4,5.
(1)若任取出3个球,求1号球被取到的概率;
(2)从中有放回地随机取3次,每次取出1个球,记为这5个球中从未被取出的球的个数,求的分布列和数学期望.
【变式4-3】(24-25高二下·广东深圳·期末)是由中国杭州的公司开发的人工智能模型,其技术在多领域有着普惠应用.为提高的应用能力,某公司组织全体员工参加培训.培训结束之后,公司举行了一次专业知识比赛,比赛分为预赛与决赛,预赛通过后才能参加决赛预赛从8道题中随机抽取4道作答,答对3道及以上则进入决赛,否则被淘汰.
(1)若这8道题中甲能答对其中5道,计算甲进入决赛的概率;
(2)已知甲进入了决赛,决赛需要回答3道题目,若全部答对则获得一等奖,奖励300元;若答对2道题目则获得二等奖,奖励150元;若答对1道题目则获得三等奖,奖励50元;若全部答错则没有奖励.若甲答对每道题目的概率均为,且每次答题相互独立,设甲获得奖金为,求的分布列及数学期望.
【题型5 离散型随机变量与其他知识综合】
【例5】(2025·湖南郴州·一模)湘绣,是中国优秀的民族传统工艺之一,有着两千多年的历史.湘绣的制作工艺繁杂,一幅湘绣作品要经过设计图案和刺绣两大主要环节,且只有设计图案通过后才能进行刺绣,两个环节相互独立.只有同时通过这两个环节才能成为成品.某绣坊准备制作三幅不同的湘绣作品,已知三幅作品通过设计图案环节的概率依次为,通过刺绣环节的概率依次为.
(1)求三幅中恰有一幅作品通过设计图案环节的概率;
(2)若已知三幅中恰有一幅作品通过设计图案环节,求通过的作品为的概率;
(3)经过设计图案和刺绣两个环节后,三幅作品成为成品作品的件数为.求随机变量的分布列及数学期望.
【变式5-1】(2025·全国·模拟预测)已知某种业公司培育了新品种的橙子,现从某批次收获的果实中随机抽取了100个橙子(直径位于70mm至100mm之间)作为样本,统计得到如图所示的频率分布直方图.
(1)根据长期检测结果发现橙子直径服从正态分布,并将直径的橙子定为特级品.此批次样本橙子直径的标准差,用标准差作为的估计值,用样本平均数作为的近似值.现从该批次中任取一个,试估计该橙子为特级品的概率(保留小数点后两位数字);(同一组中的数据用该组区间的中点值代表)
(2)在样本中,从直径在区间,,上的橙子中利用按比例分配样本的分层抽样随机抽取7个橙子进行检测,再从中抽取3个橙子作进一步检测.记这3个橙子中直径在区间上的个数为,求的分布列与数学期望.
附参考数据:若随机变量服从正态分布,则,,.
【变式5-2】(2025·广东广州·三模)为减少环境污染,保护生态环境,某校进行了“垃圾分类知识普及活动”,并对高一、高二全体学生进行了相关知识测试.现从高一、高二各随机抽取了20名学生,对他们的成绩(百分制)进行了整理和分析后得到如下信息:
高一年级成绩分布表
成绩
人数
1
2
3
4
10
高二年级成绩频率分布直方图
(1)从高一和高二样本中各抽取一人,求这两人成绩都不低于90分的概率;
(2)用频率估计概率,分别从高一全体学生中抽取一人,从高二全体学生中抽取两人,随机变量表示这三人中成绩不低于90分的人数,求的分布列和数学期望.
【变式5-3】(25-26高三上·河北邢台·阶段练习)甲有两辆自行车,且每天都去体育馆锻炼.若甲去体育馆时,只要不下雨且家里有自己的自行车,他就会骑自行车过去.若甲回家时,只要不下雨且体育馆有自己的自行车,他就会骑自行车回家.其他情况下均走路去体育馆或回家.假设甲每天去体育馆时,回家时下雨的概率均为,不下雨的概率均为,且每次下雨与否互不影响.当前甲的自行车一辆在家里,一辆在体育馆.
(1)设甲第一天去体育馆锻炼回到家后,家中自行车的数量为,求的分布列与期望.
(2)设甲连续天去体育馆锻炼回到家后,家中自行车的数量为0,1的概率分别为,.
①求;
②证明:.
【题型6 回归分析与其他知识综合】
【例6】(2025·全国·模拟预测)某公司在5个月期间的广告支出x(万元)与销售额y(万元)的数据如下:
月份
1
2
3
4
5
广告支出x
2
4
5
8
11
销售额y
10
20
30
40
50
(1)从这5个月中随机抽取三个月份,记销售额高于30万元的月份的个数为X,求随机变量X的分布列及数学期望;
(2)求y关于x的线性回归方程,并预测广告支出为10万元时的销售额.
参考公式:,.
【变式6-1】(2025·山东·一模)某工厂的某生产车间2020年至2024年生产的年利润(百万元),统计数据如表所示:
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
年利润
2.8
3.4
3.6
4.4
4.8
(1)已知变量具有线性相关关系,求年利润(百万元)关于年份代号的经验回归方程,并预测2025年该车间的年利润;
(2)已知该工厂共有6个车间,根据每个车间的年利润分为“类车间”和“类车间”两类,其中“类车间”4个,“类车间”2个,现从这6个车间中任取3个车间,记随机变量为“类车间”的个数,求的分布列及其数学期望.
参考公式:,.
【变式6-2】(2025·河北邢台·三模)某学校为了解入学新生的身高情况,随机抽取了50名新生,测得他们的身高(单位:),并分成以下5组:,,,,,绘制成如图所示的频率分布直方图.
(1)补全频率分布直方图,并求出样本中学生身高的中位数.(保留小数点后两位)
(2)该学校体育教研室为了解身高是否在一定的范围内与参加弹跳运动时长有关,调研得到以下5组数据:
参加弹跳运动时长(单位:年)
1
2
3
4
5
身高(单位:)
158
162
166
170
184
表中的数据显示,与之间存在线性相关关系,试求出关于的回归方程.
附:回归直线中斜率和截距的最小二乘估计公式分别为,.
【变式6-3】(2025·四川绵阳·模拟预测)某汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入(亿元)与科技改造直接收益(亿元)的数据统计如下:
2
3
4
6
8
10
13
21
22
23
24
25
13
22
31
42
50
56
58
68.5
68
67.5
66
68
当时,建立了y与x的两个回归模型:模型①;模型②:;
(1)根据下列表格中的数据,比较当时模型①、②的相关指数,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为16亿元时的直接收益.
回归模型
模型①
模型②
回归方程
182.4
79.2
(附1:刻画回归效果的相关指数)
(2)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布,公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予鼓励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励4万元.求每台发动机获得奖励的分布列和数学期望.
(附2:随机变量服从正态分布,则,.)
【题型7 独立性检验与其他知识综合】
【例7】(2025·广东·模拟预测)为了研究生活习惯 M 与患有疾病N的关系,某疾控中心随机调查了其他条件都基本相同的340人,调查数据如表所示.
无习惯M者
有习惯M者
合计
没患疾病N者
120
160
280
患有疾病N者
15
45
60
合计
135
205
340
(1)根据小概率值的独立性检验,判断患有疾病N与有生活习惯M是否有关?
(2)常用表示在事件A发生的条件下事件B发生的优势,在统计中称为似然比.现从340人中任选一人,A表示“选到的人是有习惯M者”,B表示“选到的人患有疾病N者”,请利用样本数据,估计的值.
附:,
0.050
0.010
0.001
k
3.841
6.635
10.828
【变式7-1】(25-26高三上·江苏南通·阶段练习)为促进消费,扩大内需,江苏省体育局主办了年城市足球联赛,简称“苏超”.随着赛事的进行,引发全省乃至全国人民的关注,城市旅游人数显著提升.下表是比赛五个月来的某城市旅游人数(百万)与第个月的数据:
(月份)
(人数)
(1)已知可用线性回归模型拟合与的关系,请建立关于的线性回归方程;
(2)该市随机抽取了部分市民及游客,调查他们对赛事的关注情况,得到如下列联表:
性别
不关注赛事
关注赛事
男性
女性
请依据小概率值的独立性检验,能否认为关注“苏超”赛事与性别有关.
参考公式:,,其中.
【变式7-2】(2025·贵州·模拟预测)某车企为了调查新能源汽车的款式与买车的客户性别的关联性,调查了200名客户的购买情况,得到如下列联表:
性别
车型款式
合计
A款新能源汽车
B款新能源汽车
男性客户
90
120
女性客户
10
合计
200
(1)求出,的值.
(2)将上面列联表补充完整,依据小概率值的独立性检验,能否认为选购新能源汽车的款式与性别有关联?
(3)假设用样本估计总体,用频率估计概率,所有人选购新能源汽车的款式情况相互独立.若从购买者中随机抽取3人,设被抽取的3人中购买了A款新能源汽车的人数为X,求X的数学期望.
附:,.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式7-3】(25-26高三上·河北衡水·开学考试)林芝第二十一届桃花旅游文化节于2024年3月31日晚正式拉开帷幕.某研究小组为了了解开幕式文艺演出时林芝市民的观看情况,从全市随机调查了50名市民(男女各25名),统计到全程观看、部分观看和没有观看的人数如下表:
观看情况
全程观看
部分观看
没有观看
男性人数
9
4
女性人数
18
4
(1)求出表中x,y的值;
(2)从样本中没有观看的人中随机抽取2人进一步了解情况,求恰好男女各1人的概率;
(3)根据表中统计的数据,完成下面的2×2列联表,依据小概率值的独立性检验,分析全程观看是否与性别有关?
性别
观看情况
合计
全程观看
非全程观看
男性
女性
合计
附:,.
0.10
0.05
0.01
2.706
3.841
6.635
【题型8 概率、统计与数列的综合问题】
【例8】(2025·湖南常德·一模)从1,2,3,4,5,6,7这7个数任选3个不同数排成一个数列,则得到的数列为等差数列的概率为( )
A. B. C. D.
【变式8-1】(2025·四川·模拟预测)若随机变量的分布列如下表,表中数列是公比为2的等比数列,则( )
1
2
3
A. B. C. D.
【变式8-2】(2025·江苏宿迁·模拟预测)甲、乙两盒子中各有2枚形状、大小完全相同的棋子,一红一黄.称一次操作是从甲、乙盒中随机取出一枚棋子交换,记次操作后,甲、乙盒中仍各有一红一黄棋子的概率为.
(1)求的值.
(2)求数列的通项公式,并求使不等式成立的的最小值.
(3)若随机变量X服从两点分布,且,则 .记前次(即从第1次到第次交换)中甲、乙两盒中仍各有一红一黄棋子的次数为,求.
【变式8-3】(2025·湖南长沙·模拟预测)某中学国学小组共有个同学,分别编号为.在一次小组活动中,指导老师设计了两道问答题,并给出如下两个答题规则.
规则一:①第1号同学首先答第一题.②若第号同学答对第一题,则该生继续答第二题;若第号同学答错或不会答第一题,则由第号同学接替答第一题.③若第号同学答对第二题,则答题活动结束;若第号同学答错或不会答第二题,则由第号同学接替答第二题.④若答题轮到第号同学,则当该生遇到答错或不会答的情况时,答题活动也结束.
规则二:①,②同规则一.③若第号同学答对第二题,则答题活动结束;若第号同学答错或不会答第二题,则由第号同学接替答题,且重新从第一题开始作答.④同规则一.
假设每个同学答对第一题的概率都为,答对第二题的概率都为,且各同学的答题相互独立.
(1)若,且按规则一答题,当答题活动结束时,求答题人数不超过2人的概率;
(2)若,为使第3号同学答题后答题活动结束的概率较大,应选择哪个规则答题;
(3)若按规则二答题,记答题活动结束时参与答题的总人数为,证明:数列为等比数列.
一、单选题
1.(2025·天津宁河·模拟预测)下列说法中,正确的有( )
①回归直线恒过点,且至少过一个样本点:
②根据列列联表中的数据计算得出,而,则有的把握认为两个分类变量有关系,即有的可能性使得“两个分类变量有关系”的推断出现错误;
③在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好;
④某项测量结果服从正态分布,若,则
A.个 B.个 C.个 D.个
2.(2025·湖南湘潭·一模)跑步运动越来越受大众喜爱.据统计,某校有高一、高二、高三三个年级,这三个年级中喜欢跑步运动的教师分别占该年级教师人数的 40%,30%,35%,且这三个年级的教师人数之比为3:3:4,现从这三个年级中随机抽一名教师,则该教师喜欢跑步的概率为( )
A.0.35 B.0.32 C.0.45 D.0.36
3.(2025·海南·模拟预测)某次社会实践活动中,甲、乙两个班的同学共同在一个社区进行民意调查,参加活动的甲、乙两班的人数之比为,其中甲班的女生占,乙班中女生占.则该社区居民遇到一位进行民意调查的同学恰好是女生的概率为( )
A. B. C. D.
4.(2025·广东广州·模拟预测)某学校高三学生共有900人,其中男生500人,为获取该校高三学生的身高信息,现采用按性别比例分配的分层随机抽样的方法,抽取了容量为90的样本.计算得男生样本的身高均值为170,方差为19,女生样本的身高均值为161,方差为19,则下列说法正确的是( )
A.抽取男生的样本量为40
B.估计该校高三学生身高的均值为165
C.抽样时女生甲被抽到的概率为
D.估计该校高三学生身高的方差为19
5.(2025·湖南长沙·三模)已知某个群体中对某活动持满意态度的人数比例为,从该群体中随机抽取10人,设这10人中持满意态度的人数为,随机变量,则( )
A.1.8 B.3.6 C.4.2 D.4.8
6.(2025·江西新余·模拟预测)某品牌啤酒厂,进行市场调研,发现该品牌啤酒在某地的月销量随着每瓶啤酒的定价不同而发生变化,连续调研5个月得到的数据如下表所示:
第1个月
第2个月
第3个月
第4个月
第5个月
单价/元
6
6.5
7
7.5
8
销量/万瓶
90
85
80
75
70
根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程,则( )
A.相关系数 B.点一定在经验回归直线上
C. D.当每瓶啤酒为9.5元时,月销量一定为50万瓶
7.(2025·广东·模拟预测)一个盒子里有3个相同的球,分别标有数字2,3,4,若每次不放回地从盒子中随机取出一个球,直到取出的所有球的数字之积大于或等于8为止.记此时取出的所有球的数字之和为,则( )
A. B.7 C. D.6
8.(2025·全国·模拟预测)为了解某学校学生每周阅读课外书籍的数量,采用样本量比例分配的分层随机抽样方法.现抽取高一学生20人,其每周阅读课外书籍数量的均值为4本,方差为4;抽取高二学生30人,其每周阅读课外书籍数量的均值为3本,方差为2.则该学校高一、高二学生每周阅读课外书籍数量的总体均值和方差分别是( )
A.总体平均数为3.4本,总体方差为3.24 B.总体平均数为3.5本,总体方差为3.04
C.总体平均数为3.4本,总体方差为3.04 D.总体平均数为3.5本,总体方差为3.24
二、多选题
9.(2025·广东揭阳·模拟预测)为保护学生视力、促进学生身心健康发展,某中学研究型学习小组从该校学生中按男、女生比例,采用分层随机抽样的方法选取了100名学生(其中男生60人,女生40人),调查他们每日使用手机的时间.若每日使用手机时间超过40分钟,则认为该生手机成瘾.根据统计数据得到如图所示的等高堆积条形图,用样本估计总体,用频率估计概率,下列说法正确的有( )
附:.
0.1
0.01
0.001
2.706
6.635
10.828
A.该校男生和女生人数之比约为3:2
B.根据小概率值a=0.01的独立性检验,可以认为手机是否成瘾与学生性别有关
C.从该校学生中随机抽取一名学生,则该生手机成瘾的概率为
D.从该校学生中抽到一名手机成瘾的学生,则该生是男生的概率为
10.(2025·广西柳州·模拟预测)某人工智能公司近5年的利润情况如下表所示:
第年
1
2
3
4
5
利润/亿元
2
3
4
5
7
已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,则下列说法正确的是( )
A. B.变量与之间的线性相关系数
C.预测该人工智能公司第6年的利润约为7.8亿元 D.残差绝对值的最大值为0.4
11.(2025·广西北海·模拟预测)某班级有60%的学生报名参加了数学竞赛,40%的学生报名参加了物理竞赛.报名参加数学竞赛的学生中,有30%同时也报名参加了物理竞赛.从该班级中随机抽取一名学生,记事件为“该学生报名参加数学竞赛”,事件为“该学生报名参加物理竞赛”.则以下说法正确的是( )
A.事件和事件是独立事件 B.
C. D.
三、填空题
12.(2025·上海黄浦·三模)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人.
0.050
0.010
0.001
3.841
6.635
10.828
参考数据及公式如下:参考公式:,其中.
13.(2025·湖南长沙·模拟预测)某水泥厂流水线上生产的一批袋装水泥,其重量指标X(单位kg)可以看作一个随机变量,且,对于或的产品即为不合格,且,现从这批袋装水泥中随机抽取500袋,用Y表示这500袋水泥的重量指标X位于区间的袋数,则随机变量Y的方差是 .
14.(2025·甘肃白银·模拟预测)汤圆是汉族传统小吃的代表之一,同时也是中国的传统节日元宵节最具有特色的食物,表达了人民对幸福生活的一种向往和期盼.在广东省流行四式汤圆,这四式汤圆指的是四种不同的馅:绿豆、红豆、糖冬瓜、芋头,小王在今年元宵节时,盛了一碗(10个)汤圆,其中绿豆馅、红豆馅的汤圆各4个,糖冬瓜馅、芋头馅的各1个,则小王在碗里随机取的4个汤圆中,在吃到1个芋头馅的前提下,4个汤圆中恰有3种不同馅的概率为 .
四、解答题
15.(2025·广东·模拟预测)已知某企业加工某零件,根据长期检测结果,得知该企业生产的零件的质量指标值服从正态分布.现从该企业生产的零件中随机抽取100件,其质量指标值的样本数据统计情况如图所示.
(1)求这100件零件的质量指标值的样本平均数和样本方差.(同一组的数据用该组区间的中点值作代表)
(2)用这100件零件的质量指标值的样本平均数作为的估计值,样本标准差作为的估计值.若质量指标值在内的产品为优等品,根据正态分布,求该企业生产的产品为优等品的概率.
附:取,
,,.
16.(2025·宁夏石嘴山·模拟预测)现有甲、乙两名运动员进行乒乓球比赛(三局两胜制),其中每局中甲获胜的概率为,乙获胜的概率为,每局比赛都是相互独立的.
(1)求比赛只需打两局的概率;
(2)求甲在比赛中获胜的概率;
(3)已知甲在第一局比赛中获胜,求甲在比赛中获胜的概率.
17.(2025·湖南·模拟预测)近日,2025年湖南省城市足球联赛(被球迷称为“湘超”)如火如荼地进行,引发广泛关注.某地区随机抽取了部分市民,调查他们对赛事的关注情况,得到如下表格:
性别
不关注赛事
关注赛事
男性
25
150
女性
50
75
(1)列出列联表并根据小概率值的独立性检验,能否认为关注“湘超”赛事与性别有关?
(2)现从被调查的关注赛事的市民中,按照性别比例采用分层抽样的方法随机抽取3名市民参加“湘超”赛事知识问答.已知男性、女性市民顺利完成知识问答的概率分别为,,每个人是否顺利完成相互独立.求在有且仅有2人顺利完成的条件下,这2人的性别不同的概率.
附:.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
18.(2025·山西·三模)无人驾驶技术是汽车研发领域的一个重要方向.某学校技术俱乐部研发了一个感知路况障碍的小汽车模型,该模型通过三个传感器共同判断路段是否有路障.在对该模型进行测试中,该俱乐部同学寻找了80个不同的路段作为测试样本,数据如下表:
测试结果真实路况
传感器1
传感器2
传感器3
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
无障碍
4
15
1
1
15
4
8
12
0
有障碍
40
10
10
45
5
10
45
10
5
假设用频率估计概率,且三个传感器对路况的判断相互独立.
(1)从这80个路段中随机抽取一个路段,求传感器2对该路况判断正确的概率;
(2)从这80个路段中随机抽取一个无障碍的路段进行测试,设为传感器1和传感器2判断正确的总路段数,求的分布列和数学期望;
(3)现有一辆小汽车同时装载了以上3种传感器.在通过某路段时,只要3个传感器中一个判断有障碍或无法识别,则小汽车减速.那么是否可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于?(结论不要求证明)
19.(2025·甘肃武威·模拟预测)某高科技公司开发了一款AI学习机,为了解市场销售情况,该公司统计了过去5个月的月广告投入(单位:十万元)与该款学习机的月销量(单位:千台)的数据,如表所示.
月份代码
1
2
3
4
5
10
20
30
40
50
58
59
60
64
65
(1)求和的样本相关系数,并判断与是否具有较强的线性相关性;(结果精确到0.01,若,则认为与具有较强的线性相关性)
(2)求关于的经验回归方程,并估计月广告投入600万元时该款学习机的月销量;
(3)该款学习机目前售价为3000元/台,为提升销量,经销该款学习机的某专卖店针对该款学习机推出了两种促销方案.方案一:买一台立减400元;方案二:一次性购买两台可抽奖三次,每次中奖的概率均为,且每次抽奖相互独立,中奖一次立减600元/台,中奖两次立减800元/台,中奖三次立减1000元/台,若三次均未中奖,仍可享基础优惠300元/台.某家长准备在该店购买两台该款学习机,请从付款总金额数学期望的角度分析选哪种方案更优惠.
参考公式:对于经验回归方程,,;样本相关系数.
参考数据:,,.
2 / 30
学科网(北京)股份有限公司
$