内容正文:
专题12 概率统计(6大考点,49题)
6大考点概览
考点01用样本估计总体
考点02变量间的相关关系
考点03统计案例
考点04随机事件的概率
考点05古典概型
考点06随机变量及其分布
用样本估计总体
考点1
一、多选题
1.(25-26高三下·上海青浦·期中)下列说法中错误的是( )
A.平均数、众数和中位数都是描述一组数据的集中趋势的统计量
B.极差、方差、标准差都是描述一组数据的离散程度的统计量
C.一组数据中比中位数大的数和比中位数小的数一样多
D.总体的数据都分布在样本的极差范围内
【答案】CD
【详解】对于A,平均数、众数和中位数都是描述一组数据的集中趋势的量,所以A正确,
对于B,极差反映的是一组数据最大值与最小值的差,方差和标准差反映了数据分散程度的大小,
所以极差、方差、标准差都是描述一组数据的离散程度的统计量,故B正确,
对于C,取,这组数据的中位数是,比小的数有个,比大的有个,所以C错误,
对于D,样本的极差是数据最大值与最小值的差,是数值不是范围,
且总体数据通常不都在样本数据的最大值和最小值之间,故D错误.
二、填空题
2.(2026·上海黄浦·二模)如图是某班级30名学生某次数学测验的得分茎叶图(茎为十位,叶为个位),则这些测验分数的第80百分位数是______.
【答案】76
【分析】根据茎叶图结合百分位数的定义运算求解即可.
【详解】因为,可知第80百分位数是第24位数与25位数的平均数
由茎叶图可知数据的第24位数与25位数分别为75,77,
所以第80百分位数是.
3.(2026·上海普陀·二模)根据中国汽车工业协会发布的数据,年月至年月,我国新能源汽车月度销量(单位:万辆)为:,则这个月新能源汽车销量的中位数为______万辆.
【答案】
【分析】先将数据从小到大排列,再根据中位数的定义可得.
【详解】将年月至年月,我国新能源汽车月度销量按从小到大排列:
数据个数为,所以中位数是第个数,即万辆.
4.(2026·上海徐汇·二模)已知实数满足,则的方差的最大值为__________.
【答案】
【详解】设分别对应,().
则,
所以的方差为:
,
因为函数在上单调递减,在上单调递增,
且.
所以当或时,该组数据的方差相等,且取得最大值,为.
所以该组数据方差的最大值为:.
三、解答题
5.(2026·上海闵行·二模)某学校举办“乐动体育”比赛活动,高三年级共有50名学生报名参加“小球类项目”,其中参加乒乓球项目的有28人,参加羽毛球项目的有22人,赛前进行了一道比赛通用规则判断题测试,答对得5分,答错得0分,统计结果加下表:
乒乓球项目
羽毛球项目
答对人数
19
16
答错人数
9
6
根据上述数据,回答下列问题:
(1)求这50名学生的平均得分;
(2)从这50名学生中随机选取2人做裁判.设随机变量表示两名裁判的最高得分,求;
(3)是否有的把握认为该题的测试成绩与比赛项目有关?(附:)
【答案】(1)
(2)
(3)没有的把握认为测试成绩与比赛项目有关.
【分析】(1)由条件根据平均数定义求结论;
(2)确定的可能取值,求取各值的概率,结合期望定义求结论;
(3)提出零假设,计算,根据其值与临界值的关系判断结论.
【详解】(1)由题意,总答对人数为,
总得分为,
因此平均得分;
(2)学生得分只有分和分,因此最高得分的可能取值为;
因此,,
所以;
(3)列联表如下表:
答对
答错
合计
乒乓球
19
9
28
羽毛球
16
6
22
合计
35
15
50
零假设为:该题的测试成绩与比赛项目无关,
则,
因为,,
故接受假设,即认为没有95%的把握认为测试成绩与比赛项目有关.
6.(2026·上海长宁·二模)一次校内常规体检后,数学建模活动小组学生随机抽取了10名学生体重数据(单位:kg):55,58,62,74,88,68,54,52,56,86.
(1)求该组数据的极差和第25百分位数;
(2)依据体检数据,求得这10名学生体重(单位:kg)关于身高(单位:cm)的回归方程为,已知这10名学生身高(单位:cm)的平均数为176.3,求的值(精确到0.1)
(3)体重(kg)与身高(m)平方的比称为体重指标,体重指标不低于28.0称为肥胖,为了解该校学生肥胖是否与性别有关,从已获得数据中随机抽样得到了如下列联表.
男生
女生
总计
观察值
预期值
观察值
预期值
不肥胖
99
168
肥胖
总计
120
200
求表中的值.已知零假设为:肥胖与性别无关,计算男生肥胖人数的预期值(精确到0.1).
【答案】(1)36;55
(2)
(3);
【分析】(1)先将数据从小到大排列,进而最大值减最小值可得极差,利用求百分位数步骤可得第25百分位数;
(2)先求,将代入回归方程可求;
(3)根据列联表的性质可得,因肥胖与性别无关,故.
【详解】(1)将数据从小到大排列:52,54,55,56,58,62,68,74,86,88,
故极差,
因不为整数,故第25百分位数是第三个数为55.
(2),
因回归方程为过样本中心点,故,
得
(3)由列联表的性质,女生不肥胖人数为,女生人数总计,
所以,
男生肥胖的预期值.
7.(25-26高三下·上海浦东新·期中)某奶茶品牌为了解消费者对奶茶甜度的偏好情况,随机抽取了100名顾客进行甜度测试(分数越高表示越偏好甜味)、统计结果显示,所有顾客的甜度偏好分数均分布在区间内,具体数据见下表:
甜度偏好分数
人数
10
25
20
30
10
5
(1)估计该品牌奶茶消费者的平均甜度偏好分数(同一组数据用该区间的中点值作代表);
(2)在这100名顾客中,用分层抽样的方法从甜度偏好分数在、这两组中共抽取5人.再从这5人中随机抽取3人,记为3人中甜度偏好分数在的人数,求的分布、期望和方差;
(3)该奶茶品牌把甜度偏好分数在的消费者称“七分糖爱好者”.以样本估计总体、用频率代替概率,该品牌从某日消费人群中随机抽取12名消费者作为样本,记抽到k个“七分糖爱好者”的概率为,问当k为何值时最大?
【答案】(1)6.7
(2)
1
2
3
,
(3)
【分析】(1)根据平均数的概念,求出结果即可;
(2)根据超几何分布的概念,求出分布列,再根据期望和方差的概念,求出结果即可;
(3)根据二项分布的概念,求出概率的通式,进而列出不等式组,求出最大值即可.
【详解】(1)由题意,随机抽取的100名顾客的甜度偏好分数的平均数为
估计该品牌奶茶消费者的平均甜度偏好分数为6.7
(2)用分层抽样的方法,从甜度偏好分数在这组中抽取2人,甜度偏好分数在这组中抽取3人.
故,,
因此,X的分布列为
1
2
3
故,.
(3)由题,抽到“七分糖爱好者”的概率是0.4,
抽到“七分糖爱好者”的人数服从二项分布,即,,
则
当,即时
当,即时
因此,,且,
所以,当时,最大.
8.(2026·上海杨浦·二模)一次考试后,数学兴趣小组分析某班级考试成绩.该班级共40人,将得分由高到低平均分为四组,第一组(均分最高的一组)的数据为.
(1)求第一组的得分的均值与中位数;
(2)若从第一组中等可能的选取2名学生,求2人得分都在135分以上的概率;
(3)兴趣小组考察某客观题的得分情况.将前15名学生作为高分组,后25名学生作为非高分组;前15名学生中13人答对该题,后25名学生中16人答对该题.据此,填写表格,并判断是否有95%的把握认为答对该题与进入高分组有关?
附:,,,.
高分组
非高分组
总计
某客观题答对
某客观题答错
总计
【答案】(1)均值为,中位数为;
(2)
(3)答案见解析,没有95%的把握认为答对该题与进入高分组有关.
【分析】(1)利用平均数和中位数的概念即可求解;
(2)利用古典概型及组合数即可求解概率;
(3)利用独立性检验规则即可求解.
【详解】(1)第一组共10个数据的均值为:,
第一组共10个数据按从低到高排序:,
中位数为第5、6个数的平均值,即,
所以第一组的得分均值为,中位数为;
(2)第一组中,得分在135分以上的共有3人,从10人中任选2人:
总选法数:,
两人都在135分以上的选法数:,
所以2人得分都在135分以上的概率为:;
(3)根据题意填写列联表:
高分组
非高分组
总计
答对
13
16
29
答错
2
9
11
总计
15
25
40
零假设:认为答对该题与进入高分组无关,
计算卡方:
根据独立性检验规则,可知没有95%的把握认为答对该题与进入高分组有关.
9.(2026·上海普陀·二模)2016-2025年全国普通高中生均经费(单位:元)如下表所示:
年份
生均经费
年份
生均经费
年全国两会明确,“十五五”(年)期间将深入实施县域普通高中振兴计划,持续增加普通高中生均经费的投入与学位供给.
(1)设上表中年生均经费的平均数为,现从这个数据中不放回地随机抽取两个不同的数据,已知抽取的两个数据中至少有一个低于,求两个数据都低于的概率;
(2)在评估不同发展阶段的投入稳定性时,不仅看波动幅度,还需考虑增长基数,统计学中常用变异系数()来衡量相对自身水平的波动程度.将作为阶段,作为阶段,分别计算、两阶段生均经费的标准差和变异系数(结果均精确到),根据计算结果,你认为哪个阶段的投入更稳定;
(3)教育经济学研究显示,生均经费每增长,可带动学位供给增长;而学位供给每增长,可带动毛入学率约增长.已知年全国高中阶段毛入学率为,“十五五”规划目标是在此基础上再提升个百分点,根据预算报告,预计“十五五”期间生均经费年增长率可保持.请据此预测年全国高中阶段毛入学率,并判断的增速能否支撑规划目标的实现.
【答案】(1)
(2)阶段的投入更稳定
(3)年全国高中阶段毛入学率约为,能支撑
【分析】(1)记事件抽取的两个数据中至少有一个低于,事件抽取的两个数据都低于,分析可知,利用组合计数原理、古典概型的概率公式以及条件概率公式可求得的值;
(2)计算、两个阶段的变异系数,比较大小后可得出结论;
(3)根据题中信息可计算出年的毛入学增长率,由此可求出年的毛入学增长率,结合题意可得出结论.
【详解】(1)由表格中的数据可得,
记事件抽取的两个数据中至少有一个低于,事件抽取的两个数据都低于,
表格中的个数据,其中小于的数据有个,大于的数据有个,
则,,
由题意可知,由条件概率公式可得,
所以,已知抽取的两个数据中至少有一个低于,则这两个数据都低于的概率为.
(2)对于阶段,生均经费的平均数为,
标准差为
,
变异系数为,
对于阶段,生均经费的平均数为,
标准差为
,
变异系数为,
所以,故阶段的投入更稳定.
(3)年毛入学率年增长率为,
故年的毛入学率为
故的增速能支撑.
10.(2026·上海松江·模拟预测)质监部门从某超市销售的甲、乙两种食用油中各随机抽取100桶检测某项质量指标,由检测结果得到如下的频率分布直方图:
(1)写出频率分布直方图(甲)中的值;记甲、乙两种食用油100桶样本的质量指标的方差分别为,试比较与的大小(只要求写出结果);
(2)在甲、乙两种食用油中各随机抽取1桶,用频率估计概率,求恰有1桶的质量指标大于10且小于40的概率;
(3)由频率分布直方图可以认为,乙种食用油的质量指标值Z服从正态分布.其中近似为样本平均数近似为样本方差,现从乙种食用油中随机抽取10桶,设X表示质量指标值位于的桶数,求X的数学期望.(结果保留两位小数)
注:①同一组数据用该区间的中点值作代表;②若,则.
【答案】(1),
(2)
(3)
【分析】(1)根据矩形的面积和等于列出关于的方程,进而求出的值,再根据频率分布直方图中甲、乙食用油样本质量指标的波动程度,进而比较方差大小.
(2)分别求出在甲、乙两种食用油中抽取1桶,其质量指标位于的概率,然后求出恰有1桶食用油指标位于的概率.
(3)先根据频率分布直方图求出,然后求出从乙种食用油中随机抽取1桶,其质量指标位于的概率,最后根据二项分布的期望公式计算的数学期望.
【详解】(1)由题意,解得.
由频率分布直方图可得.
(2)记事件在甲种食用油中抽取1桶,其质量指标大于且小于.
记事件在乙种食用油中抽取1桶,其质量指标大于且小于.
记事件在甲、乙两种食用油中各随机抽取1桶,恰有1桶其质量指标大于且小于.
则,.
.
(3)由题意.
,又.
,
现从乙种食用油中随机抽取10桶,其质量指标位于的概率为.
,
11.(2026·上海金山·二模)绝对零度()是一个只能逼近而不能达到的最低温度,那么这个数据是如何测得的?吕同学通过查询资料,知道:①气体温度和气体压强存在线性关系;②当气体压强为0()时,气体温度达到绝对零度.以下是吕同学在一次模拟实验时,测得某种气体温度和气体压强的相关数据:
数据
1
2
3
4
5
6
温度()
4.07
16.69
29.42
45.67
57.06
73.05
压强()
103.095
107.734
112.461
118.469
122.706
128.758
(1)求该模拟实验中,该气体温度的平均值和方差;(精确到0.01)
(2)若该次实验下气体压强关于气体温度的回归方程为,预估该次实验下绝对零度的数值;(精确到0.01)
(3)为了验证实验的普适性,吕同学利用不同气体预估绝对零度,得到如下的一组数据.若任取其中的2个数据,求该两个数据与绝对零度()的误差均小于1的概率.
绝对零度()
275.13
274.56
274.28
273.57
272.45
271.67
【答案】(1)℃,
(2)℃
(3)
【分析】(1)根据平均值、方差的定义计算即可得解;
(2)求出,代入回归方程求出,令,即可求解;
(3)根据古典概型求解即可.
【详解】(1)(),
.
(2),
将,即代入,
解得,所以回归方程为,
令,解得(),
预估该次实验下绝对零度的数值为.
(3)因为,,
,,
,,
所以只有,两个数据与绝对零度()的误差小于1,
所以
变量间的相关关系
考点2
一、单选题
12.(25-26高三下·上海浦东新·期中)某校学生会体育部长依据本校高三男生的身高(单位:)与体重(单位:)的抽样数据,运用电子办公软件求出了“体重”(y)关于“身高”(x)的回归方程,则该回归方程( )
A.表示x与y之间的函数关系 B.表示x与y之间的不确定关系
C.反映x与y之间的真实关系 D.反映x与y之间的真实关系的一种最佳拟合
【答案】D
【详解】根据线性回归方程的概念可知,回归方程反映x与y之间的真实关系的一种最佳拟合.
13.(2026·上海嘉定·二模)生物学家在研究动物体重W(单位:g)与脉搏率f(单位:次)的关系时,获得了右表的数据,令,,并拟合线性回归方程.根据已知数据,下列说法正确的是( )
动物名
体重
脉搏率f/(次)
鼠
25
670
豚鼠
300
300
兔
2000
205
小狗
5000
120
大狗
30000
85
羊
50000
70
马
450000
38
A.变量x与y成正相关,且 B.变量x与y成负相关,且
C.变量x与y成正相关,且 D.变量x与y成负相关,且
【答案】D
【分析】由表格数据变化情况可得与负相关,然后由可判断的符号.
【详解】由表格数据可得随着动物体重增加,脉搏率逐渐减小,即随着增加,逐渐减小.
又函数在上单调递增,则随着增加,逐渐减小,
从而与负相关,.注意到,
又由题可得,结合,
可得.
14.(2026·上海闵行·二模)以下是由变量与所绘制的散点图,则它们的线性相关程度较高且正相关的是( )
A. B.
C. D.
【答案】D
【详解】对于A:散点杂乱无章,无规律可言,看不出两个变量有什么相关性;故A错误;
对于B:两个变量不具有线性相关性,故B错误;
对于C:两个变量之间的关系为负相关关系;故C错误;
对于D:两个变量之间的关系为正相关关系,且散点图中的点分布在一条直线附近,线性相关程度较高;故D正确.
二、填空题
15.(2026·上海普陀·二模)某大型管线网的局部呈网格结构,如图建立平面直角坐标系,一小型机器人沿管线移动执行巡检任务,在某次巡检的路径中经过了点:、、、、、、,若该机器人经过的点的纵坐标关于横坐标的一元线性回归方程是,则的值为______.
【答案】
【分析】求出样本的中心点,根据一元线性回归方程必经过中心点即可求解.
【详解】根据题意,机器人经过的个点的横坐标分别为,
其平均值为,
个点的纵坐标分别为,其平均值为,
又因为这些点的一元线性回归方程是,必过点,
代入得,即的值为.
三、解答题
16.(2026·上海·二模)班主任小明查阅了某大学发表的一项本市高三学生手机使用情况的研究报告.报告指出,高三学生每周手机使用时长(单位:小时)总体上服从正态分布.
(1)小明老师将自己所带班级(共50名学生)视为从本市高三学生总体中随机抽取的一个样本,能以此正态分布模型估算出全班每周平均手机使用时长超过16小时的人数,在此估算基础上若在全班任选3位同学,则至少有2位同学的每周手机使用时长超过16小时的概率是多少?(结果用最简分数表示)
参考数据:若,则.
(2)小明老师发现小虹同学每周手机使用时长超过16小时,对其进行疏导劝解,并跟进统计出之后5周小虹每周手机使用时长与该周数学练习得分(每周练习的难度相同且满分均为150分),制成表1.以这5组数据建立回归方程.请求出实数的值
表1
第1周
第2周
第3周
第4周
第5周
手机使用时长
20
18
22
16
14
练习得分
80
88
73
92
m
(3)受到鼓励的小虹制定了寒假复习计划表递交给小明老师,严格控制手机使用时长.小明老师统计发现该计划表中若第n天能复习时长超过5小时(记为“高效复习”),则第天也能“高效复习”的概率为;若第天不能“高效复习”,则第天还能“高效复习”的概率为.设(,为正整数)表示第天能“高效复习”的概率,,若表示复习计划表第天有效.求证:数列是等比数列,并说明小虹的该复习计划表是否在寒假每一天均有效.
【答案】(1)
(2)100
(3)答案见解析
【分析】(1)根据正态分布的性质和概率相关知识计算即可.
(2)先求出的平均值,然后代入回归方程即可求出结果.
(3)先根据题意列出递推式,然后证明数列是以为公比的等比数列,进而可根据等比数列的通项公式求出,并根据的范围证明结论即可.
【详解】(1)由题意知,因为.
所以任取1人使用手机超过16小时的概率为,
50名同学中有位超过16小时,
那么至少2位同学使用手机超过16小时的概率为.
(2)由题意得,.
代入回归方程有,解得.
(3)证明:由题意知,
所以
所以是以为公比的等比数列.
所以.
因为时,恒成立,所以.
所以小虹的该复习计划表在寒假每一天均有效.
17.(2026·上海静安·二模)下表是某品牌净化器的年销售量与年份的统计表.
年份
2021
2022
2023
2024
2025
年份代码x
1
2
3
4
5
年销售量у(万台)
2
3.5
2.5
8
9
(1)用计算器计算净化器的年销售量y关于年份代码x的线性回归方程;(回归系数计算结果保留两位小数)
(2)为了调查A、B两地区人群对该品牌净化器的了解情况,调查机构在A、B两地区的人群中分别进行品牌知晓情况的问卷调查.统计知晓与不知晓的人数,得到如下2×2列联表.
知晓
不知晓
合计
A地区
80
20
100
B地区
40
60
100
合计
120
80
200
试根据表中数据判断A、B两地区的人群对该品牌净化器的知晓情况是否有显著差异.(规定显著水平)
附:关于回归方程,回归系数的计算公式,其中为样本点的中心;的计算公式;
0.05
0.01
0.001
k
3.841
6.635
10.828
【答案】(1)
(2)在犯错误的概率不超过0.05 的前提下,认为A、B两地区的人群对该品牌净化的知晓情况有显著差异
【分析】(1)计算出样本中心以及回归系数和,即可求解;
(2)利用列联表中的数据,代入公式计算观测值,并与临界值3.841进行比较,从而判断两个分类变量是否有关.
【详解】(1)由表可知,样本中心 为:
.
.则 .
所以,净化器的年销售量 关于年份代码 的线性回归方程为:.
(2)根据 列联表中的数据,计算 的观测值:
.
因为 ,
所以,在犯错误的概率不超过 0.05 的前提下,认为 A、B 两地区的人群对该品牌净化器的知晓情况有显著差异.
18.(2026·上海奉贤·二模)某工厂生产的某种产品的月产量(单位:千件)与单位成本(单位:元/件)的数据如下:
月份
产量(千件)
单位成本(元/件)
1
2
73
2
3
72
3
4
71
4
3
73
5
4
69
6
5
68
(1)计算产量与单位成本的相关系数(无需过程);
(2)建立产量与单位成本的回归方程(写出必要的过程):
(3)若该工厂计划7月份生产7千件该产品,则单位成本预计是多少?
附:相关系数的计算公式:;
回归系数计算公式:,
【答案】(1)
(2)
(3)元/件
【详解】(1)根据相关系数的公式,
由表格数据可得,,,
,,
于是.
(2)设回归直线方程为,
根据公式可得,
,
故回归直线方程为;
(3)根据(2)可知,,
当时,,
所以预计成本是元/件.
统计案例
考点3
一、填空题
19.(2026·上海·二模)某工厂为判断两种不同的操作方法是否对生产某种零件的合格个数有影响,收集了相关数据,绘制了列联表,设原假设:两种不同的操作方法对生产该种零件的合格个数没有影响,计算出统计量,已知,则在显著性水平下,推断的结论为________.(用“拒绝”或“接受”填空)
【答案】拒绝
【详解】在独立性检验中,当计算出的统计量大于给定显著性水平对应的临界值时,样本数据出现的概率小于,
属于小概率事件,根据小概率原理,我们拒绝原假设,认为两个变量之间存在显著关联,
本题中,所以拒绝,即认为两种操作方法对合格个数有影响.
二、解答题
20.(2026·上海崇明·二模)2025年11月,教育部等五部门联合印发《关于实施学生体质强健计划的意见》,明确要求“中小学生每天综合体育活动时间不少于2小时”.某学校为了解政策落实情况及其对学生视力的影响,随机抽取了100名学生进行每周累计体育活动时长的调查,得到如下频率分布表:
每周活动总时长(单位:时)
频率
0.15
0.25
0.35
0.15
0.1
同时,对这100名学生的视力进行了检查,将视力达到5.0及以上定为“视力良好”,低于5.0定为“视力一般”,得到如下2×2列联表(部分数据缺失):
视力良好
视力一般
合计
活动时间达标(不少于14小时)
40
活动时间未达标(低于14小时)
30
合计
100
(1)从活动时长在和的学生中,按比例分层随机抽样抽取5人进行座谈.若从这5人中随机抽取2人,设为抽取的2人中活动时长在的人数,求的分布列和数学期望;
(2)依据的独立性检验,判断是否有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
参考公式及数据:
①,其中.
②,,,.
【答案】(1)
0
1
2
(2)有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
【分析】(1)通过按比例分层随机抽样确定5人各有几人来自和,再确定的可能取值,求得相应概率即可求解;
(2)先补全列联表,求得相应,再对比数据即可求解.
【详解】(1)由于和频率分别为,,
则按比例分层随机抽样,抽取5人进行座谈,有3人来自,2人来自,
由题意的可能取值为0,1,2,
,
,
,
所以的分布列是:
0
1
2
.
(2)由题意活动时间达标人数为,
活动时间未达标人数为,
故列联表如下:
视力良好
视力一般
合计
活动时间达标(不少于14小时)
40
20
60
活动时间未达标(低于14小时)
10
30
40
合计
50
50
100
零假设:“视力情况”与“体育活动时长是否达标”无关.
根据列联表数据,计算,
根据小概率值的独立性检验,判断不成立,
所以有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
21.(2026·上海徐汇·二模)为落实《全民健身条例》,某区体育局对本区居民的健身场所选择偏好进行调研.数据显示,居民主要选择商业健身场馆(如健身房、体育中心)和社区公共运动场(如小区健身点、街心公园)两类场所.为了解年龄因素是否影响健身场所的选择,研究人员将成年居民分为青壮年组(岁且岁)和中老年组(岁),从该区随机抽取170名成年居民进行调查,得到如下不完整的列联表:
青壮年
中老年
合计
商业健身场馆
60
社区公共运动场
50
合计
80
170
(1)请补充列联表,并根据表中数据判断能否有的把握认为年龄与居民健身场所的选择有关;
(2)用分层抽样的方式从选择社区公共运动场的居民中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
参考公式及数据:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,有95%的把握认为年龄与健身场所选择有关
(2)的分布见解析,数学期望为(或约)
【分析】(1)先补全 2×2 列联表,再代入卡方独立性检验公式计算统计量,与 95% 置信度临界值比较,判断年龄与健身场所选择是否有关联;
(2)先按分层抽样确定抽取的青壮、中老年人数,再用超几何分布计算随机变量 X 的各取值概率,列出分布列并代入期望公式求数学期望.
【详解】(1)根据已知数据计算空缺值,得到完整列联表如下:
青壮年
中老年
合计
商业健身场馆
60
40
100
社区公共运动场
20
50
70
合计
80
90
170
因为,
因此有95%的把握认为年龄与居民健身场所的选择有关.
(2)选择社区公共运动场的居民共70人,其中青壮年20人、中老年50人,抽样比为,
因此抽取的样本中青壮年人数:,中老年人数:.
设抽取的7人中中老年人数为,则青壮年人数为,.
因为青壮年共4人,故,解得,又,
因此,对应的可能取值为.
总情况数为,
(对应或)时,,
(对应)时,,
(对应)时,,
(对应)时,,
因此,的分布列为:
1
3
5
7
所以
22.(25-26高三下·上海宝山·期中)为调查大学数学专业的学生对中华优秀传统文化的了解情况,现对某大学的数学专业学生进行抽样调查.已知被调查的男、女生人数均为(为正整数),得到以下列联表:
(1)调查结果显示有的把握认为该校学生对中华优秀传统文化的了解与性别有关,但没有的把握认为该校学生对中华优秀传统文化的了解与性别有关,求的值;
(2)当时,采用分层抽样的方式在“了解中华优秀传统文化”的学生中抽取10人.
①从这10人中随机抽取3人进行第二次调查,在第二次调查中,已知至少有2名女生被抽到,求抽到男生的概率;
②在“不了解中华优秀传统文化”的男生中再随机抽取人,然后从这人中随机抽取2人.用随机变量表示抽到“了解中华优秀传统文化”的女生人数,若随机变量的数学期望值不小于,求的最大值.
男生
女生
合计
了解
不了解
合计
参考公式:,其中.
参考数据:
0.05
0.025
0.010
0.005
3.841
5.024
6.635
7.879
【答案】(1)
(2)①;②
【分析】(1)完善列联表,根据的计算可得出关于的等式,即可解得正整数的值,结合临界值表可得出结论;
(2)①分析可知,抽取的这10男生的人数为6女生的人数为4,利用条件概率公式可求得所求事件的概率;
②随机变量的取值为:,求出期望再解不等式.
【详解】(1)被调查的男女生人数均为,其中男生中不了解的有,则了解的有,
其中女生中了解的有,则不了解的有,
则可得列联表如下所示:
男生
女生
合计
了解
不了解
合计
因,
由题意,可知,又,可得;
(2)①当时,了解中华优秀传统文化的男生有人,女生有人,
则采用分层抽样时,在男生中抽取人,女生中抽取人,
再从这10人中随机抽取3人进行第二次调查,
记“至少有2名女生被抽到”为事件A,“抽到男生”为事件B,
则;
②根据题意可知这人中有4人是了解中华优秀传统文化的女生,
随机抽取2人,随机变量的取值为,
,
则,
依题意,由,解得,
所以的最大值为.
随机事件的概率
考点4
一、单选题
23.(2026·上海松江·模拟预测)一个袋中有大小与质地完全相同的红、黄、蓝三个球,从袋中依次随机不放回地摸出两个球,记“第一次取到红球”为事件A,“第二次取到黄球”为事件,则( )
A.A,B相互独立 B.
C. D.
【答案】C
【分析】根据给定条件,利用相互独立事件的定义判断A;利用条件概率公式,结合古典概率计算判断BCD.
【详解】对于A,,,A,B不独立,A错误;
对于B,,B错误;
对于C,,C正确;
对于D,,则,D错误.
24.(2026·上海静安·二模)袋子里装有四枚围棋子,其中两枚黑色棋子、两枚白色棋子,从中随机取出两枚棋子,那么互斥而不对立的事件是( ).
A.“至多有一枚白色棋子”与“至多有一枚黑色棋子”
B.“至多有一枚白色棋子”与“都是黑色棋子”
C.“恰好有一枚白色棋子”与“都是黑色棋子”
D.“至多有一枚白色棋子”与“都是白色棋子”
【答案】C
【分析】利用对立事件、互斥事件的定义判断即可.
【详解】记随机取出两枚棋子,均为黑色棋子为事件,一枚黑色棋子、一枚白色棋子为事件,均为白色棋子为事件.
对于A:“至多有一枚白色棋子”包含事件、事件,“至多有一枚黑色棋子” 包含事件、事件.
两个事件都包含事件,能同时发生,不是互斥事件.A不满足.
对于B:“至多有一枚白色棋子”包含事件、事件,“都是黑色棋子”为事件.
两个事件都包含事件,能同时发生,不是互斥事件.B不满足.
对于C:“恰好有一枚白色棋子”为事件,“都是黑色棋子”为事件.
两个事件不能同时发生,且并集不是全集(缺少事件),是互斥而不对立事件.C满足.
对于D:“至多有一枚白色棋子”包含事件、事件,“都是白色棋子”为事件.
两个事件不能同时发生,且并集是全集,是对立事件.D不满足.
25.(2026·上海杨浦·二模)事件、相互独立,若,,则A与同时发生的概率为( ).
A.0 B. C. D.
【答案】D
【分析】根据独立事件和对立事件概率公式求解即可.
【详解】事件、相互独立,则事件、也相互独立.
事件发生的概率为.
则A与同时发生的概率为.
二、填空题
26.(2026·上海徐汇·二模)设是一个随机试验中的两个事件,且,则__________.
【答案】
【分析】根据给定的条件,利用对立事件的概率公式,以及全概率公式,列出方程,即可求解.
【详解】由,可得,且,
则,可得,
即,可得.
27.(2026·上海闵行·二模)已知事件发生的概率,事件发生的概率,若事件与独立,则______.
【答案】
【详解】因为事件与独立,事件发生的概率,事件发生的概率,
.
28.(2026·上海黄浦·二模)某射击社团共有10名成员,其中社长与副社长各一人,现随机抽取4人组成代表队参加校际联谊活动,则社长与副社长两人至少有一人参加联谊活动的概率为______.
【答案】
【分析】设相应事件,根据古典概型结合组合数可得,结合对立事件概率公式求解.
【详解】设“社长与副社长两人至少有一人参加联谊活动”为事件A,
则事件为社长与副社长两人均不参加联谊活动,
则,可得,
所以社长与副社长两人至少有一人参加联谊活动的概率为.
古典概型
考点5
一、单选题
29.(2026·上海金山·二模)已知全集是一个六元集合,任取的两个子集、(、可以相等),记事件;记事件.则( )
A. B. C. D.
【答案】C
【分析】分析基本事件空间所含基本事件的个数,事件及所含基本事件个数,再由和事件的概率公式求解.
【详解】因为全集是一个六元集合,所以任取的两个子集、,能形成对集合,即基本事件总数为.
中任一元素,满足事件,有以下三种情况,且;所以所含基本事件个数;
中任一元素满足事件,有以下三种情况,
且;所以所含基本事件个数为,
事件表示且同时成立,所以,此时可以是的任意子集,有个,即事件所含基本事件有个,
所以.
30.(2026·上海普陀·二模)某科技公司每位员工皆佩戴红色或蓝色中仅一种颜色的工牌,该公司为促进跨部门协作,采用智能轮岗系统进行员工交换部门,初始时,甲部门有2名红色工牌员工、1名蓝色工牌员工,乙部门有2名红色工牌员工、2名蓝色工牌员工,系统执行一次随机交换指令:从甲、乙2个部门中随机各选取1名员工进行交换,设交换后甲部门中红色工牌员工的人数为,则的期望为( )
A. B. C. D.
【答案】C
【分析】交换后甲部门红人数的变化取决于从甲选出的员工和从乙选出的员工颜色,分四种情况:甲出红、乙出红;甲出红、乙出蓝;甲出蓝、乙出红;甲出蓝、乙出蓝,由此得分布列,随即可计算期望.
【详解】初始时,甲部门有2名红色工牌员工、1名蓝色工牌员工,乙部门有2名红色工牌员工、2名蓝色工牌员工,
由已知的可能取值为,,.
,,,
所以.
二、填空题
31.(2026·上海嘉定·二模)已知正四面体上的四个面上分别写有1、2、3、4,游戏中甲、乙轮流抛掷该四面体,谁抛出底面数字等于4则获胜且游戏结束.甲先开始,则甲获胜的概率为___________.
【答案】
【分析】根据题意,求出甲在第(奇数)次获胜的概率,再由等比数列求和得解.
【详解】由题意,甲抛掷一次获胜的概率为,失败的概率为,
甲胜的概率分为无数种情况:第次掷获胜,第次掷获胜,,第次获胜,,
概率分别为,,
故为以为首项,为公比的等比数列,
故甲获胜的概率.
32.(25-26高三下·上海浦东新·期中)一个家庭有两个孩子,生肖均为十二生肖之一(等可能).已知其中一个孩子属马,则另一个孩子也属马的概率为________.
【答案】
【详解】两个孩子的生肖组合有种,
记事件A“其中一个孩子属马”,事件B“两个孩子都属马”,
则,,
所以.
33.(2026·上海奉贤·二模)从6名男生和4名女生中选出3人参加人工智能技能培训.设事件至少抽到一名女生,事件恰好抽到一名男生,则________.
【答案】/
【分析】利用古典概型的概率公式求出,,再由条件概率公式计算可得.
【详解】依题意可得,,
所以.
34.(2026·上海长宁·二模)将4个不同的小球依次随机投入3个篮子中,每个篮子不空的概率为______(用分数表示).
【答案】
【分析】利用分组分配法与古典概型概率公式计算即得.
【详解】4个不同的小球依次随机投入3个篮子,每个小球均有3种投法,故总投法数为种;
要求每个篮子不空,需使其中一个篮子放2个球,另两个篮子各放1个球,故有投法数为种.
由古典概型概率公式,可得概率为:.
随机变量及其分布
考点6
一、单选题
35.(2026·上海徐汇·二模)已知甲、乙两班在某次数学测验中成绩近似服从正态分布,甲班成绩,乙班成绩,其密度曲线如图所示,则有( )
A.且
B.且
C.
D.
【答案】C
【详解】正态密度曲线关于对称,对称轴位置对应均值;且越大,曲线越矮胖,越小曲线越瘦高
从图中可知:的对称轴为,的对称轴为,因此;曲线更矮胖,因此,故选项A、B错误;
由正态分布的对称性:,,C正确;
,而,所以,因此,D错误
36.(2026·上海长宁·二模)对于随机事件、,,“”是“、互相独立”的( )条件.
A.充分非必要 B.必要非充分 C.充要 D.非充分非必要
【答案】C
【分析】根据条件概率公式、独立事件的定义及充分条件、必要条件的定义判断即可.
【详解】因为,又,所以,
从而有,所以、互相独立,充分性成立;
当、互相独立时,则,所以,必要性成立.
综上,“”是“、互相独立”的充要条件.
37.(2026·上海·二模)已知和分别表示事件和事件发生的概率,且 ,则在下列各项中,“和独立”的充分条件是( ).
A. B.
C. D.
【答案】B
【分析】事件和独立的定义是,根据每个选项的条件,结合条件概率公式以及概率的基本性质,判断是否能推出.
【详解】选项A,,则,并不能推出,所以事件和不一定独立,A错误.
选项B,,,.
,.
.
,即和独立,B选项正确.
选项C,,又,,和不一定独立,C错误.
选项D,,,.
又,,可得,也不能推出和独立,D错误.
二、填空题
38.(2026·上海·二模)将二项展开式中的各项等可能地随机重新排列,观察排列中是否存在系数为负数的项相邻,若存在,则记随机变量,否则记,则________.
【答案】/
【详解】二项式的通项公式为,
显然该二项式展开共有项,
当时,即第项系数为负数,
因为各项等可能地随机重新排列,
所以排列数为,
系数为负数的项相邻的排列数为,
所以,
因此.
39.(25-26高三下·上海青浦·期中)某电子元件厂有甲、乙两条互不影响的生产线生产同型号元件,甲生产线的产量占全厂总产量的 ,其产品次品率为 ;乙生产线的产量占全厂总产量的 ,其产品次品率为 .若从全厂产品中随机抽取 1 件,抽到次品的概率为_______.
【答案】/
【详解】设抽到的产品来自甲生产线为事件,来自乙生产线为事件,抽到次品为事件,
则,
所以
40.(2026·上海杨浦·二模)已知随机变量服从二项分布,若,则______.
【答案】
【分析】借助二项分布的期望与方差公式计算即可得.
【详解】,则,则.
41.(2026·上海静安·二模)某汽车制造厂生产一种用于发动机的活塞销,其设计标准直径为.根据长期生产数据,该活塞销的实际直径服从正态分布,方差为.规定:活塞销的直径在到之间为合格品.随机抽取一个活塞销,其为合格品的概率是______.(结果保留三位小数)
参考数据:若随机变量,则,,.
【答案】0.954
【详解】依题意,活塞销的直径,,
因此,
所以随机抽取一个活塞销,其为合格品的概率是0.954
42.(2026·上海长宁·二模)已知随机变量的分布为
则的期望为________.
【答案】
【分析】直接根据分布列求离散型随机变量的期望可得.
【详解】因为随机变量的分布为
所以.
43.(2026·上海静安·二模)现有两个罐子,都放有3个球,这些球除颜色外,大小与质地都相同,A罐中放有2个红球,1个白球,B罐中放有3个红球,从两个罐子中各摸出1个球并交换,这样交换2次后,白球还在A罐子中的概率是______.
【答案】
【详解】用分别表示交换1次,2次后白球还在A罐中的事件,
依题意,,,,
由全概率公式得,
所以交换2次后,白球还在A罐子中的概率是.
44.(2026·上海金山·二模)已知随机变量的分布为,则期望__________.
【答案】2
【详解】由,解得,
所以.
45.(2026·上海奉贤·二模)某食品厂生产一种零食,该种零食每袋的质量X(单位:g)服从正态分布,记作.规定:这种零食的质量在62.8~69.4g之间的为合格品;则这种零食的合格率为________.(结果精确到0.001);
参考数据:若,则,,.
【答案】
【详解】因为零食每袋的质量X(单位:g)服从正态分布,
所以
.
46.(25-26高三下·上海宝山·期中)已知随机变量,且,那么__________.
【答案】
【详解】由可知,正态曲线关于直线对称.
因为和关于对称,所以.
已知,故.
47.(25-26高三下·上海浦东新·期中)某校高中三年级600名学生参加了区质量检测,已知数学检测成绩X服从正态分布(试卷满分为150分).统计结果显示,数学检测成绩介于80分到120分之间的人数为450名,则此次检测中成绩不低于120分的学生人数约为总人数的________(精确到0.1%).
【答案】12.5%
【详解】由可知,正态分布曲线对称轴为,
可知,
所以,可得,即成绩不低于120分的学生人数约为总人数的12.5%.
三、解答题
48.(2026·上海嘉定·二模)某款足球机器人射点球时,射门点与球门中心的水平偏差(单位:)服从正态分布.在正常状态下,偏差,规定为“严重失误”.
(1)求一次射门出现严重失误的概率p(精确到0.0001);
(2)假设每次射门相互独立,每次测试让机器人射门16次,若至少出现一次严重失误,则判定需要校准.在正常状态下,求一次测试被判定需要校准的概率(精确到0.01),并说明该判定规则是否合理;
(3)因机械磨损,机器人射门精度下降,一次射门出现严重失误的概率增加到5%.此时每次测试仍射门16次,但判定规则改为:若至少出现2次严重失误,才需要校准.在磨损状态下,求被判定需要校准的概率(精确到0.01).此时,若一次校准的成本为1万元,且每天测试3次,求日均校准成本的期望值(精确到百元).
参考公式与数据:
①若,则.
②若,则,.
参考数据:,.
【答案】(1)
(2),判定规则在正常状态下误判率约4.2%,虽偏低但仍存在误报,基本合理但略偏保守.
(3),元
【分析】(1)根据转化公式化为标准正态分布,根据参考数据利用对称性求解;
(2)由题意转化为二项分布,根据二项分布求概率,由结果分析规则的合理性即可;
(3)根据二项分布求出对应概率,再由二项分布求期望即可.
【详解】(1)令,
则,
因为,
所以,
即.
(2)设为次射门中出现严重失误的次数,
则,
则需要校准的概率,
因为,
所以,,
所以,
在正常状态下(无故障),仍有约4.2%的概率被误判为“需要校准”,
即存在约4.2%的假阳性率.虽然不高,但每天多次测试会累积误判次数,
可能造成不必要的校准成本.若追求高可靠性,此规则略显敏感;
若容忍少量误判以确保及时发现故障,则尚可接受.
综合来看,该规则偏保守,有一定合理性,但可优化.
(3)机器人因机械磨损,单次失误概率,测试次数为次,
设为次射门中出现严重失误的次数,则,
则,
因为,
,
所以,
设每天校准次数为随机变量,则,
则每天校准次数的期望为次,
所以日均校准成本的期望元,即百元.
49.(2026·上海黄浦·二模)小明每天上学出发时会选择是否骑共享单车.根据平台统计和他的使用习惯:若出发时不下雨,他选择骑共享单车的概率为0.8;若出发时下雨,他选择骑共享单车的概率为0.4.假设本周小明每天上学出发时下雨的概率均为0.25,且出发地共享单车供应充足.
(1)求本周某天小明上学出发时选择骑共享单车去学校的概率;
(2)已知本周某天小明选择了骑共享单车去学校,求该天小明出发时不下雨的概率;
(3)设小明在本周的前三天中选择骑共享单车去学校的天数为X,且这三天中每天的骑行选择相互独立,求随机变量X的分布,并计算其数学期望和方差.
【答案】(1)0.7
(2)
(3);;
【分析】(1)设相应事件,根据题意结合全概率公式运算求解;
(2)根据题意结合贝叶斯公式运算求解;
(3)分析可知,结合二项分布求分布列、期望和方差.
【详解】(1)设“小明上学出发时下雨”为事件A,“小明选择骑共享单车去学校”为事件B.
由题意可知:,,,,
由全概率公式可得,
所以小明在本周某天选择骑共享单车去学校的概率为0.7.
(2)由题意可知:,
所以小明出发时不下雨的概率为.
(3)由题意可知:,
则,;
;;
可知X的分布列为,
所以X的数学期望,方差.
1 / 2
学科网(北京)股份有限公司
$
专题12 概率统计(6大考点,49题)
6大考点概览
考点01用样本估计总体
考点02变量间的相关关系
考点03统计案例
考点04随机事件的概率
考点05古典概型
考点06随机变量及其分布
用样本估计总体
考点1
一、多选题
1.(25-26高三下·上海青浦·期中)下列说法中错误的是( )
A.平均数、众数和中位数都是描述一组数据的集中趋势的统计量
B.极差、方差、标准差都是描述一组数据的离散程度的统计量
C.一组数据中比中位数大的数和比中位数小的数一样多
D.总体的数据都分布在样本的极差范围内
二、填空题
2.(2026·上海黄浦·二模)如图是某班级30名学生某次数学测验的得分茎叶图(茎为十位,叶为个位),则这些测验分数的第80百分位数是______.
3.(2026·上海普陀·二模)根据中国汽车工业协会发布的数据,年月至年月,我国新能源汽车月度销量(单位:万辆)为:,则这个月新能源汽车销量的中位数为______万辆.
4.(2026·上海徐汇·二模)已知实数满足,则的方差的最大值为__________.
三、解答题
5.(2026·上海闵行·二模)某学校举办“乐动体育”比赛活动,高三年级共有50名学生报名参加“小球类项目”,其中参加乒乓球项目的有28人,参加羽毛球项目的有22人,赛前进行了一道比赛通用规则判断题测试,答对得5分,答错得0分,统计结果加下表:
乒乓球项目
羽毛球项目
答对人数
19
16
答错人数
9
6
根据上述数据,回答下列问题:
(1)求这50名学生的平均得分;
(2)从这50名学生中随机选取2人做裁判.设随机变量表示两名裁判的最高得分,求;
(3)是否有的把握认为该题的测试成绩与比赛项目有关?(附:)
答对
答错
合计
乒乓球
19
9
28
羽毛球
16
6
22
合计
35
15
50
零假设为:该题的测试成绩与比赛项目无关,
则,
因为,,
故接受假设,即认为没有95%的把握认为测试成绩与比赛项目有关.
6.(2026·上海长宁·二模)一次校内常规体检后,数学建模活动小组学生随机抽取了10名学生体重数据(单位:kg):55,58,62,74,88,68,54,52,56,86.
(1)求该组数据的极差和第25百分位数;
(2)依据体检数据,求得这10名学生体重(单位:kg)关于身高(单位:cm)的回归方程为,已知这10名学生身高(单位:cm)的平均数为176.3,求的值(精确到0.1)
(3)体重(kg)与身高(m)平方的比称为体重指标,体重指标不低于28.0称为肥胖,为了解该校学生肥胖是否与性别有关,从已获得数据中随机抽样得到了如下列联表.
男生
女生
总计
观察值
预期值
观察值
预期值
不肥胖
99
168
肥胖
总计
120
200
求表中的值.已知零假设为:肥胖与性别无关,计算男生肥胖人数的预期值(精确到0.1).
7.(25-26高三下·上海浦东新·期中)某奶茶品牌为了解消费者对奶茶甜度的偏好情况,随机抽取了100名顾客进行甜度测试(分数越高表示越偏好甜味)、统计结果显示,所有顾客的甜度偏好分数均分布在区间内,具体数据见下表:
甜度偏好分数
人数
10
25
20
30
10
5
(1)估计该品牌奶茶消费者的平均甜度偏好分数(同一组数据用该区间的中点值作代表);
(2)在这100名顾客中,用分层抽样的方法从甜度偏好分数在、这两组中共抽取5人.再从这5人中随机抽取3人,记为3人中甜度偏好分数在的人数,求的分布、期望和方差;
(3)该奶茶品牌把甜度偏好分数在的消费者称“七分糖爱好者”.以样本估计总体、用频率代替概率,该品牌从某日消费人群中随机抽取12名消费者作为样本,记抽到k个“七分糖爱好者”的概率为,问当k为何值时最大?
1
2
3
1
2
3
8.(2026·上海杨浦·二模)一次考试后,数学兴趣小组分析某班级考试成绩.该班级共40人,将得分由高到低平均分为四组,第一组(均分最高的一组)的数据为.
(1)求第一组的得分的均值与中位数;
(2)若从第一组中等可能的选取2名学生,求2人得分都在135分以上的概率;
(3)兴趣小组考察某客观题的得分情况.将前15名学生作为高分组,后25名学生作为非高分组;前15名学生中13人答对该题,后25名学生中16人答对该题.据此,填写表格,并判断是否有95%的把握认为答对该题与进入高分组有关?
附:,,,.
高分组
非高分组
总计
某客观题答对
某客观题答错
总计
高分组
非高分组
总计
答对
13
16
29
答错
2
9
11
总计
15
25
40
9.(2026·上海普陀·二模)2016-2025年全国普通高中生均经费(单位:元)如下表所示:
年份
生均经费
年份
生均经费
年全国两会明确,“十五五”(年)期间将深入实施县域普通高中振兴计划,持续增加普通高中生均经费的投入与学位供给.
(1)设上表中年生均经费的平均数为,现从这个数据中不放回地随机抽取两个不同的数据,已知抽取的两个数据中至少有一个低于,求两个数据都低于的概率;
(2)在评估不同发展阶段的投入稳定性时,不仅看波动幅度,还需考虑增长基数,统计学中常用变异系数()来衡量相对自身水平的波动程度.将作为阶段,作为阶段,分别计算、两阶段生均经费的标准差和变异系数(结果均精确到),根据计算结果,你认为哪个阶段的投入更稳定;
(3)教育经济学研究显示,生均经费每增长,可带动学位供给增长;而学位供给每增长,可带动毛入学率约增长.已知年全国高中阶段毛入学率为,“十五五”规划目标是在此基础上再提升个百分点,根据预算报告,预计“十五五”期间生均经费年增长率可保持.请据此预测年全国高中阶段毛入学率,并判断的增速能否支撑规划目标的实现.
10.(2026·上海松江·模拟预测)质监部门从某超市销售的甲、乙两种食用油中各随机抽取100桶检测某项质量指标,由检测结果得到如下的频率分布直方图:
(1)写出频率分布直方图(甲)中的值;记甲、乙两种食用油100桶样本的质量指标的方差分别为,试比较与的大小(只要求写出结果);
(2)在甲、乙两种食用油中各随机抽取1桶,用频率估计概率,求恰有1桶的质量指标大于10且小于40的概率;
(3)由频率分布直方图可以认为,乙种食用油的质量指标值Z服从正态分布.其中近似为样本平均数近似为样本方差,现从乙种食用油中随机抽取10桶,设X表示质量指标值位于的桶数,求X的数学期望.(结果保留两位小数)
注:①同一组数据用该区间的中点值作代表;②若,则.
11.(2026·上海金山·二模)绝对零度()是一个只能逼近而不能达到的最低温度,那么这个数据是如何测得的?吕同学通过查询资料,知道:①气体温度和气体压强存在线性关系;②当气体压强为0()时,气体温度达到绝对零度.以下是吕同学在一次模拟实验时,测得某种气体温度和气体压强的相关数据:
数据
1
2
3
4
5
6
温度()
4.07
16.69
29.42
45.67
57.06
73.05
压强()
103.095
107.734
112.461
118.469
122.706
128.758
(1)求该模拟实验中,该气体温度的平均值和方差;(精确到0.01)
(2)若该次实验下气体压强关于气体温度的回归方程为,预估该次实验下绝对零度的数值;(精确到0.01)
(3)为了验证实验的普适性,吕同学利用不同气体预估绝对零度,得到如下的一组数据.若任取其中的2个数据,求该两个数据与绝对零度()的误差均小于1的概率.
绝对零度()
275.13
274.56
274.28
273.57
272.45
271.67
变量间的相关关系
考点2
一、单选题
12.(25-26高三下·上海浦东新·期中)某校学生会体育部长依据本校高三男生的身高(单位:)与体重(单位:)的抽样数据,运用电子办公软件求出了“体重”(y)关于“身高”(x)的回归方程,则该回归方程( )
A.表示x与y之间的函数关系 B.表示x与y之间的不确定关系
C.反映x与y之间的真实关系 D.反映x与y之间的真实关系的一种最佳拟合
13.(2026·上海嘉定·二模)生物学家在研究动物体重W(单位:g)与脉搏率f(单位:次)的关系时,获得了右表的数据,令,,并拟合线性回归方程.根据已知数据,下列说法正确的是( )
动物名
体重
脉搏率f/(次)
鼠
25
670
豚鼠
300
300
兔
2000
205
小狗
5000
120
大狗
30000
85
羊
50000
70
马
450000
38
A.变量x与y成正相关,且 B.变量x与y成负相关,且
C.变量x与y成正相关,且 D.变量x与y成负相关,且
14.(2026·上海闵行·二模)以下是由变量与所绘制的散点图,则它们的线性相关程度较高且正相关的是( )
A. B.
C. D.
二、填空题
15.(2026·上海普陀·二模)某大型管线网的局部呈网格结构,如图建立平面直角坐标系,一小型机器人沿管线移动执行巡检任务,在某次巡检的路径中经过了点:、、、、、、,若该机器人经过的点的纵坐标关于横坐标的一元线性回归方程是,则的值为______.
三、解答题
16.(2026·上海·二模)班主任小明查阅了某大学发表的一项本市高三学生手机使用情况的研究报告.报告指出,高三学生每周手机使用时长(单位:小时)总体上服从正态分布.
(1)小明老师将自己所带班级(共50名学生)视为从本市高三学生总体中随机抽取的一个样本,能以此正态分布模型估算出全班每周平均手机使用时长超过16小时的人数,在此估算基础上若在全班任选3位同学,则至少有2位同学的每周手机使用时长超过16小时的概率是多少?(结果用最简分数表示)
参考数据:若,则.
(2)小明老师发现小虹同学每周手机使用时长超过16小时,对其进行疏导劝解,并跟进统计出之后5周小虹每周手机使用时长与该周数学练习得分(每周练习的难度相同且满分均为150分),制成表1.以这5组数据建立回归方程.请求出实数的值
表1
第1周
第2周
第3周
第4周
第5周
手机使用时长
20
18
22
16
14
练习得分
80
88
73
92
m
(3)受到鼓励的小虹制定了寒假复习计划表递交给小明老师,严格控制手机使用时长.小明老师统计发现该计划表中若第n天能复习时长超过5小时(记为“高效复习”),则第天也能“高效复习”的概率为;若第天不能“高效复习”,则第天还能“高效复习”的概率为.设(,为正整数)表示第天能“高效复习”的概率,,若表示复习计划表第天有效.求证:数列是等比数列,并说明小虹的该复习计划表是否在寒假每一天均有效.
17.(2026·上海静安·二模)下表是某品牌净化器的年销售量与年份的统计表.
年份
2021
2022
2023
2024
2025
年份代码x
1
2
3
4
5
年销售量у(万台)
2
3.5
2.5
8
9
(1)用计算器计算净化器的年销售量y关于年份代码x的线性回归方程;(回归系数计算结果保留两位小数)
(2)为了调查A、B两地区人群对该品牌净化器的了解情况,调查机构在A、B两地区的人群中分别进行品牌知晓情况的问卷调查.统计知晓与不知晓的人数,得到如下2×2列联表.
知晓
不知晓
合计
A地区
80
20
100
B地区
40
60
100
合计
120
80
200
试根据表中数据判断A、B两地区的人群对该品牌净化器的知晓情况是否有显著差异.(规定显著水平)
附:关于回归方程,回归系数的计算公式,其中为样本点的中心;的计算公式;
0.05
0.01
0.001
k
3.841
6.635
10.828
18.(2026·上海奉贤·二模)某工厂生产的某种产品的月产量(单位:千件)与单位成本(单位:元/件)的数据如下:
月份
产量(千件)
单位成本(元/件)
1
2
73
2
3
72
3
4
71
4
3
73
5
4
69
6
5
68
(1)计算产量与单位成本的相关系数(无需过程);
(2)建立产量与单位成本的回归方程(写出必要的过程):
(3)若该工厂计划7月份生产7千件该产品,则单位成本预计是多少?
附:相关系数的计算公式:;
回归系数计算公式:,
统计案例
考点3
一、填空题
19.(2026·上海·二模)某工厂为判断两种不同的操作方法是否对生产某种零件的合格个数有影响,收集了相关数据,绘制了列联表,设原假设:两种不同的操作方法对生产该种零件的合格个数没有影响,计算出统计量,已知,则在显著性水平下,推断的结论为________.(用“拒绝”或“接受”填空)
二、解答题
20.(2026·上海崇明·二模)2025年11月,教育部等五部门联合印发《关于实施学生体质强健计划的意见》,明确要求“中小学生每天综合体育活动时间不少于2小时”.某学校为了解政策落实情况及其对学生视力的影响,随机抽取了100名学生进行每周累计体育活动时长的调查,得到如下频率分布表:
每周活动总时长(单位:时)
频率
0.15
0.25
0.35
0.15
0.1
同时,对这100名学生的视力进行了检查,将视力达到5.0及以上定为“视力良好”,低于5.0定为“视力一般”,得到如下2×2列联表(部分数据缺失):
视力良好
视力一般
合计
活动时间达标(不少于14小时)
40
活动时间未达标(低于14小时)
30
合计
100
(1)从活动时长在和的学生中,按比例分层随机抽样抽取5人进行座谈.若从这5人中随机抽取2人,设为抽取的2人中活动时长在的人数,求的分布列和数学期望;
(2)依据的独立性检验,判断是否有95%的把握认为“视力情况”与“体育活动时长是否达标”有关.
参考公式及数据:
①,其中.
②,,,.
0
1
2
0
1
2
视力良好
视力一般
合计
活动时间达标(不少于14小时)
40
20
60
活动时间未达标(低于14小时)
10
30
40
合计
50
50
100
21.(2026·上海徐汇·二模)为落实《全民健身条例》,某区体育局对本区居民的健身场所选择偏好进行调研.数据显示,居民主要选择商业健身场馆(如健身房、体育中心)和社区公共运动场(如小区健身点、街心公园)两类场所.为了解年龄因素是否影响健身场所的选择,研究人员将成年居民分为青壮年组(岁且岁)和中老年组(岁),从该区随机抽取170名成年居民进行调查,得到如下不完整的列联表:
青壮年
中老年
合计
商业健身场馆
60
社区公共运动场
50
合计
80
170
(1)请补充列联表,并根据表中数据判断能否有的把握认为年龄与居民健身场所的选择有关;
(2)用分层抽样的方式从选择社区公共运动场的居民中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望.
参考公式及数据:,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
青壮年
中老年
合计
商业健身场馆
60
40
100
社区公共运动场
20
50
70
合计
80
90
170
因为,
因此有95%的把握认为年龄与居民健身场所的选择有关.
1
3
5
7
所以
22.(25-26高三下·上海宝山·期中)为调查大学数学专业的学生对中华优秀传统文化的了解情况,现对某大学的数学专业学生进行抽样调查.已知被调查的男、女生人数均为(为正整数),得到以下列联表:
(1)调查结果显示有的把握认为该校学生对中华优秀传统文化的了解与性别有关,但没有的把握认为该校学生对中华优秀传统文化的了解与性别有关,求的值;
(2)当时,采用分层抽样的方式在“了解中华优秀传统文化”的学生中抽取10人.
①从这10人中随机抽取3人进行第二次调查,在第二次调查中,已知至少有2名女生被抽到,求抽到男生的概率;
②在“不了解中华优秀传统文化”的男生中再随机抽取人,然后从这人中随机抽取2人.用随机变量表示抽到“了解中华优秀传统文化”的女生人数,若随机变量的数学期望值不小于,求的最大值.
男生
女生
合计
了解
不了解
合计
参考公式:,其中.
参考数据:
0.05
0.025
0.010
0.005
3.841
5.024
6.635
7.879
男生
女生
合计
了解
不了解
合计
随机事件的概率
考点4
一、单选题
23.(2026·上海松江·模拟预测)一个袋中有大小与质地完全相同的红、黄、蓝三个球,从袋中依次随机不放回地摸出两个球,记“第一次取到红球”为事件A,“第二次取到黄球”为事件,则( )
A.A,B相互独立 B.
C. D.
24.(2026·上海静安·二模)袋子里装有四枚围棋子,其中两枚黑色棋子、两枚白色棋子,从中随机取出两枚棋子,那么互斥而不对立的事件是( ).
A.“至多有一枚白色棋子”与“至多有一枚黑色棋子”
B.“至多有一枚白色棋子”与“都是黑色棋子”
C.“恰好有一枚白色棋子”与“都是黑色棋子”
D.“至多有一枚白色棋子”与“都是白色棋子”
25.(2026·上海杨浦·二模)事件、相互独立,若,,则A与同时发生的概率为( ).
A.0 B. C. D.
二、填空题
26.(2026·上海徐汇·二模)设是一个随机试验中的两个事件,且,则__________.
27.(2026·上海闵行·二模)已知事件发生的概率,事件发生的概率,若事件与独立,则______.
28.(2026·上海黄浦·二模)某射击社团共有10名成员,其中社长与副社长各一人,现随机抽取4人组成代表队参加校际联谊活动,则社长与副社长两人至少有一人参加联谊活动的概率为______.
古典概型
考点5
一、单选题
29.(2026·上海金山·二模)已知全集是一个六元集合,任取的两个子集、(、可以相等),记事件;记事件.则( )
A. B. C. D.
30.(2026·上海普陀·二模)某科技公司每位员工皆佩戴红色或蓝色中仅一种颜色的工牌,该公司为促进跨部门协作,采用智能轮岗系统进行员工交换部门,初始时,甲部门有2名红色工牌员工、1名蓝色工牌员工,乙部门有2名红色工牌员工、2名蓝色工牌员工,系统执行一次随机交换指令:从甲、乙2个部门中随机各选取1名员工进行交换,设交换后甲部门中红色工牌员工的人数为,则的期望为( )
A. B. C. D.
二、填空题
31.(2026·上海嘉定·二模)已知正四面体上的四个面上分别写有1、2、3、4,游戏中甲、乙轮流抛掷该四面体,谁抛出底面数字等于4则获胜且游戏结束.甲先开始,则甲获胜的概率为___________.
32.(25-26高三下·上海浦东新·期中)一个家庭有两个孩子,生肖均为十二生肖之一(等可能).已知其中一个孩子属马,则另一个孩子也属马的概率为________.
33.(2026·上海奉贤·二模)从6名男生和4名女生中选出3人参加人工智能技能培训.设事件至少抽到一名女生,事件恰好抽到一名男生,则________.
34.(2026·上海长宁·二模)将4个不同的小球依次随机投入3个篮子中,每个篮子不空的概率为______(用分数表示).
随机变量及其分布
考点6
一、单选题
35.(2026·上海徐汇·二模)已知甲、乙两班在某次数学测验中成绩近似服从正态分布,甲班成绩,乙班成绩,其密度曲线如图所示,则有( )
A.且
B.且
C.
D.
36.(2026·上海长宁·二模)对于随机事件、,,“”是“、互相独立”的( )条件.
A.充分非必要 B.必要非充分 C.充要 D.非充分非必要
37.(2026·上海·二模)已知和分别表示事件和事件发生的概率,且 ,则在下列各项中,“和独立”的充分条件是( ).
A. B.
C. D.
二、填空题
38.(2026·上海·二模)将二项展开式中的各项等可能地随机重新排列,观察排列中是否存在系数为负数的项相邻,若存在,则记随机变量,否则记,则________.
39.(25-26高三下·上海青浦·期中)某电子元件厂有甲、乙两条互不影响的生产线生产同型号元件,甲生产线的产量占全厂总产量的 ,其产品次品率为 ;乙生产线的产量占全厂总产量的 ,其产品次品率为 .若从全厂产品中随机抽取 1 件,抽到次品的概率为_______.
40.(2026·上海杨浦·二模)已知随机变量服从二项分布,若,则______.
41.(2026·上海静安·二模)某汽车制造厂生产一种用于发动机的活塞销,其设计标准直径为.根据长期生产数据,该活塞销的实际直径服从正态分布,方差为.规定:活塞销的直径在到之间为合格品.随机抽取一个活塞销,其为合格品的概率是______.(结果保留三位小数)
参考数据:若随机变量,则,,.
42.(2026·上海长宁·二模)已知随机变量的分布为
则的期望为________.
43.(2026·上海静安·二模)现有两个罐子,都放有3个球,这些球除颜色外,大小与质地都相同,A罐中放有2个红球,1个白球,B罐中放有3个红球,从两个罐子中各摸出1个球并交换,这样交换2次后,白球还在A罐子中的概率是______.
44.(2026·上海金山·二模)已知随机变量的分布为,则期望__________.
45.(2026·上海奉贤·二模)某食品厂生产一种零食,该种零食每袋的质量X(单位:g)服从正态分布,记作.规定:这种零食的质量在62.8~69.4g之间的为合格品;则这种零食的合格率为________.(结果精确到0.001);
参考数据:若,则,,.
46.(25-26高三下·上海宝山·期中)已知随机变量,且,那么__________.
47.(25-26高三下·上海浦东新·期中)某校高中三年级600名学生参加了区质量检测,已知数学检测成绩X服从正态分布(试卷满分为150分).统计结果显示,数学检测成绩介于80分到120分之间的人数为450名,则此次检测中成绩不低于120分的学生人数约为总人数的________(精确到0.1%).
三、解答题
48.(2026·上海嘉定·二模)某款足球机器人射点球时,射门点与球门中心的水平偏差(单位:)服从正态分布.在正常状态下,偏差,规定为“严重失误”.
(1)求一次射门出现严重失误的概率p(精确到0.0001);
(2)假设每次射门相互独立,每次测试让机器人射门16次,若至少出现一次严重失误,则判定需要校准.在正常状态下,求一次测试被判定需要校准的概率(精确到0.01),并说明该判定规则是否合理;
(3)因机械磨损,机器人射门精度下降,一次射门出现严重失误的概率增加到5%.此时每次测试仍射门16次,但判定规则改为:若至少出现2次严重失误,才需要校准.在磨损状态下,求被判定需要校准的概率(精确到0.01).此时,若一次校准的成本为1万元,且每天测试3次,求日均校准成本的期望值(精确到百元).
参考公式与数据:
①若,则.
②若,则,.
参考数据:,.
49.(2026·上海黄浦·二模)小明每天上学出发时会选择是否骑共享单车.根据平台统计和他的使用习惯:若出发时不下雨,他选择骑共享单车的概率为0.8;若出发时下雨,他选择骑共享单车的概率为0.4.假设本周小明每天上学出发时下雨的概率均为0.25,且出发地共享单车供应充足.
(1)求本周某天小明上学出发时选择骑共享单车去学校的概率;
(2)已知本周某天小明选择了骑共享单车去学校,求该天小明出发时不下雨的概率;
(3)设小明在本周的前三天中选择骑共享单车去学校的天数为X,且这三天中每天的骑行选择相互独立,求随机变量X的分布,并计算其数学期望和方差.
1 / 2
学科网(北京)股份有限公司
$