内容正文:
题号猜押01 上海卷高考数学第17题(解答题)
溯源
考点
3年考题
考情分析
概率统计与数学建模
2025年第17题
极差与中位数、古典概型、排列组合、回归方程
2024年第19题
(1)分层抽样;(2)频率分布表求平均数; (3)2x2 列联表独立性检验
2023年第19题
条件概率,离散型随机变量的分布列和期望的计算,决策问题
预测
1. 作为解答题(通常位于中段,如第17或18题),分值14分。题目阅读量较大,背景贴近现实生活、科学实验或社会调查。
2. 题目往往呈现一个完整的“问题情境→数据收集/描述→模型构建→统计推断→决策建议”的微缩过程,考查学生运用统计思维解决实际问题的能力。
3.侧重对随机现象的理解,对离散型、连续型随机变量分布的理解与应用,以及利用概率进行决策;侧重对数据的处理(图表、数字特征)、利用样本推断总体(估计、检验)、对统计方法的理解与评价。
4.与其它知识自然融合:与函数、数列、导数、不等式、算法思想的结合更加深入和自然。
备考核心
1. 新课标强化了全概率公式、贝叶斯公式、百分位数、随机模拟、2×2列联表的独立性检验、一元线性回归模型等内容。必须确保对这些新增和强化内容的理解毫无偏差,并掌握其基本应用。
2. 有意识地进行长题干题目的训练。练习时先勾画关键信息(总体、样本、条件、问题),用自己的话复述题意,明确“已知什么,求什么,用什么模型”。
3.(1)对常见概率模型(摸球、排队、比赛、质点运动等)进行归纳。(2)对统计应用题型(估计、检验、预测、评价)进行分类。(3)重点攻克条件概率与全概率公式、分布列与数列递推、正态分布应用这三大难点。
4.规范表达,强化“说理”:在练习中,不仅要算对,更要写清逻辑。
5.适当阅读一些科普性的统计案例文章,了解统计在社会科学、医学、经济学中的应用,理解“相关性不是因果性”、“统计显著与实际显著”等思想,这有助于更好地理解题目背景和出题意图
考点1 统计与概率
【典例1】(2026·上海徐汇·期末)从某校学生中随机抽出50名学生参加消防安全知识竞赛,根据竞赛成绩得到如图所示的频率分布直方图.数据的分组依次为,.
(1)求图中的值,并估计这50名学生的平均成绩.(同一组中的数据用该组区间的中点值作代表)
(2)若成绩在前的学生可获得“消防达人”称号,则成绩至少要达到多少分才可以被评为“消防达人”?
(3)从低于60分的学生中随机抽取2名学生,求这2名学生成绩不在同一分组的概率.
【解】(1)由,
得,
平均数为;
(2)
前4个矩形面积为:
,
前5个矩形面积为:
,
所以若成绩在前的学生可获得“消防达人”的称号,
则成绩至少要达到;
(3)区间有人,区间有人,
设内两人为,内3人为,
则随机抽取2名学生有:,共10种结果,
来自不同组的有,共6种结果,
所以这2名学生成绩不在同一分组的概率为.
【变式1】(2026·上海静安·期末)为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.活动后,为了解阅读情况,学校统计了甲、乙两组各名学生的阅读量(单位:本),统计结果用茎叶图记录如下(十位数字作为“茎”,个位数字作为“叶”),其中乙组记录中有一个数据模糊,无法确认,在图中以表示.
(1)若甲组阅读量的平均值大于乙组阅读量的平均值,求的所有可能取值;
(2)记甲组阅读量的方差为;在甲组中增加一名学生得到“新甲组”,若的阅读量为,则记“新甲组”阅读量的方差为;若的阅读量为,则记“新甲组”阅读量的方差为;比较、、的大小
(写出结果即可).
(3)将甲、乙两组中阅读量超过本的学生称为“阅读达人”,从甲、乙两组学生中各随机抽取一人,则至少有一名学生是阅读达人的概率是多少?
【解】(1)甲组10名学生阅读量的平均值为,
乙组10名学生阅读量的平均值为,
由,解得,又,,可得,,
故图中的取值为1或2.
(2)因为
,
若的阅读量为,则“新甲组”阅读量的平均数为,
则
,
若的阅读量为,则“新甲组”阅读量的平均数为,
则
所以.
(3)由茎叶图知,甲、乙两组中的“阅读达人”的人数分别为2人,3人,
所以甲、乙两组学生中各随机抽取一人,则至少有一名学生是阅读达人的概率是.
【变式2】(2026·上海青浦一模)某芯片代工厂生产甲、乙两种型号的芯片,为了解芯片的某项指标,从这两种芯片中各抽取100件进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计总体,以事件发生的频率作为相应事件发生的概率.
(1)求频率分布直方图中的值
(2)估计乙型芯片该项指标的平均值(同一组中的数据用该组区间的中点值为代表);
(3)已知甲型芯片指标在为航天级芯片,乙型芯片指标在为航天级芯片.现分别采用分层抽样的方式,从甲型芯片指标在内取2件,乙型芯片指标在内取4件,再从这6件中任取2件,求这2件都是航天级芯片的概率.
【解】(1)由题意得,解得.
(2)由频率分布直方图得乙型芯片该项指标的平均值:
.
(3)由甲型芯片的频率分布直方图可知指标在和的频率相同,
根据分层抽样得,来自甲型芯片指标在和的各1件,分别记为和,
由乙型芯片的频率分布直方图可知指标在和的频率之比为,
所以根据分层抽样得,来自乙型芯片指标在和的分别为3件和1件,分别记为和,
从中任取2件,样本空间可记为:,
共15个,
记事件:这2件都是航天级芯片,则共1个,
所以.
考点2 概率与线性回归
【典例2】(2025·上海浦东新·三模)某科研活动共进行了5次试验,其数据如表所示:
特征量
第1次
第2次
第3次
第4次
第5次
(1)求成对数据的相关系数;
(2)求特征量关于的回归方程,并据此估算特征量时的值;
(3)设特征量作为随机变量服从正态分布,其中为5次试验中的平均数,为5次试验中的方差.求.(本题所有答数精确到0.01.)
【解】(1)由条件可知,,,
,
,
,
所以;
(2),
,
所以,
当时,;
(3),所以,,
,,
所以.
【变式1】某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
【解】(1)该地被调查村的村户年平均收入的估计值为(万元);
(2)样本的相关系数为
;
(3)采用分层抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地更准确的验收估计.
【变式2】某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如下:
(1)根据散点图求y关于x的经验回归方程(精确到0.01);
(2)根据线性回归方程,绘制残差图,并分析线性回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差).
附:,.
【解】(1)由图得,,
则,
故,
则y关于x的经验回归方程为.
(2)结合(1),计算得残差如下表:
行驶速度
60
70
80
90
100
110
油耗实际值
7.5
6.8
6.2
5.7
5.4
5
油耗估计值
7.35
6.85
6.35
5.85
5.35
4.85
残差
0.15
0.05
0.15
因此残差分布图如下:
因为,
所以经验回归方程的拟合效果较好.
考点3 概率与统计案例
【典例3】在某次草地音乐节上,为了解音乐节的体验情况,从观众中随机选取了100人进行问卷调查.
(1)根据观众的性别以及是否购买乐队官方周边,得到如下数据:
男性
女性
总计
购买周边
21
49
70
不购买周边
15
15
30
总计
36
64
100
根据以上信息,是否有的把握认为观众购买乐队官方周边与观众的性别有关?
参考公式:,其中;参考数据:.
(2)根据调查数据,该音乐节观众的排队安检时间(单位:分钟)服从正态分布.从观众中随机抽取1人,若其排队安检时间超过10分钟,求其排队安检时间超过12分钟的概率.(结果精确到)参考数据:,其中为标准正态分布函数.
【解】(1)假设:观众购买乐队官方周边与观众的性别无关.
根据公式,
因为,所以不拒绝原假设,
即没有的把握认为观众购买乐队官方周边与观众的性别有关.
(2)因为(单位:分钟)服从正态分布,
所以.
.
所以所求的概率为.
【变式1】手机是近年来备受关注的新一代智能终端,与智能网联新能源汽车、智能机器人等共同纳入国家发展战略.某商场为了解顾客的购买意愿,随机调查了200位顾客购买手机的情况,得到数据如下表.
购买手机
购买无技术的手机
总计
男性顾客
45
65
110
女性顾客
56
34
90
总计
101
99
200
(1)根据表中数据,判断是否有99%的把握认为购买手机与顾客的性别有关?并说明理由:
(2)为促进手机的销量,该商场为购买手机的顾客设置了抽奖环节,共设一、二等奖两种奖项,分别奖励200元、100元手机话费,抽中一、二等奖的概率分别为和,其余情况不中奖.每位顾客允许连续抽奖两次,且两次抽奖相互独立.记某位顾客两次抽中的奖金之和为元,求随机变量的数学期望.
参考公式及数据:①,其中.
②,,,.
【解】(1)假设:购买手机与顾客性别无关.
根据公式,
因为,所以假设不成立,
即我们有的把握认为购买手机与顾客的性别有关,此判断犯错误概率不超过0.01.
(2)可能取的值为0,100,200,300,400,
每次抽奖不中的奖的概率为,中元概率为,中元概率为,
,
,
,
,
,
所以的分布列为
0
100
200
300
400
所以期望为.
【变式2】(2026·上海杨浦·期末)AI手机是近年来备受关注的新一代智能终端,与智能网联新能源汽车、智能机器人等共同纳入国家发展战略.某商场为了解顾客的购买意愿,随机调查了200位顾客购买AI手机的情况,得到数据如下表.
购买AI手机
购买无AI技术的手机
总计
男性顾客
45
65
110
女性顾客
56
34
90
总计
101
99
200
(1)根据表中数据,判断是否有99%的把握认为购买AI手机与顾客的性别有关?并说明理由;
(2)从这90位女性顾客中随机挑选4位,求其中至少有2位购买AI手机的概率(精确到0.01);
(3)为促进AI手机的销量,该商场为购买AI手机的顾客设置了抽奖环节,共设一、二等奖两种奖项,分别奖励200元、100元手机话费,抽中一、二等奖的概率分别为和,其余情况不中奖.每位顾客允许连续抽奖两次,且两次抽奖相互独立.记某位顾客两次抽中的奖金之和为元,求随机变量的数学期望.
参考公式及数据:①,其中.
②,,,.
【解】(1)作原假设:购买AI手机与顾客的性别无关,取,,
因为,所以否定原假设,即有99%的把握认为购买AI手机与顾客的性别有关.
(2).
(3)法1:可取值,
而,,
,,
,
故的分布为,
期望.
法2:设第次抽中奖金为,由题设可得的分布为,
从而,而相互独立,故.
考点4 条件概率与全概率公式的应用
【典例4】(2026·上海闵行·二模)在临床检测试验中,某地用某种抗原来诊断试验者是否患有某种疾病.设事件表示试验者的检测结果为阳性,事件表示试验者患有此疾病,据临床统计显示,,.已知该地人群中患有此种疾病的概率为.(下列两小题计算结果中的概率值精确到)
(1)对该地某人进行抗原检测,求事件与同时发生的概率;
(2)对该地个患有此疾病的患者进行抗原检测,用随机变量表示检测结果为阳性的人数,求的分布和期望.
【解】(1)由题意知:,,
,
即事件与同时发生的概率为.
(2),,
所有可能的取值为,
;;;;
的分布为,数学期望.
【变式1】(2025·上海黄浦·二模)一盒子中有大小与质地均相同的20个小球,其中白球个,其余为黑球.
(1)当盒中的白球数时,从盒中不放回地随机取两次,每次取一个球,用表示事件“第一次取到白球”,用表示事件“第二次取到白球”,求和,并判断事件与是否相互独立;
(2)某同学要策划一个抽奖活动,参与者从盒中一次性随机取10个球,若其中恰有3个白球,则获奖,否则不获奖,要使参与者获奖的可能性最大、最小,该同学应该分别如何放置白球的数量?
【解】(1)当时,盒中有6个白球,14个黑球,,,
,
,则,所以事件与相互不独立.
(2)从20个球中取10个球,恰有3个白球的概率,
设,当时,,
,当时,,
当时,,因此,
而,则,
所以当时,参与者获奖的可能性最大;当时,参与者获奖的可能性最小.
【变式2】(2025·上海·三模)某电台举办有奖知识竞答比赛,选手答题规则相同.甲每道题自己有把握独立答对的概率为,若甲自己没有把握答对,则在规定时间内连线亲友团寻求帮助,其亲友团每道题能答对的概率为,假设每道题答对与否互不影响.
(1)当时,
(i)若甲答对了某道题,求该题是甲自己答对的概率;
(ii)甲答了4道题,计甲答对题目的个数为随机变量,求随机变量的分布列和数学期望;
(2)乙答对每道题的概率为(含亲友团),现甲乙两人各答两个问题,若甲答对题目的个数比乙答对题目的个数多的概率不低于,求甲的亲友团每道题答对的概率的最小值.
【解】(1)(i)记事件为“甲答对了某道题”,事件为“甲自己答对”,
则,,
所以.
(ii)可能取值为0,1,2,3,4,甲答对某道题的概率,
则,
所以的分布列为:
0
1
2
3
4
数学期望.
(2)记事件为“甲答对了道题”,事件为“乙答对了道题”,
其中甲答对某道题的概率为,答错某道题的概率为,
则,
,
,
所以甲答对题数比乙多的概率为:
,解得,
所以甲的亲友团助力的概率的最小值为.
考点5 相互独立事件概率与期望、方差
【典例5】(2025·上海青浦·三模)口袋里装有大小与质地相同的4个红球和8个白球,甲、乙两人从袋中摸球,每次摸1个球.
(1)若甲、乙两人无放回地摸球,由甲先摸1个球,乙再摸1个球,求甲摸到白球的条件下,乙摸到红球的概率;
(2)制定规则如下:若一方摸出1个红球,则此人继续下一次摸球,若一方摸出1个白球,则由对方接替下一次摸球,由甲进行第一次摸球.
①若甲、乙两人无放回地摸球,求第三次仍由甲摸球的概率;
②若甲、乙两人每次摸球后都放回地摸球,求在前两次摸球中,甲摸得的红球次数的分布及期望.
【解】(1)口袋共有12个球,甲先摸球,摸到白球的概率为,
甲摸到白球后,口袋还剩11个球,其中红球有4个,则甲摸到白球且乙摸到红球的概率为,
综上,甲摸到白球的条件下,乙摸到红球的概率为;
(2)①由题设,满足要求的情况有甲第一次摸到红球,第二次也摸到红球;甲第一次摸到白球,乙第二次摸到白球;
所以若甲、乙两人无放回地摸球,第三次由甲摸球的概率为;
②由题意,的可能值为,且,,,
所以的分布列如下,
0
1
2
则.
【变式1】同学们,你们知道排球比赛的规则和积分制吗?其规则是:每局25分,达到24分时,比赛双方必须相差2分,才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3∶0或3∶1取胜的球队积3分,负队积0分;以3∶2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1
2
3
4
5
6
甲
25
21
27
27
23
25
乙
18
25
25
25
25
17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分X的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,请比较两队积分相等的概率与的大小
【解】(1)由表可知:6场比赛甲赢了4场,则甲每局获胜的频率为,
用频率估计概率,所以甲队每局获胜的概率为.
(2)随机变量的所有可能取值为0,1,2,3,
可得:,,
,,
所以的分布列为
0
1
2
3
所以数学期望.
(3)记“甲、乙比赛两场后,两队积分相等”为事件,
设第场甲、乙两队积分分别为,,则,,2,
因两队积分相等,所以,即,则,
而,,
,
所以
,
因为,所以两队积分相等的概率小于
考点6 结合二项分布或超几何分布求期望、方差并决策
【典例6】(2025·上海普陀·二模)某区为推进教育数字化转型,通过聚合区域学校的教育资源,依托AI技术搭建了区域智慧题库系统,形成了“通识过关—综合拓展—创新提升”三层动态原库,且三层题量之比为,设该题库中任意1道题被选到的可能性都相同.
(1)现有4人参加一项比赛,若每人分别独立地从该题库中随机选取一道题作答,求这4人中至少有2人的选题来自层的概率;
(2)现采用分层随机抽样的方法,使用智能组卷系统从该题库中选取12道题生成试卷,若某老师要从生成的这份12道题的试卷中随机选取3道题做进一步改编,记该老师选到层题的题数为,求的分布与期望.
【解】(1)因为三层题量之比为,
所以在层选题的概率为,不在层选题的概率为,
设至少2人的选题来自层的概率为,从层选题数量为,
由题意得,而二项分布概率公式为,
则至少2人的选题来自层的概率为,
故.
(2)因为三层题量之比为,
所以在层最多抽到7道,且可取,
则,
,
其分布列为
X
P
所以期望.
【变式1】某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布.
(1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到);
(2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到).
参考数据:,,,其中为标准正态分布函数.
【解】(1)由题意,,的概率等于.
令,则.
因此,
.
故净含量误差超过5g的概率约为.
(2)可能的取值为0、1、2、3.
由(1)可知,任取一包糖果,净含量小于497.5g的概率为.
故服从二项分布,记,
,
从而的分布为
0
1
2
3
0.595
0.337
0.064
0.004
因此.
1.(2025·上海长宁·一模)小明有自觉体锻的习惯,某运动软件记录了其每天运动的时长(单位:min),小明从最近90天的记录中随机选取了10天的记录,具体数据如下:
(1)求这组数据的第60百分位数:
(2)运动时长不超过60min为不达标,估算从90天记录中随机抽取1天,该天运动时长不达标的概率:
(3)从这10个数中随机删除2个数得到一组新的数据,求前后两组数据的极差相同的概率.
【解】(1)把10天的记录按照从小到大排列为:,
因为是整数,所以第60百分位数为第6个数与第7个数的平均数,
因为,这组数据的第60百分位数为71;
(2)因为选取的样本中运动时长不达标的频率为,
所以估计该天运动时长不达标的概率为0.3;
(3)因为前后两组数据的极差相同,所以随机删除的2个数为中的两个,
则概率
2.(2025·上海杨浦·一模)为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人?
(3)若落在学生的平均成绩是,方差是,落在学生的平均成绩为,方差是,求这两组学生成绩的平均数和方差.(结果精确到)
【解】(1)由频率分布直方图可得,
解得.
(2)由频率分布直方图知,样本考核成绩在,,的三组学生有(人),
其中样本考核成绩在的市民人数为,
用分层抽样的方法应从考核成绩在的市民中抽取(人).
(3)由频率分布直方图知,成绩在的学生人数为,
成绩在的市民人数为,
所以总平均数,
总方差.
3.(2023·上海浦东新·模拟预测)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中)
6
60
(1)利用样本相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?
(2)根据(1)的结果回答下列问题:
(i)建立关于的回归方程;
(ii)样本对原点的距离时,金属含量的预报值是多少?
(3)已知该金属在距离原点米时的平均开采成本(单位:元)与关系为,根据(2)的结果回答,为何值时,开采成本最大?
【解】(1)因为的线性相关系数,
的线性相关系数,
,
更适宜作为平均金属含量关于样本对原点的距离的回归方程类型.
(2)(i)依题意,可得,
,
,关于的回归方程为.
(ii)当时,金属含量的预报值为.
(3)因为,
令,则,
当时,,在上单调递增;
当时,,在上单调递减,
在处取得极大值,也是最大值,此时取得最大值,
故为10时,开采成本最大.
4.(2025·上海浦东新·三模)申辉中学机器人兴趣小组,进行某款机器人研发学习活动.该机器人被设计从数轴上的原点出发,机器人每一步只能选择向数轴正方向或向负方向行走1个单位.设机器人第步选择向正方向行走的概率为.设行走步后机器人所在位置对应的数为随机变量.
(1)兴趣小组成员小浦对机器人行走的步数和机器人所在位置进行了观察记录,记录数据如下:
n
1
2
3
4
5
1
2
1
2
3
请求出变量和之间的线性相关系数:
(2)若,求;
(3)已知,在的条件下,求的概率.
【解】(1)由表可知:
,
,,,
代入相关系数的公式可得:.
(2)由题可知的所有可能取值为,,,,
表示三次均向正方向行走,故;
表示两次选择正方向,一次选择负方向行走,故;
表示一次选择正方向,两次选择负方向行走,故;
表示三次均选择负方向行走,故,
所以.
(3)设为事件A,为事件,,
其中,,
,故.
5.(24-25高三下·上海虹口·期中)已知某区组建了一支120人的志愿者队伍,并由其中72人组成“志愿模范队”.经过一年的实践,全队共有72人的周平均服务时长超过2小时,其中有54人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
54
72
周平均服务时长不超过2小时
总计
72
120
(1)已知一名志愿者是“志愿模范队”成员,求其周平均服务时长超过2小时的概率.
(2)请完成列联表,并根据表中数据回答:是否有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系?
(3)现从周平均服务时长超过2小时的人员中按照是否为“志愿模范队”成员进行分层抽样,选取8人组建“志愿突击队”,并从这8人中再随机选取2人做深度访谈,记随机变量为这2人中来自于“志愿模范队”的人数,求的分布与方差
附录:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【解】(1)由表可知,若一名志愿者是“志愿模范队”成员,则其周平均服务时长超过2小时的概率:.
(2)根据题意,可将表格补充完整:
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
54
18
72
周平均服务时长不超过2小时
18
30
48
总计
72
48
120
故,
所以有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系.
(3)由分层抽样可知,这8人中有6个来自“志愿模范队”,2个不是“志愿模范队”成员,
故随机变量可能为
且,
故分布列如下:
0
1
2
所以期望:,
方差:.
6.(2025·上海金山·二模)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
附:;
0.10
0.01
0.001
2.706
6.635
10.828
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布列和期望.
【解】(1)完善列联表,如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
6
20
不是每天都整理数学错题人数
5
15
20
合计
19
21
40
每天都整理数学错题且数学成绩总评优秀的经验概率为.
(2)由(1)得,
所以有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(3)不是每天都整理数学错题的学生有20人,其中数学成绩总评优秀人数为5,
的所有可能值为0,1,2,3,
,
,
所以的分布列为:
0
1
2
3
期望.
7.(2025·上海浦东新·二模)为测试、两款人工智能软件解答数学问题的能力,将道难度相当的数学试题从到编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,并记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
几何试题
函数试题
(1)分别估计软件、软件能正确解答数学问题的概率;
(2)小浦准备用这两款软件来解决某次数学测试中的第题(假设其难度和测试的道题基本相同),但该题内容还未知,从已往情况来看,该题是几何题的概率为,是函数题的概率为.将频率视为概率,试通过计算来说明小浦应该用哪款软件解决这道试题?
(3)小浦决定采用这两款软件解答道类似试题,其中几何、函数各道,每道试题只用其中一款软件解答一次.将频率视为概率,小浦比较了这两款软件在解答几何和函数题上的正确率,决定用表现较好的那款软件解决其擅长的题型.用、分别表示这道几何试题与道函数试题被正确解答的个数,求随机变量的数学期望和方差.
【解】(1)记、软件能正确解答数学问题的概率为和,
结合题中数据以及古典概型的概率公式可得,.
(2)记“软件能正确解答这道题”为事件,“软件能正确解答这道题”为事件,
“该题为几何题”为事件.
则,,,,,,
由全概率公式可得.
.
因为,所以软件能够正确解决这道试题的概率更大,
故小浦应该使用软件来解决这道试题.
(3)几何试题用软件解答,函数试题用软件解答.
因为,,
由二项分布的期望公式可得,,
由二项分布的方差公式可得,,
因为、相互独立,则,
.
8.(2024·上海奉贤·三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.
(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;
(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:
假设1:各回合比赛相互独立;
假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;
求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?
【解】(1)设事件表示第一回合该中国队运动员赢球,事件表示第二回合该中国队运动员赢球,
事件表示第二回合比赛有运动员得分,
由已知,, ,
则
,
即第二回合比赛有运动员得分的概率为.
(2)设运动员甲先发球,记事件表示第i回合该运动员甲赢球,
记事件表示运动员甲先得第一分,
则,
则,
所以,即则第一回合发球者在整场比赛中先得第一分的概率大于,
则比赛双方运动员实力相当的情况下,先发球者更大概率占据心理上的优势,所以旧制不合理.
9.(2025·上海杨浦·二模)为弘扬中华民族传统文化、增强民族自豪感,某学校开展中华古诗词背诵比赛,分为初赛和复赛.全校同学都参加了初赛,并随机抽取一个班级进行初赛成绩统计,已知该班级共有40位学生,他们的初赛分数的频率分布直方图如图所示:
(1)计算的值,并估计该校这次初赛的平均分数.
(2)初赛分数达到80及以上的同学,称为优秀参赛选手,现从班级中随机选出2位同学,用代表其中的优秀参赛选手人数,求的分布;
(3)为增加比赛的趣味性,复赛规则如下:复赛试题将从题库中随机抽取,每位参赛选手将有机会回答填空、选择和简答各1题;每答对1题得1分,答错或不答得0分,每位选手可以自行选择回答问题的顺序,若答对一题可继续答下一题,直到3题全部答完;若答错或不答则比赛结束.例如:选手甲可自行按“简答—填空—选择”顺序答题,甲答对第一题得1分,并继续回答第二题且答错得0分,结束比赛,总分为1分.
小杨作为优秀参赛选手,代表班级参加复赛.根据他初赛的答题正确频率,可估计他填空、选择和简答的答题正确概率分别为:
题型
填空
选择
简答
答题正确概率
若小杨每次答题的结果都相互独立,那么为尽量在比赛中获得较高分数,小杨应该采用怎样的答题顺序?请说明理由.
【解】(1)由频率分步直方图中小矩形的面积和为1可得:
,
解得;
该校这次初赛的平均分数为.
(2)初赛分数达到80及以上的同学为人,非优秀为28人,
由题意可得的可能取值为,
,
,
,
所以的分布列为:
0
1
2
(3)按照不同题目顺序分类讨论:
填空,选择,简答:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“简答,选择,填空”的期望与之相同;
填空,简答,选择:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“简答,填空,选择”的期望与之相同;
选择,填空,简答:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“选择,简答,填空”的期望与之相同;
所以,
小杨应采用“选择,填空,简答”或“选择,简答,填空”的顺序.
10.(2025·上海松江·二模)某校组织学生在周末时间利用DeepSeek等人工智能平台进行线上学习,但要求学生学习时间不超过4小时.现从该校高三学生某周末的线上学习时间统计数据中,随机抽取100个学生的学习时间进行分析,绘制成如下频率分布直方图.以抽取的100个学生该周末线上学习时间作为样本,估计该校高三年级全体学生周末线上学习时间的情况.
(1)试估计该校高三学生周末线上学习时间的平均数及中位数(注:为了计算均值,可用区间的中点值给区间内的每个数据赋值);
(2)现从全部高三年级学生中随机抽取人,若其中有4人周末线上学习的时间不小于3小时的可能性最大,求的值.
【解】(1)(小时).
因为学习时间小于3小时的频率为,
所以中位数在内,由,解得小时.
(2)由频率分布直方图可知,学习时间不小于3小时的频率为.
设从全部高三年级学生中随机抽取人,线上学习时间不小于3小时的人数为,
其中有4人周末线上学习时间不小于3小时的概率为,
所以.要使最大,
则,
解不等式组得,因为为正整数,所以或7.
所以或7时,最大.
11.(2026·上海·模拟预测)某地区为了解居民体育锻炼达标情况与性别之间的关系,随机调查了600位居民,得到如下数据:
不达标
达标
合计
男
300
女
100
300
合计
450
600
(1)完成列联表,根据显著性水平的独立性检验,能否认为体育锻炼达标与性别有关?
(2)若体育锻炼达标的居民体能测试合格的概率为,体育锻炼未达标的居民体能测试合格的概率为,用上表中居民体育达标的频率估计该地区居民体育达标的概率,现从该地区居民中随机抽取1人参加体能测试,求其体能测试合格的概率;
(3)在(2)的条件下,从该地区居民中随机抽取3人参加体能测试,求3人中体能测试合格的人数X的分布、数学期望及方差.
附:,.
【解】(1)根据数据补全列联表如下:
不达标
达标
合计
男
50
250
300
女
100
200
300
合计
150
450
600
零假设体育锻炼达标与性别无关,
由表格数据得,
因为,
所以推断不成立,依据显著性水平的独立性检验能认为体育锻炼达标与性别有关.
(2)由表格数据该地区居民体育达标的概率为,
记事件“从该地区居民中随机抽取1人参加体能测试,其体能测试合格”,
则由题.
(3)由题意,当地居民人口基数大,可近似看做二项分布,即,
所以;;
;;
所以X的分布列为:
X
0
1
2
3
P
则;.
12.(2026上海杨浦·模拟预测)为吸引客流,某商场举办了“摸球赢好礼”活动,一共设置两关游戏.第一关游戏开始时,主持人在空箱子中放入大小、形状完全相同的1黑、3红共4个球,顾客从箱子中随机且不放回地依次摸出两个球,只要能摸出黑球,便可晋级第二关游戏“赢积分、换好礼”.
(1)小江正在参与第一关游戏.记事件为“小江摸出的第一个球是红球”,事件为“小江晋级了第二关游戏”,分别求;
(2)小江成功晋级第二关游戏.已知第二关游戏规则如下:游戏开始前,顾客要先决定好摸球的局数,而后主持人在空箱子中放入大小、形状完全相同的1黑、3红及白共个球,并充分搅匀.游戏过程中,顾客每局均从箱子里随机摸出一个球,确认颜色并按规则积分,然后把球放回箱子,充分搅匀后再进行下一局摸球,以此类推,直到摸完局球,第二关结束.记分规则如下:
颜色
黑色
红色
白色
得分
+10
在第二关中,顾客的初始积分为0分,将每一局所得积分累加得到最终积分.最终积分越高,所换取的礼品价值越大.
①若小江决定摸球的局数,求她在第二局中所得积分的分布与期望;
②为使最终的期望收益最大化,小江应该如何设定摸球的次数?
【解】(1)
(2)①,则箱子中共有个球,其中黑、红及白,
由题意可知,的所有可能取值为10,5,,且
,
所以其分布列如下:
10
5
.
②设小江应该设定摸球的次数为,则
每局期望为:
总期望为:
令
当且仅当时取等号,即,所以
所以小江应该设定摸球次时,收益最大.
1 / 7
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
题号猜押01 上海卷高考数学第17题(解答题)
溯源
考点
3年考题
考情分析
概率统计与数学建模
2025年第17题
极差与中位数、古典概型、排列组合、回归方程
2024年第19题
(1)分层抽样;(2)频率分布表求平均数; (3)2x2 列联表独立性检验
2023年第19题
条件概率,离散型随机变量的分布列和期望的计算,决策问题
预测
1. 作为解答题(通常位于中段,如第17或18题),分值14分。题目阅读量较大,背景贴近现实生活、科学实验或社会调查。
2. 题目往往呈现一个完整的“问题情境→数据收集/描述→模型构建→统计推断→决策建议”的微缩过程,考查学生运用统计思维解决实际问题的能力。
3.侧重对随机现象的理解,对离散型、连续型随机变量分布的理解与应用,以及利用概率进行决策;侧重对数据的处理(图表、数字特征)、利用样本推断总体(估计、检验)、对统计方法的理解与评价。
4.与其它知识自然融合:与函数、数列、导数、不等式、算法思想的结合更加深入和自然。
备考核心
1. 新课标强化了全概率公式、贝叶斯公式、百分位数、随机模拟、2×2列联表的独立性检验、一元线性回归模型等内容。必须确保对这些新增和强化内容的理解毫无偏差,并掌握其基本应用。
2. 有意识地进行长题干题目的训练。练习时先勾画关键信息(总体、样本、条件、问题),用自己的话复述题意,明确“已知什么,求什么,用什么模型”。
3.(1)对常见概率模型(摸球、排队、比赛、质点运动等)进行归纳。(2)对统计应用题型(估计、检验、预测、评价)进行分类。(3)重点攻克条件概率与全概率公式、分布列与数列递推、正态分布应用这三大难点。
4.规范表达,强化“说理”:在练习中,不仅要算对,更要写清逻辑。
5.适当阅读一些科普性的统计案例文章,了解统计在社会科学、医学、经济学中的应用,理解“相关性不是因果性”、“统计显著与实际显著”等思想,这有助于更好地理解题目背景和出题意图
考点1 统计与概率
【典例1】(2026·上海徐汇·期末)从某校学生中随机抽出50名学生参加消防安全知识竞赛,根据竞赛成绩得到如图所示的频率分布直方图.数据的分组依次为,.
(1)求图中的值,并估计这50名学生的平均成绩.(同一组中的数据用该组区间的中点值作代表)
(2)若成绩在前的学生可获得“消防达人”称号,则成绩至少要达到多少分才可以被评为“消防达人”?
(3)从低于60分的学生中随机抽取2名学生,求这2名学生成绩不在同一分组的概率.
【变式1】(2026·上海静安·期末)为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.活动后,为了解阅读情况,学校统计了甲、乙两组各名学生的阅读量(单位:本),统计结果用茎叶图记录如下(十位数字作为“茎”,个位数字作为“叶”),其中乙组记录中有一个数据模糊,无法确认,在图中以表示.
(1)若甲组阅读量的平均值大于乙组阅读量的平均值,求的所有可能取值;
(2)记甲组阅读量的方差为;在甲组中增加一名学生得到“新甲组”,若的阅读量为,则记“新甲组”阅读量的方差为;若的阅读量为,则记“新甲组”阅读量的方差为;比较、、的大小
(写出结果即可).
(3)将甲、乙两组中阅读量超过本的学生称为“阅读达人”,从甲、乙两组学生中各随机抽取一人,则至少有一名学生是阅读达人的概率是多少?
【变式2】(2026·上海青浦一模)某芯片代工厂生产甲、乙两种型号的芯片,为了解芯片的某项指标,从这两种芯片中各抽取100件进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计总体,以事件发生的频率作为相应事件发生的概率.
(1)求频率分布直方图中的值
(2)估计乙型芯片该项指标的平均值(同一组中的数据用该组区间的中点值为代表);
(3)已知甲型芯片指标在为航天级芯片,乙型芯片指标在为航天级芯片.现分别采用分层抽样的方式,从甲型芯片指标在内取2件,乙型芯片指标在内取4件,再从这6件中任取2件,求这2件都是航天级芯片的概率.
考点2 概率与线性回归
【典例2】(2025·上海浦东新·三模)某科研活动共进行了5次试验,其数据如表所示:
特征量
第1次
第2次
第3次
第4次
第5次
(1)求成对数据的相关系数;
(2)求特征量关于的回归方程,并据此估算特征量时的值;
(3)设特征量作为随机变量服从正态分布,其中为5次试验中的平均数,为5次试验中的方差.求.(本题所有答数精确到0.01.)
【变式1】某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
【变式2】某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如下:
(1)根据散点图求y关于x的经验回归方程(精确到0.01);
(2)根据线性回归方程,绘制残差图,并分析线性回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差).
附:,.
考点3 概率与统计案例
【典例3】在某次草地音乐节上,为了解音乐节的体验情况,从观众中随机选取了100人进行问卷调查.
(1)根据观众的性别以及是否购买乐队官方周边,得到如下数据:
男性
女性
总计
购买周边
21
49
70
不购买周边
15
15
30
总计
36
64
100
根据以上信息,是否有的把握认为观众购买乐队官方周边与观众的性别有关?
参考公式:,其中;参考数据:.
(2)根据调查数据,该音乐节观众的排队安检时间(单位:分钟)服从正态分布.从观众中随机抽取1人,若其排队安检时间超过10分钟,求其排队安检时间超过12分钟的概率.(结果精确到)参考数据:,其中为标准正态分布函数.
【变式1】手机是近年来备受关注的新一代智能终端,与智能网联新能源汽车、智能机器人等共同纳入国家发展战略.某商场为了解顾客的购买意愿,随机调查了200位顾客购买手机的情况,得到数据如下表.
购买手机
购买无技术的手机
总计
男性顾客
45
65
110
女性顾客
56
34
90
总计
101
99
200
(1)根据表中数据,判断是否有99%的把握认为购买手机与顾客的性别有关?并说明理由:
(2)为促进手机的销量,该商场为购买手机的顾客设置了抽奖环节,共设一、二等奖两种奖项,分别奖励200元、100元手机话费,抽中一、二等奖的概率分别为和,其余情况不中奖.每位顾客允许连续抽奖两次,且两次抽奖相互独立.记某位顾客两次抽中的奖金之和为元,求随机变量的数学期望.
参考公式及数据:①,其中.
②,,,.
【变式2】(2026·上海杨浦·期末)AI手机是近年来备受关注的新一代智能终端,与智能网联新能源汽车、智能机器人等共同纳入国家发展战略.某商场为了解顾客的购买意愿,随机调查了200位顾客购买AI手机的情况,得到数据如下表.
购买AI手机
购买无AI技术的手机
总计
男性顾客
45
65
110
女性顾客
56
34
90
总计
101
99
200
(1)根据表中数据,判断是否有99%的把握认为购买AI手机与顾客的性别有关?并说明理由;
(2)从这90位女性顾客中随机挑选4位,求其中至少有2位购买AI手机的概率(精确到0.01);
(3)为促进AI手机的销量,该商场为购买AI手机的顾客设置了抽奖环节,共设一、二等奖两种奖项,分别奖励200元、100元手机话费,抽中一、二等奖的概率分别为和,其余情况不中奖.每位顾客允许连续抽奖两次,且两次抽奖相互独立.记某位顾客两次抽中的奖金之和为元,求随机变量的数学期望.
参考公式及数据:①,其中.
②,,,.
考点4 条件概率与全概率公式的应用
【典例4】(2026·上海闵行·二模)在临床检测试验中,某地用某种抗原来诊断试验者是否患有某种疾病.设事件表示试验者的检测结果为阳性,事件表示试验者患有此疾病,据临床统计显示,,.已知该地人群中患有此种疾病的概率为.(下列两小题计算结果中的概率值精确到)
(1)对该地某人进行抗原检测,求事件与同时发生的概率;
(2)对该地个患有此疾病的患者进行抗原检测,用随机变量表示检测结果为阳性的人数,求的分布和期望.
【变式1】(2025·上海黄浦·二模)一盒子中有大小与质地均相同的20个小球,其中白球个,其余为黑球.
(1)当盒中的白球数时,从盒中不放回地随机取两次,每次取一个球,用表示事件“第一次取到白球”,用表示事件“第二次取到白球”,求和,并判断事件与是否相互独立;
(2)某同学要策划一个抽奖活动,参与者从盒中一次性随机取10个球,若其中恰有3个白球,则获奖,否则不获奖,要使参与者获奖的可能性最大、最小,该同学应该分别如何放置白球的数量?
【变式2】(2025·上海·三模)某电台举办有奖知识竞答比赛,选手答题规则相同.甲每道题自己有把握独立答对的概率为,若甲自己没有把握答对,则在规定时间内连线亲友团寻求帮助,其亲友团每道题能答对的概率为,假设每道题答对与否互不影响.
(1)当时,
(i)若甲答对了某道题,求该题是甲自己答对的概率;
(ii)甲答了4道题,计甲答对题目的个数为随机变量,求随机变量的分布列和数学期望;
(2)乙答对每道题的概率为(含亲友团),现甲乙两人各答两个问题,若甲答对题目的个数比乙答对题目的个数多的概率不低于,求甲的亲友团每道题答对的概率的最小值.
考点5 相互独立事件概率与期望、方差
【典例5】(2025·上海青浦·三模)口袋里装有大小与质地相同的4个红球和8个白球,甲、乙两人从袋中摸球,每次摸1个球.
(1)若甲、乙两人无放回地摸球,由甲先摸1个球,乙再摸1个球,求甲摸到白球的条件下,乙摸到红球的概率;
(2)制定规则如下:若一方摸出1个红球,则此人继续下一次摸球,若一方摸出1个白球,则由对方接替下一次摸球,由甲进行第一次摸球.
①若甲、乙两人无放回地摸球,求第三次仍由甲摸球的概率;
②若甲、乙两人每次摸球后都放回地摸球,求在前两次摸球中,甲摸得的红球次数的分布及期望.
【变式1】同学们,你们知道排球比赛的规则和积分制吗?其规则是:每局25分,达到24分时,比赛双方必须相差2分,才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3∶0或3∶1取胜的球队积3分,负队积0分;以3∶2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1
2
3
4
5
6
甲
25
21
27
27
23
25
乙
18
25
25
25
25
17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分X的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,请比较两队积分相等的概率与的大小
考点6 结合二项分布或超几何分布求期望、方差并决策
【典例6】(2025·上海普陀·二模)某区为推进教育数字化转型,通过聚合区域学校的教育资源,依托AI技术搭建了区域智慧题库系统,形成了“通识过关—综合拓展—创新提升”三层动态原库,且三层题量之比为,设该题库中任意1道题被选到的可能性都相同.
(1)现有4人参加一项比赛,若每人分别独立地从该题库中随机选取一道题作答,求这4人中至少有2人的选题来自层的概率;
(2)现采用分层随机抽样的方法,使用智能组卷系统从该题库中选取12道题生成试卷,若某老师要从生成的这份12道题的试卷中随机选取3道题做进一步改编,记该老师选到层题的题数为,求的分布与期望.
【变式1】某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布.
(1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到);
(2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到).
参考数据:,,,其中为标准正态分布函数.
1.(2025·上海长宁·一模)小明有自觉体锻的习惯,某运动软件记录了其每天运动的时长(单位:min),小明从最近90天的记录中随机选取了10天的记录,具体数据如下:
(1)求这组数据的第60百分位数:
(2)运动时长不超过60min为不达标,估算从90天记录中随机抽取1天,该天运动时长不达标的概率:
(3)从这10个数中随机删除2个数得到一组新的数据,求前后两组数据的极差相同的概率.
2.(2025·上海杨浦·一模)为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人?
(3)若落在学生的平均成绩是,方差是,落在学生的平均成绩为,方差是,求这两组学生成绩的平均数和方差.(结果精确到)
3.(2023·上海浦东新·模拟预测)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中)
6
60
(1)利用样本相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?
(2)根据(1)的结果回答下列问题:
(i)建立关于的回归方程;
(ii)样本对原点的距离时,金属含量的预报值是多少?
(3)已知该金属在距离原点米时的平均开采成本(单位:元)与关系为,根据(2)的结果回答,为何值时,开采成本最大?
4.(2025·上海浦东新·三模)申辉中学机器人兴趣小组,进行某款机器人研发学习活动.该机器人被设计从数轴上的原点出发,机器人每一步只能选择向数轴正方向或向负方向行走1个单位.设机器人第步选择向正方向行走的概率为.设行走步后机器人所在位置对应的数为随机变量.
(1)兴趣小组成员小浦对机器人行走的步数和机器人所在位置进行了观察记录,记录数据如下:
n
1
2
3
4
5
1
2
1
2
3
请求出变量和之间的线性相关系数:
(2)若,求;
(3)已知,在的条件下,求的概率.
5.(24-25高三下·上海虹口·期中)已知某区组建了一支120人的志愿者队伍,并由其中72人组成“志愿模范队”.经过一年的实践,全队共有72人的周平均服务时长超过2小时,其中有54人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
54
72
周平均服务时长不超过2小时
总计
72
120
(1)已知一名志愿者是“志愿模范队”成员,求其周平均服务时长超过2小时的概率.
(2)请完成列联表,并根据表中数据回答:是否有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系?
(3)现从周平均服务时长超过2小时的人员中按照是否为“志愿模范队”成员进行分层抽样,选取8人组建“志愿突击队”,并从这8人中再随机选取2人做深度访谈,记随机变量为这2人中来自于“志愿模范队”的人数,求的分布与方差
附录:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
6.(2025·上海金山·二模)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
附:;
0.10
0.01
0.001
2.706
6.635
10.828
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布列和期望.
7.(2025·上海浦东新·二模)为测试、两款人工智能软件解答数学问题的能力,将道难度相当的数学试题从到编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,并记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
几何试题
函数试题
(1)分别估计软件、软件能正确解答数学问题的概率;
(2)小浦准备用这两款软件来解决某次数学测试中的第题(假设其难度和测试的道题基本相同),但该题内容还未知,从已往情况来看,该题是几何题的概率为,是函数题的概率为.将频率视为概率,试通过计算来说明小浦应该用哪款软件解决这道试题?
(3)小浦决定采用这两款软件解答道类似试题,其中几何、函数各道,每道试题只用其中一款软件解答一次.将频率视为概率,小浦比较了这两款软件在解答几何和函数题上的正确率,决定用表现较好的那款软件解决其擅长的题型.用、分别表示这道几何试题与道函数试题被正确解答的个数,求随机变量的数学期望和方差.
8.(2024·上海奉贤·三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.
(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;
(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:
假设1:各回合比赛相互独立;
假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;
求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?
9.(2025·上海杨浦·二模)为弘扬中华民族传统文化、增强民族自豪感,某学校开展中华古诗词背诵比赛,分为初赛和复赛.全校同学都参加了初赛,并随机抽取一个班级进行初赛成绩统计,已知该班级共有40位学生,他们的初赛分数的频率分布直方图如图所示:
(1)计算的值,并估计该校这次初赛的平均分数.
(2)初赛分数达到80及以上的同学,称为优秀参赛选手,现从班级中随机选出2位同学,用代表其中的优秀参赛选手人数,求的分布;
(3)为增加比赛的趣味性,复赛规则如下:复赛试题将从题库中随机抽取,每位参赛选手将有机会回答填空、选择和简答各1题;每答对1题得1分,答错或不答得0分,每位选手可以自行选择回答问题的顺序,若答对一题可继续答下一题,直到3题全部答完;若答错或不答则比赛结束.例如:选手甲可自行按“简答—填空—选择”顺序答题,甲答对第一题得1分,并继续回答第二题且答错得0分,结束比赛,总分为1分.
小杨作为优秀参赛选手,代表班级参加复赛.根据他初赛的答题正确频率,可估计他填空、选择和简答的答题正确概率分别为:
题型
填空
选择
简答
答题正确概率
若小杨每次答题的结果都相互独立,那么为尽量在比赛中获得较高分数,小杨应该采用怎样的答题顺序?请说明理由.
10.(2025·上海松江·二模)某校组织学生在周末时间利用DeepSeek等人工智能平台进行线上学习,但要求学生学习时间不超过4小时.现从该校高三学生某周末的线上学习时间统计数据中,随机抽取100个学生的学习时间进行分析,绘制成如下频率分布直方图.以抽取的100个学生该周末线上学习时间作为样本,估计该校高三年级全体学生周末线上学习时间的情况.
(1)试估计该校高三学生周末线上学习时间的平均数及中位数(注:为了计算均值,可用区间的中点值给区间内的每个数据赋值);
(2)现从全部高三年级学生中随机抽取人,若其中有4人周末线上学习的时间不小于3小时的可能性最大,求的值.
11.(2026·上海·模拟预测)某地区为了解居民体育锻炼达标情况与性别之间的关系,随机调查了600位居民,得到如下数据:
不达标
达标
合计
男
300
女
100
300
合计
450
600
(1)完成列联表,根据显著性水平的独立性检验,能否认为体育锻炼达标与性别有关?
(2)若体育锻炼达标的居民体能测试合格的概率为,体育锻炼未达标的居民体能测试合格的概率为,用上表中居民体育达标的频率估计该地区居民体育达标的概率,现从该地区居民中随机抽取1人参加体能测试,求其体能测试合格的概率;
(3)在(2)的条件下,从该地区居民中随机抽取3人参加体能测试,求3人中体能测试合格的人数X的分布、数学期望及方差.
附:,.
12.(2026上海杨浦·模拟预测)为吸引客流,某商场举办了“摸球赢好礼”活动,一共设置两关游戏.第一关游戏开始时,主持人在空箱子中放入大小、形状完全相同的1黑、3红共4个球,顾客从箱子中随机且不放回地依次摸出两个球,只要能摸出黑球,便可晋级第二关游戏“赢积分、换好礼”.
(1)小江正在参与第一关游戏.记事件为“小江摸出的第一个球是红球”,事件为“小江晋级了第二关游戏”,分别求;
(2)小江成功晋级第二关游戏.已知第二关游戏规则如下:游戏开始前,顾客要先决定好摸球的局数,而后主持人在空箱子中放入大小、形状完全相同的1黑、3红及白共个球,并充分搅匀.游戏过程中,顾客每局均从箱子里随机摸出一个球,确认颜色并按规则积分,然后把球放回箱子,充分搅匀后再进行下一局摸球,以此类推,直到摸完局球,第二关结束.记分规则如下:
颜色
黑色
红色
白色
得分
+10
在第二关中,顾客的初始积分为0分,将每一局所得积分累加得到最终积分.最终积分越高,所换取的礼品价值越大.
①若小江决定摸球的局数,求她在第二局中所得积分的分布与期望;
②为使最终的期望收益最大化,小江应该如何设定摸球的次数?
1 / 7
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
题号猜押01 上海卷高考数学第17题(解答题)
参考答案
考点1 统计与概率
【典例1】【解】(1)由,
得,
平均数为;
(2)
前4个矩形面积为:
,
前5个矩形面积为:
,
所以若成绩在前的学生可获得“消防达人”的称号,
则成绩至少要达到;
(3)区间有人,区间有人,
设内两人为,内3人为,
则随机抽取2名学生有:,共10种结果,
来自不同组的有,共6种结果,
所以这2名学生成绩不在同一分组的概率为.
【变式1】【解】(1)甲组10名学生阅读量的平均值为,
乙组10名学生阅读量的平均值为,
由,解得,又,,可得,,
故图中的取值为1或2.
(2)因为
,
若的阅读量为,则“新甲组”阅读量的平均数为,
则
,
若的阅读量为,则“新甲组”阅读量的平均数为,
则
所以.
(3)由茎叶图知,甲、乙两组中的“阅读达人”的人数分别为2人,3人,
所以甲、乙两组学生中各随机抽取一人,则至少有一名学生是阅读达人的概率是.
【变式2】【解】(1)由题意得,解得.
(2)由频率分布直方图得乙型芯片该项指标的平均值:
.
(3)由甲型芯片的频率分布直方图可知指标在和的频率相同,
根据分层抽样得,来自甲型芯片指标在和的各1件,分别记为和,
由乙型芯片的频率分布直方图可知指标在和的频率之比为,
所以根据分层抽样得,来自乙型芯片指标在和的分别为3件和1件,分别记为和,
从中任取2件,样本空间可记为:,
共15个,
记事件:这2件都是航天级芯片,则共1个,
所以.
考点2 概率与线性回归
【典例2】【解】(1)由条件可知,,,
,
,
,
所以;
(2),
,
所以,
当时,;
(3),所以,,
,,
所以.
【变式1】【解】(1)该地被调查村的村户年平均收入的估计值为(万元);
(2)样本的相关系数为
;
(3)采用分层抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地更准确的验收估计.
【变式2】【解】(1)由图得,,
则,
故,
则y关于x的经验回归方程为.
(2)结合(1),计算得残差如下表:
行驶速度
60
70
80
90
100
110
油耗实际值
7.5
6.8
6.2
5.7
5.4
5
油耗估计值
7.35
6.85
6.35
5.85
5.35
4.85
残差
0.15
0.05
0.15
因此残差分布图如下:
因为,
所以经验回归方程的拟合效果较好.
考点3 概率与统计案例
【典例3】【解】(1)假设:观众购买乐队官方周边与观众的性别无关.
根据公式,
因为,所以不拒绝原假设,
即没有的把握认为观众购买乐队官方周边与观众的性别有关.
(2)因为(单位:分钟)服从正态分布,
所以.
.
所以所求的概率为.
【变式1】【解】(1)假设:购买手机与顾客性别无关.
根据公式,
因为,所以假设不成立,
即我们有的把握认为购买手机与顾客的性别有关,此判断犯错误概率不超过0.01.
(2)可能取的值为0,100,200,300,400,
每次抽奖不中的奖的概率为,中元概率为,中元概率为,
,
,
,
,
,
所以的分布列为
0
100
200
300
400
所以期望为.
【变式2】【解】(1)作原假设:购买AI手机与顾客的性别无关,取,,
因为,所以否定原假设,即有99%的把握认为购买AI手机与顾客的性别有关.
(2).
(3)法1:可取值,
而,,
,,
,
故的分布为,
期望.
法2:设第次抽中奖金为,由题设可得的分布为,
从而,而相互独立,故.
考点4 条件概率与全概率公式的应用
【典例4】【解】(1)由题意知:,,
,
即事件与同时发生的概率为.
(2),,
所有可能的取值为,
;;;;
的分布为,数学期望.
【变式1】【解】(1)当时,盒中有6个白球,14个黑球,,,
,
,则,所以事件与相互不独立.
(2)从20个球中取10个球,恰有3个白球的概率,
设,当时,,
,当时,,
当时,,因此,
而,则,
所以当时,参与者获奖的可能性最大;当时,参与者获奖的可能性最小.
【变式2】【解】(1)(i)记事件为“甲答对了某道题”,事件为“甲自己答对”,
则,,
所以.
(ii)可能取值为0,1,2,3,4,甲答对某道题的概率,
则,
所以的分布列为:
0
1
2
3
4
数学期望.
(2)记事件为“甲答对了道题”,事件为“乙答对了道题”,
其中甲答对某道题的概率为,答错某道题的概率为,
则,
,
,
所以甲答对题数比乙多的概率为:
,解得,
所以甲的亲友团助力的概率的最小值为.
考点5 相互独立事件概率与期望、方差
【典例5】【解】(1)口袋共有12个球,甲先摸球,摸到白球的概率为,
甲摸到白球后,口袋还剩11个球,其中红球有4个,则甲摸到白球且乙摸到红球的概率为,
综上,甲摸到白球的条件下,乙摸到红球的概率为;
(2)①由题设,满足要求的情况有甲第一次摸到红球,第二次也摸到红球;甲第一次摸到白球,乙第二次摸到白球;
所以若甲、乙两人无放回地摸球,第三次由甲摸球的概率为;
②由题意,的可能值为,且,,,
所以的分布列如下,
0
1
2
则.
【变式1】【解】(1)由表可知:6场比赛甲赢了4场,则甲每局获胜的频率为,
用频率估计概率,所以甲队每局获胜的概率为.
(2)随机变量的所有可能取值为0,1,2,3,
可得:,,
,,
所以的分布列为
0
1
2
3
所以数学期望.
(3)记“甲、乙比赛两场后,两队积分相等”为事件,
设第场甲、乙两队积分分别为,,则,,2,
因两队积分相等,所以,即,则,
而,,
,
所以
,
因为,所以两队积分相等的概率小于
考点6 结合二项分布或超几何分布求期望、方差并决策
【典例6】【解】(1)因为三层题量之比为,
所以在层选题的概率为,不在层选题的概率为,
设至少2人的选题来自层的概率为,从层选题数量为,
由题意得,而二项分布概率公式为,
则至少2人的选题来自层的概率为,
故.
(2)因为三层题量之比为,
所以在层最多抽到7道,且可取,
则,
,
其分布列为
X
P
所以期望.
【变式1】【解】(1)由题意,,的概率等于.
令,则.
因此,
.
故净含量误差超过5g的概率约为.
(2)可能的取值为0、1、2、3.
由(1)可知,任取一包糖果,净含量小于497.5g的概率为.
故服从二项分布,记,
,
从而的分布为
0
1
2
3
0.595
0.337
0.064
0.004
因此.
1.【解】(1)把10天的记录按照从小到大排列为:,
因为是整数,所以第60百分位数为第6个数与第7个数的平均数,
因为,这组数据的第60百分位数为71;
(2)因为选取的样本中运动时长不达标的频率为,
所以估计该天运动时长不达标的概率为0.3;
(3)因为前后两组数据的极差相同,所以随机删除的2个数为中的两个,
则概率
2.【解】(1)由频率分布直方图可得,
解得.
(2)由频率分布直方图知,样本考核成绩在,,的三组学生有(人),
其中样本考核成绩在的市民人数为,
用分层抽样的方法应从考核成绩在的市民中抽取(人).
(3)由频率分布直方图知,成绩在的学生人数为,
成绩在的市民人数为,
所以总平均数,
总方差.
3.【解】(1)因为的线性相关系数,
的线性相关系数,
,
更适宜作为平均金属含量关于样本对原点的距离的回归方程类型.
(2)(i)依题意,可得,
,
,关于的回归方程为.
(ii)当时,金属含量的预报值为.
(3)因为,
令,则,
当时,,在上单调递增;
当时,,在上单调递减,
在处取得极大值,也是最大值,此时取得最大值,
故为10时,开采成本最大.
4.【解】(1)由表可知:
,
,,,
代入相关系数的公式可得:.
(2)由题可知的所有可能取值为,,,,
表示三次均向正方向行走,故;
表示两次选择正方向,一次选择负方向行走,故;
表示一次选择正方向,两次选择负方向行走,故;
表示三次均选择负方向行走,故,
所以.
(3)设为事件A,为事件,,
其中,,
,故.
5.【解】(1)由表可知,若一名志愿者是“志愿模范队”成员,则其周平均服务时长超过2小时的概率:.
(2)根据题意,可将表格补充完整:
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
54
18
72
周平均服务时长不超过2小时
18
30
48
总计
72
48
120
故,
所以有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系.
(3)由分层抽样可知,这8人中有6个来自“志愿模范队”,2个不是“志愿模范队”成员,
故随机变量可能为
且,
故分布列如下:
0
1
2
所以期望:,
方差:.
6.【解】(1)完善列联表,如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
6
20
不是每天都整理数学错题人数
5
15
20
合计
19
21
40
每天都整理数学错题且数学成绩总评优秀的经验概率为.
(2)由(1)得,
所以有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(3)不是每天都整理数学错题的学生有20人,其中数学成绩总评优秀人数为5,
的所有可能值为0,1,2,3,
,
,
所以的分布列为:
0
1
2
3
期望.
7.【解】(1)记、软件能正确解答数学问题的概率为和,
结合题中数据以及古典概型的概率公式可得,.
(2)记“软件能正确解答这道题”为事件,“软件能正确解答这道题”为事件,
“该题为几何题”为事件.
则,,,,,,
由全概率公式可得.
.
因为,所以软件能够正确解决这道试题的概率更大,
故小浦应该使用软件来解决这道试题.
(3)几何试题用软件解答,函数试题用软件解答.
因为,,
由二项分布的期望公式可得,,
由二项分布的方差公式可得,,
因为、相互独立,则,
.
8.【解】(1)设事件表示第一回合该中国队运动员赢球,事件表示第二回合该中国队运动员赢球,
事件表示第二回合比赛有运动员得分,
由已知,, ,
则
,
即第二回合比赛有运动员得分的概率为.
(2)设运动员甲先发球,记事件表示第i回合该运动员甲赢球,
记事件表示运动员甲先得第一分,
则,
则,
所以,即则第一回合发球者在整场比赛中先得第一分的概率大于,
则比赛双方运动员实力相当的情况下,先发球者更大概率占据心理上的优势,所以旧制不合理.
9.【解】(1)由频率分步直方图中小矩形的面积和为1可得:
,
解得;
该校这次初赛的平均分数为.
(2)初赛分数达到80及以上的同学为人,非优秀为28人,
由题意可得的可能取值为,
,
,
,
所以的分布列为:
0
1
2
(3)按照不同题目顺序分类讨论:
填空,选择,简答:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“简答,选择,填空”的期望与之相同;
填空,简答,选择:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“简答,填空,选择”的期望与之相同;
选择,填空,简答:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“选择,简答,填空”的期望与之相同;
所以,
小杨应采用“选择,填空,简答”或“选择,简答,填空”的顺序.
10.【解】(1)(小时).
因为学习时间小于3小时的频率为,
所以中位数在内,由,解得小时.
(2)由频率分布直方图可知,学习时间不小于3小时的频率为.
设从全部高三年级学生中随机抽取人,线上学习时间不小于3小时的人数为,
其中有4人周末线上学习时间不小于3小时的概率为,
所以.要使最大,
则,
解不等式组得,因为为正整数,所以或7.
所以或7时,最大.
11.【解】(1)根据数据补全列联表如下:
不达标
达标
合计
男
50
250
300
女
100
200
300
合计
150
450
600
零假设体育锻炼达标与性别无关,
由表格数据得,
因为,
所以推断不成立,依据显著性水平的独立性检验能认为体育锻炼达标与性别有关.
(2)由表格数据该地区居民体育达标的概率为,
记事件“从该地区居民中随机抽取1人参加体能测试,其体能测试合格”,
则由题.
(3)由题意,当地居民人口基数大,可近似看做二项分布,即,
所以;;
;;
所以X的分布列为:
X
0
1
2
3
P
则;.
12.【解】(1)
(2)①,则箱子中共有个球,其中黑、红及白,
由题意可知,的所有可能取值为10,5,,且
,
所以其分布列如下:
10
5
.
②设小江应该设定摸球的次数为,则
每局期望为:
总期望为:
令
当且仅当时取等号,即,所以
所以小江应该设定摸球次时,收益最大.
1 / 7
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$