内容正文:
猜押06 上海高考19题(解答题)
考点
3年考题
考情分析
概率统计
2025年春考
百分位数、古典概型、排列组合、平均数等基础知识
2024年
(1)分层抽样;(2)频率分布表求平均数; (3)2x2 列联表独立性检验
2023年
离散型随机变量的分布列和期望的计算,
题型一 用样本估计总体
1.(24-25高三·上海·课堂例题)某地区为了解学生课余时间的读书情况,随机抽取了名学生进行调查,将调查得到的学生日均课余读书时间分成,,,,,六组,绘制成如图所示的频率分布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于10分钟的有10人.
(1)求和的值;
(2)根据已知条件和下面表中两个数据完成下面的列联表,并判断是否有的把握认为“读书之星”与性别有关?
非读书之星(人)
读书之星(人)
总计(人)
男
女
10
55
总计
参考公式:.
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
2.(24-25高三·上海·课堂例题)某公司研发了一款新产品,按行业标准这款新产品可分为一级正品、二级正品、次品共三个等级.根据该公司测算:生产出一件一级正品可获利1000元,一件二级正品可获利200元,一件次品亏损600元.该公司试生产这款新产品1000件,并统计了这些产品的等级,如下表:
等级
一级正品(件)
二级正品(件)
次品(件)
频数
500
300
200
(1)对于该公司试生产出来的这1000件产品,平均每件的产品利润是多少元?
(2)该公司为了解消费者对这款产品的满意度,随机调查了50名男性消费者和50名女性消费者,每位消费者对这款产品给出满意或不满意的评价,得到下面的列联表:
满意(人)
不满意(人)
总计(人)
男性消费者
35
15
50
女性消费者
15
35
50
总计
50
50
100
问:能否认为男性消费者和女性消费者对这款产品的评价有差异?
3.(25-26高三上·上海·单元测试)为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
4.(24-25高三上·上海松江·期中)某景区为更好地提升旅游品质,随机选择100名游客对景区进行满意度评分(满分100分),根据评分,制成如图所示的频率分布直方图.
(1)根据频率分布直方图,求的值;
(2)估计这100名游客对景区满意度评分的70%分位数;
(3)若采用按比例分层抽样的方法从评分在的两组中共抽取6人,再从这6人中随机抽取2人进行个别交流,求选取的2人评分分别在和内各1人的概率.
5.(24-25高三上·上海·期中)某中学举行了一次“数学文化知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩 作为样本进行统计. 将成绩进行整理后,分为五组 , ,,, ,其中第一组的频数的平方为第二组和第四组频数的乘积.请根据下面的频率分布直方图,解决以下问题.
(1)若根据这次成绩,学校准备淘汰 70% 的同学,仅保留 30% 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?(四舍五入精确到 1 分)
(2)从样本数据在 两个小组内的同学中,用分层抽样的方法抽取 6 名同学,再从这 6 名同学中随机选出 2 人,求选出的两人恰好来自不同小组的概率;
(3)某老师在此次竞赛成绩中抽取了 10 名同学的分数: ,已知这 10 个分数的平均数 . 方差 ,若剔除其中的最高分 98 和最低分 86,求剩余 8 个分数的平均数与方差.
6.(24-25高三下·上海·阶段练习)某兴趣小组对高三刚结束的物理测试成绩进行随机调查,将所有选考物理的考生按是否同时选考化学分为A、B两类,并从中随机抽取100名考生的成绩,整理数据如下表(单位:人)
物理成绩学生分类
A类男生
2
8
15
8
B类男生
3
10
20
4
A类女生
3
4
2
1
B类女生
10
6
4
0
(1)估计该校高三学习物理男生人数与女生人数之比;
(2)求A类考生物现平均成绩的估计值(同一组中的数据用该组区间中点值代表,结果四舍五入到整数);
(3)把成绩在称为“合格”,成绩在称为“不合格”,是否有95%的把握认为该校考生的本次物理成绩合格与否和性别有关?
附:,其中.
7.(24-25高三下·上海·阶段练习)某区为全面提高青少年健康素养水平,举办了“健康素养知识竞赛”,分预赛和复赛两个环节,预赛成绩采用百分制,排名前三百名的学生参加复赛.已知共有10000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下频率分布直方图:
(1)由频率分布直方图,可认为该市全体参加预赛学生的预赛成绩Z近似服从正态分布,其中可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组区间的中点值代替),且,已知小明的预赛成绩为95分,利用该正态分布,估计小明是否有资格参加复赛?
(2)复赛规则如下:①复赛题目由A,B两类问题组成,答对A类问题得30分,不答或答错得0分;答对B类问题得70分,不答或答错得0分;②A,B两类问题的答题顺序可由参赛学生选择,但只有在答对第一类问题的情况下,才有资格答第二类问题.
已知参加复赛的学生甲答对A类问题的概率为0.8,答对B类问题的概率为0.6,答对每类问题相互独立,且与答题顺序无关.为使累计得分的期望最大,学生甲应选择先回答哪类问题?并说明理由.
附:若,则,,.
8.(24-25高三下·上海青浦·阶段练习)去年上海进口博览会智能科技展区,主办方统计了20天的每日接待客户人数(单位:人次),并制作了如下茎叶图:
(1)求这组数据的第16、第70百分位数;
(2)现从这20天中随机抽取1天,求这天的接待人数在50人次至69人次之间的概率;
(3)主办方预计今年进博会期间,该展区日均接待人数将同比增长15%.假设接待人数的分布情况与去年相同,试估计今年进博会期间(同样为20天),接待人数超过70人次的天数所占比例,并说明理由.
9.(2025·上海·模拟预测)甲、乙是两个体育社团的小组.如下是两组组员身高的茎叶图(单位:厘米),以身高的百位数和十位数作为“茎”排列在中间、个位数作为“叶”分列在两边.
(1)求甲、乙两组组员身高的第60百分位数;
(2)从甲、乙两组各选取一个组员,求两人身高均在170厘米以上的概率;
(3)为使两组人数相同,从甲组中调派一个队员到乙组.是否存在甲组的一个组员,将他调派至乙组后,甲、乙两组的平均身高都增大?
10.(2025·上海崇明·二模)某区2025年3月31日至4月13日的天气预报如图所示.
(1)从3月31日至4月13日某天开始,连续统计三天,求这三天中至少有两天是阵雨的概率;
(2)根据天气预报,该区4月14日的最低气温是9,温差是指一段时间内最高温度与最低温度之间的差值,例如3月31日的最高温度为17,最低温度为9,当天的温差为8记4月1日至4日这4天温差的方差为,4月11日至14日这4天温差的方差为,若,求4月14日天气预报的最高气温;
(3)从3月31日至4月13日中随机抽取两天,用X表示一天温差不高于9的天数,求X的分布列及期望.
11.(2025·上海嘉定·二模)某学校对学生的课外阅读时间进行调查,随机抽取了150位学生,得到如下样本数据频率分布直方图.
(1)估计该校学生的平均课外阅读时间;(同一组数据用该区间的中点值作代表)
(2)估计该校学生课外阅读时间位于区间(单位:小时/月)的概率;
(3)已知该校喜欢阅读的学生占比为18%,初一年级学生占该校总学生数的28%,且初一年级学生中喜欢阅读的占40%,求其他年级学生中喜欢阅读的比例.(精确到0.1%)
12.(2025·上海杨浦·二模)为弘扬中华民族传统文化、增强民族自豪感,某学校开展中华古诗词背诵比赛,分为初赛和复赛.全校同学都参加了初赛,并随机抽取一个班级进行初赛成绩统计,已知该班级共有40位学生,他们的初赛分数的频率分布直方图如图所示:
(1)计算的值,并估计该校这次初赛的平均分数.
(2)初赛分数达到80及以上的同学,称为优秀参赛选手,现从班级中随机选出2位同学,用代表其中的优秀参赛选手人数,求的分布;
(3)为增加比赛的趣味性,复赛规则如下:复赛试题将从题库中随机抽取,每位参赛选手将有机会回答填空、选择和简答各1题;每答对1题得1分,答错或不答得0分,每位选手可以自行选择回答问题的顺序,若答对一题可继续答下一题,直到3题全部答完;若答错或不答则比赛结束.例如:选手甲可自行按“简答—填空—选择”顺序答题,甲答对第一题得1分,并继续回答第二题且答错得0分,结束比赛,总分为1分.
小杨作为优秀参赛选手,代表班级参加复赛.根据他初赛的答题正确频率,可估计他填空、选择和简答的答题正确概率分别为:
题型
填空
选择
简答
答题正确概率
若小杨每次答题的结果都相互独立,那么为尽量在比赛中获得较高分数,小杨应该采用怎样的答题顺序?请说明理由.
题型二 变量间的相关关系
1.(24-25高三·上海·课堂例题)2020年1月15日,教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力和判断力进行统计分析,得到下表数据:
6
8
9
10
12
2
3
4
5
6
请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合,并求关于的线性回归方程(精确到0.01);
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为、、,其中,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时的取值范围.
2.(24-25高三·上海·课堂例题)某饮料店为了推广“秋天的第一杯奶茶”,需了解一天的平均气温与奶茶销量之间的关系,为此记录了周一至周五的平均气温与奶茶销量(杯)的数据,如表所示:
9
11
12
10
8
23
26
30
25
21
(1)画出散点图;
(2)根据上表提供的数据,求出关于的经验回归方程;
(3)试根据(2)中求出的经验回归方程,预测平均气温约为时该饮料店的奶茶销量.
3.(24-25高三·上海·课堂例题)下面的数据是年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平(满分100),以及每天花在看电视上的平均时间(小时).
看电视的平均时间
4.4
4.6
2.7
5.8
0.2
4.6
心脏功能水平
52
53
69
57
89
65
(1)求心脏功能水平与每天花在看电视上的平均时间之间的相关系数;
(2)求心脏功能水平与每天花在看电视上的平均时间的线性回归方程,并讨论方程是否有意义;(系数保留两位小数)
(3)估计平均每天看电视3小时的男子的心脏功能水平.
4.(24-25高三·上海·课堂例题)如图,在实验室细菌培养过程中,细菌生长主要经历调整期、指数期、稳定期和衰亡期四个时期.在一定条件下,培养基上细菌的最大承载量(达到稳定期时的细菌数量)与培养基质量具有线性相关关系.某实验室在培养细菌的过程中,通过大量实验获得了以下统计数据:
培养基质量(g)
20
40
50
60
80
细菌的最大承载量(单位)
300
400
500
600
700
(1)建立关于的回归直线方程,并预测当培养基质量为100g时细菌的最大承载量;
(2)研究发现,细菌的调整期一般为3小时,其在指数期的细菌数量(单位)与细菌被植入培养基的时间近似满足函数关系,试估计在100g培养基上培养细菌时指数期的持续时间(精确到1小时).
5.(24-25高三·上海·课堂例题)某电商分析了近8年“双十一”期间的宣传费用(单位:万元)和利润(单位:万元)之间的关系,得到下列数据:
2
3
4
5
6
8
9
11
1
2
3
3
4
5
6
8
请回答:
(1)由表中数据,求线性回归方程,并预测当时,对应的利润为多少(、、精确到0.1)
参考数据:,.
(2)为了更好地完成任务,某电商决定让宣传部门的3名成员各自制订两个方案,从中任选2个方案进行宣传,求这2个方案出自同一个人的概率.
6.(24-25高三·上海·课堂例题)某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,得到的实验数据经整理得到如下的折线图:
参考数据:,,.
(1)由图可以看出,这种酶的活性指标值与温度具有较强的线性相关性,请用相关系数加以说明;
(2)求关于的线性回归方程,并预测当温度为30℃时,这种酶的活性指标值.(计算结果精确到0.01)
7.(24-25高三·上海·课堂例题)有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第二行表示此种食品所含热量的百分比,第三行数据表示由一些美食家以百分制给出的对此种食品口味的评价:
品牌
A
B
C
D
E
F
G
H
I
J
所含热量的百分比
25
34
20
19
26
20
19
24
19
13
口味记录
89
89
80
78
75
71
65
62
60
52
(1)作出散点图;
(2)你能从散点图中发现两者之间的近似关系吗?
(3)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;
(4)对于食品,为什么人们更喜欢吃位于直线上方的食品而不是下方的?
8.(25-26高三上·上海·单元测试)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2016
2017
2018
2019
2020
时间代号
1
2
3
4
5
储蓄存款/千亿元
5
6
7
8
10
(1)求关于的线性回归方程;
(2)用所求回归方程预测该地区2022年()的人民币储蓄存款.
9.(2025·上海·模拟预测)某航天公司研发一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:
飞行距离
56
63
71
79
90
102
110
117
损坏零件数(个)
61
73
90
105
119
136
149
163
(1)建立关于的回归模型,根据所给数据及回归模型,求回归方程及相关系数;(精确到0.1,精确到整数,精确到0.0001)
(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,飞行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的推进器占比,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
参考数据、公式如下:
,其中,.
,.
保养
未保养
合计
报废
未报废
合计
,其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
10.(2025·上海宝山·二模)某游乐园的活动项目共有三类,分别是“过山车”等10个体验类项目、“海豚之舞”等4个表演类项目、“智力闯关”等3个互动类项目.因设备维护需要,项目并非每日都全部开放.以下数据是项目开放的数量(个)和游客平均等待时间(分钟/个)的关系:
项目类别
体验类
演出类
互动类
开放数量(个)
4
5
6
7
8
2
4
2
3
平均等待时间(分钟/个)
76
73
67
60
53
30
46
30
(1)体验类项目中,若关于的回归方程为,请计算的值,并依据该模型预测所有体验类项目均开放时的平均等待时间(精确到整数);
(2)小王游玩当日,体验类、演出类、互动类项目分别开放了8个、4个、3个,他计划随机游玩其中的3个项目,已知他选择的项目中至少包含1个互动类项目,求他的等待总时间恰为120分钟的概率;
(3)为提高游客的参与度,园方在互动类项目“智力闯关”中设计了两关.通过第一关的游客奖励20个游园币,游客可以选择结束或继续闯关.若继续闯关,则必须完成第二关的所有题目.第二关包含2道相互独立的选择题,每答对1题可再奖励20个游园币,每答错1题则要扣除10个游园币.每个游园币可兑换园区内任意一个项目的1分钟等待时间.小王已通过第一关,假设他在第二关中每道题答对的概率均为,为了获得更多项目等待时间的兑换奖励,小王是否应该继续闯关?请你帮他做出决策.
题型三 独立性检验
1.(25-26高三上·上海·单元测试)某校随机抽出30名女教师和20名男教师参加学校组织的知识竞赛(满分100分),成绩统计如表:
女教师成绩分布表
成绩分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
5
2
3
m
8
男教师成绩分布表
成绩分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
1
3
10
n
2
(1)试估计所有老师成绩的平均分(同一组中的数据用该组区间的中点值作代表);
(2)若分数为80分及以上为优秀,低于80分为非优秀,请完成下面2×2列联表,并判断是否有99%的把握认为这次竞赛成绩优秀与性别有关?
女教师
男教师
总计
优秀
非优秀
总计
参考数据
0.15
0.10
0.05
0.025
0.010
0.005
0.001
χ
2.072
2.706
3.841
5.024
6.635
7.879
10.828
2.(25-26高三上·上海·单元测试)某校开设了体育运动兴趣班.为了解学生对开设课程的满意程度,设置了满分为10分的满意度调查表,统计了1000名学生的调查结果,得到题图所示的频率分布直方图:
(1)求这1000名学生满意度打分的平均数(同一组中的数据用该组区间的中点值为代表);
(2)如果认为打分6分及以上为满意,6分以下为不满意,为了解满意度与学生性别是否有关,现从上述1000名学生的满意度打分中按照“打分组别”用分层抽样的方法抽取容量为200的样本,得到如下2×2列联表.请将列联表补充完整,并根据列联表判断是否有99%的把握认为满意度与学生性别有关.
打分性别
不满意
满意
总计
男生
100
女生
60
总计
200
附:,
0.050
0.010
0.001
3.841
6.635
10.828
3.(24-25高三·上海·课堂例题)“日行万步”正成为健康生活的代名词.某地一研究团队统计了该地区1000位居民的日行步数,得到如下表格:
日行步数(单位:千步)
人数(人)
20
60
170
200
300
200
50
(1)为研究日行步数与居民年龄的关系,以日行步数是否超过8千步为标准进行分层抽样,从上述1000位居民中抽取200人,得到如下列联表,请将列联表补充完整,并根据2列联表判断是否有95%把握认为日行步数与居民年龄超过40岁有关;
日行步数千步
日行步数>8千步
总计
40岁以上(人)
100
40岁以下(含40岁)(人)
50
总计
200
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
(2)以这1000位居民日行步数超过8千步的频率,代替该地区1位居民日行步数超过8千的概率,每位居民日行步数是否超过8千相互独立.为了深入研究,该研究团队随机调查了20位居民,其中日行步数超过8千的最有可能(即概率最大)是多少位居民?
4.(24-25高三上·上海·开学考试)为了缓解高三学生学业压力,学校开展健美操活动,高三某班文艺委员调查班级学生是否愿意参加健美操,得到如下的列联表.
性别
愿意
不愿意
男生
6
10
女生
18
6
(1)根据该列联表,并依据显著水平的独立性检验,判断能否认为“学生性别与是否愿意参加健美操有关”;
(2)在愿意参加的所有学生中,根据性别,分层抽样选取8位学生组织班级健美操队,并从中随机选取2人作为领队,记这2人中女生人数为随机变量,求的分布及期望.
附:.
5.(24-25高三下·上海杨浦·开学考试)随着5G时代的全面来临,借助手机,网银等实施的非接触式电信诈骗迅速发展蔓延,不法分子甚至将“魔爪”伸向了学生.为了调查同学们对“反诈”知识的了解情况,某校进行了一次抽样调查,统计得到以下列联表.
不了解
了解
合计
女生
20
20
40
男生
10
合计
80
(1)取进行独立性检验,判断该校学生对“反诈”知识的了解与性别是否有关;
(2)用频率估计概率,样本估计总体,从全校男生中随机抽取5人,记其中对“反诈”知识了解的人数为,求的分布及数学期望;
(3)为了增强同学们的防范意识,该校举办了主题为“防电信诈骗,做反诈达人”的知识竞赛.已知全校参加本次竞赛的学生分数近似服从正态分布,若某同学成绩满足,则该同学被评为“反诈标兵”;若,则该同学被评为“反诈达人”.
(i)试判断分数为88分的同学能否被评为“反诈标兵”;
(ii)若全校共有50名同学被评为“反诈达人”,估计参与本次知识竞赛的学生人数.(四舍五入后取整)
附:(1),其中,;
(2)若,则:,,.
6.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(附:,其中.)
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
7.(24-25高三下·上海·阶段练习)第二十二届卡塔尔世界杯足球决赛中,阿根廷队通过扣人心弦的点球大战战胜了法国队,某校为了丰富学生课余生活,组建了足球社团,足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各名进行调查,部分数据如下表所示.
喜欢足球
不喜欢足球
合计
男生
女生
合计
(1)根据所给数据求出、、、的值,并判断是否有95%的把握认为该校学生喜欢足球与性别有关?(附)
(2)社团指导老师从喜欢足球的学生中抽取了名男生和名女生示范点球射门.已知男生进球的概率为,女生进球的概率为,每人射门一次,假设各人射门相互独立,求人进球总次数的分布和数学期望.
8.(24-25高三下·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市M社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)是否有95%的把握认为社区的市民喜欢网上买菜与年龄有关?
(2)社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求的期望和方差.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
3.841
6.635
10.828
9.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展.如人工智能中的大语言模型DeepSeek(以下简称DeepSeek).为调查DeepSeek的应用是否会对相关从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示:
DeepSeek的应用情况
相关从业人员
合计
减少
未减少
应用
54
72
没有应用
42
合计
90
150
(1)根据所给数据完成上表,并判断是否有95%的把握认为的应用与相关从业人员的减少有关?
(2)某公司视频部现有员工100人,公司拟开展DeepSeek培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用DeepSeek.
(ⅰ)求员工经过培训能应用DeepSeek的概率.
(ⅱ)已知开展DeepSeek培训前,员工每人每年平均为公司创造利润6万元;开展DeepSeek培训后,能应用DeepSeek的员工每人每年平均为公司创造利润10万元;DeepSeek培训平均每人每年成本为1万元.根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后剩余员工开展DeepSeek培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
附:其中,)
10.(2025·上海奉贤·二模)某疾病预防中心随机调查了339名50岁以上的公民,研究吸烟习惯与慢性气管炎患病 的关系,测得数据如表所示:
不吸烟者
吸烟者
总计
不患慢性气管炎者
121
283
患慢性气管炎者
总计
134
339
(1)估算样本中吸烟者中患慢性支气管炎的百分比;
(2)有多少把握认为患慢性支气管炎与吸烟有关?
附:,其中,,,.
11.(2025·上海金山·二模)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
附:;
0.10
0.01
0.001
2.706
6.635
10.828
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布和期望.
12.(24-25高三上·上海·期末)某区体育老师为了了解初中学生的性别和喜欢篮球是否有关,随机调查了该区1000名初中学生,得到成对样本数据的分类统计结果,如下表所示:
性别
是否喜欢篮球
合计
喜欢
不喜欢
男生
350
250
600
女生
250
150
400
合计
600
400
1000
(1)依据的独立性检验,能否认为该区初中学生的性别与喜欢篮球有关联;
(2)用按性别比例分配的分层随机抽样的方法从参与调查的,喜欢篮球的600名初中学生中抽取12名学生做进一步调查,将这12名学生作为一个样本,从中随机抽取3人,用X 表示随机抽取的3人中女生的人数,求X 的分布列和数学期望.
附:参考数据
其中
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
13.(24-25高三下·上海虹口·期中)已知某区组建了一支120人的志愿者队伍,并由其中72人组成“志愿模范队”.经过一年的实践,全队共有72人的周平均服务时长超过2小时,其中有54人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
54
72
周平均服务时长不超过2小时
总计
72
120
(1)已知一名志愿者是“志愿模范队”成员,求其周平均服务时长超过2小时的概率.
(2)请完成列联表,并根据表中数据回答:是否有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系?
(3)现从周平均服务时长超过2小时的人员中按照是否为“志愿模范队”成员进行分层抽样,选取8人组建“志愿突击队”,并从这8人中再随机选取2人做深度访谈,记随机变量为这2人中来自于“志愿模范队”的人数,求的分布与方差
附录:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
题型四 概率
1.(25-26高三上·上海·单元测试)2021年1至4月,教育部先后印发五个专门通知,对中小学生手机、睡眠、读物、作业、体质管理作出规定.“五项管理”是“双减”工作的一项具体抓手,是促进学生身心健康、解决群众急难愁盼问题的重要举措.为了在“控量”的同时力求“增效”,提高作业质量,某学校计划设计差异化作业.因此该校对初三年级的400名学生每天完成作业所用时间进行统计,部分数据如下表:
男生
女生
总计
90分钟以上
80
180
90分钟以下
220
总计
160
240
400
(1)求、、的值,并根据题中的列联表,判断是否可以认为完成作业所需时间在90分钟以上与性别有关?
(2)学校从完成作业所需时间在90分钟以上的学生中用分层抽样的方法抽取9人了解情况,甲老师再从这9人中选取3人进行访谈,求甲老师选取的3人中男生人数大于女生人数的概率.
2.(25-26高三上·上海·单元测试)盲盒里面通常装的是动漫、影视作品的周边产品,或者设计师单独设计出来的玩偶,由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A,B,C三种样式,且每个盲盒只装一个.某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.据统计,有50%的人购买了该盲盒.在这些购买者中,女生占;而在未购买者中,男生女生各占50%.
(1)请根据以上信息填写下表,并判断是否有95%的把握认为购买该盲盒与性别有关?
女生
男生
合计
购买者
未购买者
合计
(2)在购买者中按照性别分层抽样抽取5名,再从这5名中随机抽取2人,求抽取的这两人恰好是女生的概率.
3.(24-25高三下·上海·阶段练习)某甜品店打算推出三款新品,在前期市场调研时,将顾客按照年龄分为青少年组中年组和老年组,随机调查了名顾客对这三款新品的购买意愿,统计数据如下(单位:人):
青少年组
中年组
老年组
愿意
不愿意
愿意
不愿意
愿意
不愿意
第一款
第二款
第三款
假设顾客的购买意愿相互独立.用频率估计概率.
(1)从顾客中随机抽取人,估计该名顾客愿意购买第一款新品的概率;
(2)从三个不同年龄组的顾客中各随机抽取人,记为这人中愿意购买第二款新品的人数,求的分布列和数学期望;
(3)用“”表示顾客愿意购买第款新品,“”表示顾客不愿意购买第款新品.写出方差、、的大小关系并说明理由.
4.(2025·上海闵行·二模)某社团共有12名成员,其中高一男生2人,女生4人,高二男生3人,女生3人.现从中随机抽选2人参加数学知识问答.
(1)若逐个抽选,求恰好第一个抽选的是男生的概率;
(2)若恰好抽选了1名男生与1名女生,求这2人都是高二学生的概率;
(3)若恰好抽选了1名高一学生与1名高二学生,记抽选出来的男生与女生的人数之差的绝对值为,求的分布列与数学期望.
5.(2025·上海浦东新·二模)为测试、两款人工智能软件解答数学问题的能力,将道难度相当的数学试题从到编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,并记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
几何试题
函数试题
(1)分别估计软件、软件能正确解答数学问题的概率;
(2)小浦准备用这两款软件来解决某次数学测试中的第题(假设其难度和测试的道题基本相同),但该题内容还未知,从已往情况来看,该题是几何题的概率为,是函数题的概率为.将频率视为概率,试通过计算来说明小浦应该用哪款软件解决这道试题?
(3)小浦决定采用这两款软件解答道类似试题,其中几何、函数各道,每道试题只用其中一款软件解答一次.将频率视为概率,小浦比较了这两款软件在解答几何和函数题上的正确率,决定用表现较好的那款软件解决其擅长的题型.用、分别表示这道几何试题与道函数试题被正确解答的个数,求随机变量的数学期望和方差.
题型五 随机变量及其分布
1.(24-25高三下·上海·阶段练习)截至2024年底,我国新能源汽车保有量达到3140万辆,占汽车总量的.某市调查了1000名汽车驾驶员对新能源汽车的偏好程度,调查结果如下:
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
女性驾驶员
100
400
合计
400
1000
(1)请根据所给数据,完成上面的列联表;
(2)判断是否有的把握认为偏好燃油汽车或新能源汽车与驾驶员的性别有关;
(3)用频率估计概率,在所有参加调查的驾驶员按男性和女性进行分层抽样,随机抽取10名驾驶员,再从这10名驾驶员中随机抽取2人进行问卷调查.抽取的2人中,求在有女性驾驶员参加问卷调查的条件下,恰有1名男性驾驶员也参加问卷调查的概率.
附:, 其中
2.(23-24高二下·湖南·期中)2024年两会期间民生问题一直是百姓最关心的热点,某调查组利用网站从参与调查者中随机选出200人,数据显示关注此问题的约占,并将这200人按年龄分组,第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.
(1)求a,并估计参与调查者的平均年龄;
(2)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中不关注民生问题的中老年人有10人,得到如下2×2列联表.请将列联表补充完整填入答题卡,并回答:依据小概率值的独立性检验,能否认为是否关注民生与年龄有关?
关注民生问题
不关注民生问题
合计
青少年
中老年
10
合计
200
(3)将此样本频率视为总体的概率,从网站随机抽取4名青少年,记录4人中“不关注民生问题”的人数为,求随机变量时的概率和随机变量的数学期望.
附:.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
3.(24-25高三·上海·课堂例题)若是一个三位正整数,且的个位数字大于十位数字,十位数字大于百位数字,则称为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10整除,得分;若能被10整除,得1分.
(1)写出所有个位数字是5的“三位递增数”;
(2)若甲参加活动,求甲得分的期望.
4.(24-25高三·上海·课堂例题)某线上健身学习平台,从用户系统中随机选出200名学员,对该平台的教学成效评价和课后跟踪辅导评价进行了统计,并用以估计所有学员对该平台的满意度.其中对教学成效满意率为0.9,课后跟踪辅导的满意率为0.8,对教学成效和课后跟踪辅导都不满意的有10人.
(1)完成下面列联表,并分析是否有把握认为教学成效满意度与跟踪辅导满意度有关.
对教学成效满意(人)
对教学成效不满意(人)
合计(人)
对课后跟踪辅导满意
对课后跟踪辅导不满意
合计
(2)若用频率代替概率,假设在服务协议终止时对教学成效和课后跟踪辅导都满意学员的续签率为90%,只对其中一项不满意的学员续签率为60%,对两项都不满意的续签率为10%.从该学习平台中任选10名学员,估计在学习服务终止时续签学员人数.
5.(25-26高三上·上海·单元测试)某中学选派40名学生参加上海市高中生志愿者的培训活动,他们参加培训的次数统计如下表所示:
培训次数
1
2
3
参加人数
5
15
20
(1)从这40名学生中任选3名,求这3名学生中至少有2名学生参加培训次数恰好相等的概率(结果用最简分数表示);
(2)从这40名学生中任选2名,用表示这2人参加培训次数之差的绝对值,求随机变量的期望(结果用最简分数表示).
6.(24-25高三下·上海·阶段练习)某公司为招聘新员工设计了一个面试方案:应聘者从道备选题中一次性随机抽取 道题,按照题目要求独立完成. 规定:至少正确完成其中道题便可通过面试.已知道备选题中应聘者甲有道题能正确完成,道题不能完成;应聘者乙每题正确完成的概率都是,且两位应聘者每题正确完成与否互不影响.
(1)求甲正确完成面试题数的分布列及其期望;
(2)求乙正确完成面试题数的分布列及其方差;
(3)试问:甲和乙谁通过面试的可能性更大?并说明理由.
7.(2025·上海普陀·二模)某区为推进教育数字化转型,通过聚合区域学校的教育资源,依托AI技术搭建了区域智慧题库系统,形成了“通识过关—综合拓展—创新提升”三层动态原库,且三层题量之比为,设该题库中任意1道题被选到的可能性都相同.
(1)现有4人参加一项比赛,若每人分别独立地从该题库中随机选取一道题作答,求这4人中至少有2人的选题来自层的概率;
(2)现采用分层随机抽样的方法,使用智能组卷系统从该题库中选取12道题生成试卷,若某老师要从生成的这份12道题的试卷中随机选取3道题做进一步改编,记该老师选到层题的题数为,求的分布与期望.
8.(2025·上海黄浦·二模)一盒子中有大小与质地均相同的20个小球,其中白球个,其余为黑球.
(1)当盒中的白球数时,从盒中不放回地随机取两次,每次取一个球,用表示事件“第一次取到白球”,用表示事件“第二次取到白球”,求和,并判断事件与是否相互独立;
(2)某同学要策划一个抽奖活动,参与者从盒中一次性随机取10个球,若其中恰有3个白球,则获奖,否则不获奖,要使参与者获奖的可能性最大、最小,该同学应该分别如何放置白球的数量?
9.(2025·上海徐汇·二模)某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布.
(1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到);
(2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到).
参考数据:,,,其中为标准正态分布函数.
10.(24-25高三下·上海·阶段练习)若数列满足,则称数列为k项数列,集合是由所有k项数列组成的集合,从集合中任意取出两个不同数列,记变量.
(1)若,求随机变量X的分布列与数学期望;
(2)求,其中且.
11.(24-25高三下·上海·阶段练习)马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第n次的状态有关,为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐.已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为,前一天选择面食套餐后继续选择面食套餐的概率为,如此往复.
(1)求该同学第二天中午选择米饭套餐的概率;
(2)记该同学第n天选择米饭套餐的概率为;
①证明:为等比数列;
②当时,恒成立,求m的取值范围.
6 / 6
学科网(北京)股份有限公司
$$
猜押06 上海高考19题(解答题)
考点
3年考题
考情分析
概率统计
2025年春考
百分位数、古典概型、排列组合、平均数等基础知识
2024年
(1)分层抽样;(2)频率分布表求平均数; (3)2x2 列联表独立性检验
2023年
离散型随机变量的分布列和期望的计算,
题型一 用样本估计总体
1.(24-25高三·上海·课堂例题)某地区为了解学生课余时间的读书情况,随机抽取了名学生进行调查,将调查得到的学生日均课余读书时间分成,,,,,六组,绘制成如图所示的频率分布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于10分钟的有10人.
(1)求和的值;
(2)根据已知条件和下面表中两个数据完成下面的列联表,并判断是否有的把握认为“读书之星”与性别有关?
非读书之星(人)
读书之星(人)
总计(人)
男
女
10
55
总计
参考公式:.
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
【答案】(1),
(2)表格见解析,没有的把握认为“读书之星”与性别有关
【分析】(1)根据频率分布直方图中频率之和为列式计算可得,根据“总人数” 可得;
(2)根据题意填写列联表,结合公式计算判断即可.
【详解】(1),解得,
所以.
(2)因为,所以“读书之星”有人,
从而列联表如下表所示:
非读书之星
读书之星
总计
男
30
15
45
女
45
10
55
总计
75
25
100
零假设为是否为“读书之星”与性别独立;
,
因为,
所以没有的把握认为“读书之星”与性别有关.
2.(24-25高三·上海·课堂例题)某公司研发了一款新产品,按行业标准这款新产品可分为一级正品、二级正品、次品共三个等级.根据该公司测算:生产出一件一级正品可获利1000元,一件二级正品可获利200元,一件次品亏损600元.该公司试生产这款新产品1000件,并统计了这些产品的等级,如下表:
等级
一级正品(件)
二级正品(件)
次品(件)
频数
500
300
200
(1)对于该公司试生产出来的这1000件产品,平均每件的产品利润是多少元?
(2)该公司为了解消费者对这款产品的满意度,随机调查了50名男性消费者和50名女性消费者,每位消费者对这款产品给出满意或不满意的评价,得到下面的列联表:
满意(人)
不满意(人)
总计(人)
男性消费者
35
15
50
女性消费者
15
35
50
总计
50
50
100
问:能否认为男性消费者和女性消费者对这款产品的评价有差异?
【答案】(1)(元);
(2)能.
【分析】(1)利用平均数公式求出平均利润.
(2)计算的观测值,再与临界值比对即得.
【详解】(1)依题意,平均利润为(元).
(2)由列联表中数据得,
因此有的把握认为男性消费者和女性消费者对这款产品的评价有差异,
所以能认为男性消费者和女性消费者对这款产品的评价有差异.
3.(25-26高三上·上海·单元测试)为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
【答案】(1),可以认为
(2)需对当天的生产过程进行检查
【分析】(1)利用公式计算出相关系数,再根据,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小进行判断;
(2)计算出,,进一步得出的区间范围,观察样本数据看零件的尺寸在以外就需要对当天的生产过程进行检查.
【详解】(1)由样本数据得的相关系数为
.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;
(2)由于,,
故的区间范围为,
由样本数据可以看出抽取的第13个零件的尺寸在以外,
因此需对当天的生产过程进行检查.
4.(24-25高三上·上海松江·期中)某景区为更好地提升旅游品质,随机选择100名游客对景区进行满意度评分(满分100分),根据评分,制成如图所示的频率分布直方图.
(1)根据频率分布直方图,求的值;
(2)估计这100名游客对景区满意度评分的70%分位数;
(3)若采用按比例分层抽样的方法从评分在的两组中共抽取6人,再从这6人中随机抽取2人进行个别交流,求选取的2人评分分别在和内各1人的概率.
【答案】(1);
(2)92.5;
(3).
【分析】(1)根据给定的直方图,利用各小矩形面积和为1列式计算即得.
(2)利用70%分位数的定义,结合直方图列式求解.
(3)利用分层抽样及频率求各组人数,利用列举法结合古典概型运算求解.
【详解】(1)由频率分布直方图知:,解得,
所以的值为.
(2),
因此分位数在区间内,则,解得,
所以满意度评分的分位数为92.5.
(3)评分在的频率分别为,
则在中抽取人,记为,
在中抽取人,记为,
从这6人中随机抽取2人,则有样本空间为
,共有15个样本点,
设选取的2人评分分别在和内各1人为事件,
则,共有8个样本点,
所以选取的2人评分分别在和内各1人的概率为.
5.(24-25高三上·上海·期中)某中学举行了一次“数学文化知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩 作为样本进行统计. 将成绩进行整理后,分为五组 , ,,, ,其中第一组的频数的平方为第二组和第四组频数的乘积.请根据下面的频率分布直方图,解决以下问题.
(1)若根据这次成绩,学校准备淘汰 70% 的同学,仅保留 30% 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?(四舍五入精确到 1 分)
(2)从样本数据在 两个小组内的同学中,用分层抽样的方法抽取 6 名同学,再从这 6 名同学中随机选出 2 人,求选出的两人恰好来自不同小组的概率;
(3)某老师在此次竞赛成绩中抽取了 10 名同学的分数: ,已知这 10 个分数的平均数 . 方差 ,若剔除其中的最高分 98 和最低分 86,求剩余 8 个分数的平均数与方差.
【答案】(1)76分
(2)
(3)平均数,方差21
【分析】(1)先根据“第 1 组的频数的平方为第 2 组和第 4 组频数的积”,得“第 1 组的频率的平方为第 2 组和第 4 组频率的积”求,,求该组数据的第70百分位数即可.
(2)根据古典概型求概率.
(3)根据平均数与方程的概念求新数据的平均数与方程.
【详解】(1)由第1组的频数的平方为第2组和第4组频数的积可知,
第1组的频率的平方为第2组和第4组频率的积,
所以,解得 ,
又 ,解得,
所以,
成绩落在 内的频率为:,落在内的频率为: ,
设第70百分位数为,则,解得 ,
所以晋级分数线划76较为合理.
(2)由图可知, 按分层抽样法, 两层应分别抽取 4 人和 2人, 分别记为 和 ,
则所有的抽样有: , 共 15 个样本点,
"抽到的两位同学来自不同小组",则 , 共 8 个样本点,
所以 .
(3)因为 , 所以,
所以 ,
所以 ,
剔除其中的 和 86两个分数, 设剩余 8 个数为 ,,平均数与标准差分别为 ,则剩余 8 个分数的平均数:
方差:.
6.(24-25高三下·上海·阶段练习)某兴趣小组对高三刚结束的物理测试成绩进行随机调查,将所有选考物理的考生按是否同时选考化学分为A、B两类,并从中随机抽取100名考生的成绩,整理数据如下表(单位:人)
物理成绩学生分类
A类男生
2
8
15
8
B类男生
3
10
20
4
A类女生
3
4
2
1
B类女生
10
6
4
0
(1)估计该校高三学习物理男生人数与女生人数之比;
(2)求A类考生物现平均成绩的估计值(同一组中的数据用该组区间中点值代表,结果四舍五入到整数);
(3)把成绩在称为“合格”,成绩在称为“不合格”,是否有95%的把握认为该校考生的本次物理成绩合格与否和性别有关?
附:,其中.
【答案】(1)
(2)72
(3)有95%的把握认为该校考生的本次物理成绩合格与否和性别有关.
【分析】(1)根据表中数据求出男生和女生人数即可求解;
(2)根据频数分布列表,利用每组的组中值乘以对应的频率之和即可求解;
(3)根据表中数据可补充列联表,利用卡方的计算公式求出,结合表中的数据即可得出结论.
【详解】(1)由表中数据可知,男生共有,
女生共有,
由此估计该校高三学习物理男生人数与女人数的比值约为.
(2)A类共有:人
类物理平均成绩的估计值为
(3)由表中数据可知,列联表如下:
性别
成绩
合计
及格
不及格
男生
65
5
70
女生
17
13
30
合计
82
18
100
零假设为:该校考生的物理成绩与考生性别无关,
根据表格中数据计算得到
所以有95%的把握认为该校考生的本次物理成绩合格与否和性别有关.
7.(24-25高三下·上海·阶段练习)某区为全面提高青少年健康素养水平,举办了“健康素养知识竞赛”,分预赛和复赛两个环节,预赛成绩采用百分制,排名前三百名的学生参加复赛.已知共有10000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下频率分布直方图:
(1)由频率分布直方图,可认为该市全体参加预赛学生的预赛成绩Z近似服从正态分布,其中可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组区间的中点值代替),且,已知小明的预赛成绩为95分,利用该正态分布,估计小明是否有资格参加复赛?
(2)复赛规则如下:①复赛题目由A,B两类问题组成,答对A类问题得30分,不答或答错得0分;答对B类问题得70分,不答或答错得0分;②A,B两类问题的答题顺序可由参赛学生选择,但只有在答对第一类问题的情况下,才有资格答第二类问题.
已知参加复赛的学生甲答对A类问题的概率为0.8,答对B类问题的概率为0.6,答对每类问题相互独立,且与答题顺序无关.为使累计得分的期望最大,学生甲应选择先回答哪类问题?并说明理由.
附:若,则,,.
【答案】(1)小明有资格参加复赛
(2)学生甲应先回答A类问题,理由见解析
【分析】(1)计算出、的值,可得出,计算出的值,与比大小,可得出结论;
(2)分别计算出学生甲先回答类问题、先回答类问题得分的期望值,比较大小后可得出结论.
【详解】(1)由频率分布直方图可知,
,
,,
.
所以,小明有资格参加复赛.
(2)若学生甲先答A类问题,设他的得分为随机变量X,则X的可能取值有0,30,100,
,,,
所以,随机变量X的分布列为,
则.
若学生甲先答B类问题,设该同学的得分为随机变量Y,则Y的可能取值有0、70、100,
,,,
所以,随机变量Y的分布列为,
则,
所以,,因此,学生甲应先回答A类问题.
8.(24-25高三下·上海青浦·阶段练习)去年上海进口博览会智能科技展区,主办方统计了20天的每日接待客户人数(单位:人次),并制作了如下茎叶图:
(1)求这组数据的第16、第70百分位数;
(2)现从这20天中随机抽取1天,求这天的接待人数在50人次至69人次之间的概率;
(3)主办方预计今年进博会期间,该展区日均接待人数将同比增长15%.假设接待人数的分布情况与去年相同,试估计今年进博会期间(同样为20天),接待人数超过70人次的天数所占比例,并说明理由.
【答案】(1)45,64.5
(2)
(3)40%,理由见解析
【分析】(1)由百分位数的计算公式即可求解;
(2)由古典概型概率公式即可求解;
(3)由同比增长15%,计算出接待人数超70人次的天数,即可判断;
【详解】(1)注意到,,
因此,第16、70百分位数分别是:
序列表中的第4个值、(第14+第15数值)
即分别为:45、64.5
(2)现从这20天中随机抽取1天,
在50和69之间的数据点数量,这些值是:
51,53,54,56,57,59,60,62,64,65,68
有11个这样的值.
由于总共有20个数据点,因此所求概率是:
(3)由于接待人数的分布情况与去年相同,
日均接待人数将同比增长15%,于是接待人数超70人次的天数有:
,,,,
,,…,,
合计8天
于是接待人数超过70人次的天数所占比例为:
综上,估计今年进博会期间,接待人数超过70人次的天数所占比例为40%
9.(2025·上海·模拟预测)甲、乙是两个体育社团的小组.如下是两组组员身高的茎叶图(单位:厘米),以身高的百位数和十位数作为“茎”排列在中间、个位数作为“叶”分列在两边.
(1)求甲、乙两组组员身高的第60百分位数;
(2)从甲、乙两组各选取一个组员,求两人身高均在170厘米以上的概率;
(3)为使两组人数相同,从甲组中调派一个队员到乙组.是否存在甲组的一个组员,将他调派至乙组后,甲、乙两组的平均身高都增大?
【答案】(1)甲组第60百分位数为173 厘米,乙组第60百分位数为厘米;
(2);
(3)把甲组的其中一个167厘米的组员调到乙组.
【分析】(1)直接利用百分位数计算公式即可;
(2)根据组合公式和古典概率公式计算即可;
(3)求出两者平均数,则所调的人员身高应该两平均数之间(不包括两平均数).
【详解】(1)甲队:,
所以甲组的第60百分位数为从小到大排列的第8位组员身高,为173厘米;
乙队:,
所以乙组的第60百分位数为从小到大排列第6位和第7位组员身高的平均数,为厘米.
(2)记甲乙两队各选取一名组员,两人身高均在170厘米以上为事件,
.
(3),
要使两组平均身高都增大,
则从甲组调到乙组的组员身高应在两平均数之间(不包括端点平均数),所以把甲组的其中一个167厘米的组员调到乙组即可.
10.(2025·上海崇明·二模)某区2025年3月31日至4月13日的天气预报如图所示.
(1)从3月31日至4月13日某天开始,连续统计三天,求这三天中至少有两天是阵雨的概率;
(2)根据天气预报,该区4月14日的最低气温是9,温差是指一段时间内最高温度与最低温度之间的差值,例如3月31日的最高温度为17,最低温度为9,当天的温差为8记4月1日至4日这4天温差的方差为,4月11日至14日这4天温差的方差为,若,求4月14日天气预报的最高气温;
(3)从3月31日至4月13日中随机抽取两天,用X表示一天温差不高于9的天数,求X的分布列及期望.
【答案】(1)
(2)18
(3)分布列见解析,
【分析】(1)根据古典概型概率公式,用事件包含的样本点个数除以总样本点个数来计算概率;
(2)根据方差公式列出关于的方程,然后求解;
(3)根据随机变量的分布列,利用期望公式计算期望.
【详解】(1)设“从3月31日至4月13日某天开始,连续统计三天,这三天中至少有两天是阵雨”为事件A,连续统计三天共有12个样本点,事件A共有4个样本点,所以
(2)4月1日至4日这4天温差分别为9、8、9、9,
因此,设4月14日的温差为x,
则4月11日至14日这4天温差分别为8、9°C、8、x,
因此,
解得,因此,4月11日这天最高气温是18.
(3)从3月31日至4月13日,一天温差不超过9的共有11天,高于9的共有3天
X可能取值为0,1,2.
,,
随机变量X的分布列为:
X
0
1
2
P
随机变量X的期望.
11.(2025·上海嘉定·二模)某学校对学生的课外阅读时间进行调查,随机抽取了150位学生,得到如下样本数据频率分布直方图.
(1)估计该校学生的平均课外阅读时间;(同一组数据用该区间的中点值作代表)
(2)估计该校学生课外阅读时间位于区间(单位:小时/月)的概率;
(3)已知该校喜欢阅读的学生占比为18%,初一年级学生占该校总学生数的28%,且初一年级学生中喜欢阅读的占40%,求其他年级学生中喜欢阅读的比例.(精确到0.1%)
【答案】(1)平均课外阅读时间小时/月;
(2);
(3).
【分析】(1)根据直方图的平均值求法求该校学生的平均课外阅读时间;
(2)由直方图估计时间位于区间的频率,即可得概率;
(3)根据已知得其他年级学生中喜欢阅读的学生占比为,且其他年级学生占比为,进而求出其他年级学生中喜欢阅读的比例.
【详解】(1)由直方图知,平均课外阅读时间为小时/月;
(2)由直方图知,时间位于区间的频率为,
所以该校学生课外阅读时间位于区间(单位:小时/月)的概率为.
(3)由题设,初一年级学生中喜欢阅读的学生占比为,
所以其他年级学生中喜欢阅读的学生占比为,
故其他年级学生中喜欢阅读的比例.
12.(2025·上海杨浦·二模)为弘扬中华民族传统文化、增强民族自豪感,某学校开展中华古诗词背诵比赛,分为初赛和复赛.全校同学都参加了初赛,并随机抽取一个班级进行初赛成绩统计,已知该班级共有40位学生,他们的初赛分数的频率分布直方图如图所示:
(1)计算的值,并估计该校这次初赛的平均分数.
(2)初赛分数达到80及以上的同学,称为优秀参赛选手,现从班级中随机选出2位同学,用代表其中的优秀参赛选手人数,求的分布;
(3)为增加比赛的趣味性,复赛规则如下:复赛试题将从题库中随机抽取,每位参赛选手将有机会回答填空、选择和简答各1题;每答对1题得1分,答错或不答得0分,每位选手可以自行选择回答问题的顺序,若答对一题可继续答下一题,直到3题全部答完;若答错或不答则比赛结束.例如:选手甲可自行按“简答—填空—选择”顺序答题,甲答对第一题得1分,并继续回答第二题且答错得0分,结束比赛,总分为1分.
小杨作为优秀参赛选手,代表班级参加复赛.根据他初赛的答题正确频率,可估计他填空、选择和简答的答题正确概率分别为:
题型
填空
选择
简答
答题正确概率
若小杨每次答题的结果都相互独立,那么为尽量在比赛中获得较高分数,小杨应该采用怎样的答题顺序?请说明理由.
【答案】(1);该校这次初赛的平均分数为68分
(2)分布列见解析
(3)答案见解析
【分析】(1)由频率分布直方图的面积和为1计算可得值,由区间的中值乘以纵坐标值再乘以区间宽度后相加可得平均数;
(2)先由频率分布直方图计算出优秀与非优秀人数,再由组合数结合古典概率求出相应的概率,然后列出分布列即可;
(3)按照答题顺序分六种情况,由乘法公式计算相应概率,然后求出期望比较即可.
【详解】(1)由频率分步直方图中小矩形的面积和为1可得:
,
解得;
该校这次初赛的平均分数为.
(2)初赛分数达到80及以上的同学为人,非优秀为28人,
由题意可得的可能取值为,
,
,
,
所以的分布列为:
0
1
2
(3)按照不同题目顺序分类讨论:
填空,选择,简答:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“简答,选择,填空”的期望与之相同;
填空,简答,选择:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“简答,填空,选择”的期望与之相同;
选择,填空,简答:
得零分的概率:,
得一分的概率:,
得两分的概率:,
得三分的概率:,
期望为分;
因为填空和简答的正确率相同,所以“选择,简答,填空”的期望与之相同;
所以,
小杨应采用“选择,填空,简答”或“选择,简答,填空”的顺序.
题型二 变量间的相关关系
1.(24-25高三·上海·课堂例题)2020年1月15日,教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力和判断力进行统计分析,得到下表数据:
6
8
9
10
12
2
3
4
5
6
请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合,并求关于的线性回归方程(精确到0.01);
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为、、,其中,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时的取值范围.
【答案】(1)说明见解析,
(2)
【分析】(1)根据表格中的数据,求得相关系数,得到与之间的关系可用线性回归模型进行拟合,进而求得,即可求的回归直线的方程;
(2)通过甲大学的考试科目数,得到,设通过乙大学的考试科目数可能的取值为0,1,2,3,求得相应的概率,求得,根据考生更希望通过乙大学的笔试考试,列出不等式,即可求解.
【详解】(1)根据表格中的数据,可得
,,
,
,
,
可得相关系数,
故与之间的关系可用线性回归模型进行拟合,
又由,
可得.
综上回归直线方程.
(2)通过甲大学的考试科目数,则,
设通过乙大学的考试科目数为,则可能的取值为0、1、2、3,
则,
,
,
,
所以,
因为该考生更希望通过乙大学的笔试考试,
所以,即,
又由,解得,
即为该考生更希望通过乙大学的笔试时的范围为.
2.(24-25高三·上海·课堂例题)某饮料店为了推广“秋天的第一杯奶茶”,需了解一天的平均气温与奶茶销量之间的关系,为此记录了周一至周五的平均气温与奶茶销量(杯)的数据,如表所示:
9
11
12
10
8
23
26
30
25
21
(1)画出散点图;
(2)根据上表提供的数据,求出关于的经验回归方程;
(3)试根据(2)中求出的经验回归方程,预测平均气温约为时该饮料店的奶茶销量.
【答案】(1)作图见解析
(2)
(3)46杯
【分析】(1)根据表格数据画出散点图即可;
(2)求出、、、得、可得答案;
(3)代入可得答案.
【详解】(1)画出散点图如下.
(2),
,
,
,
所以,,
所以;
(3)当时,.
故预测平均气温约为时该饮料店的奶茶销量为46杯.
3.(24-25高三·上海·课堂例题)下面的数据是年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平(满分100),以及每天花在看电视上的平均时间(小时).
看电视的平均时间
4.4
4.6
2.7
5.8
0.2
4.6
心脏功能水平
52
53
69
57
89
65
(1)求心脏功能水平与每天花在看电视上的平均时间之间的相关系数;
(2)求心脏功能水平与每天花在看电视上的平均时间的线性回归方程,并讨论方程是否有意义;(系数保留两位小数)
(3)估计平均每天看电视3小时的男子的心脏功能水平.
【答案】(1)
(2),有意义
(3)69
【分析】(1)根据相关系数公式求解即可;
(2)计算线性回归方程,再根据相关系数的绝对值判断即可;
(3)将x=3代入回归直线方程判断即可.
【详解】(1)由题意,,,
,
,
,
心脏功能水平与每天花在看电视上的平均时间之间的相关系数:
;
(2),
,
心脏功能水平与每天花在看电视上的平均时间的线性回归方程为.
因为,样本相关系数的绝对值接近1,
所以可以推断心脏功能水平与每天花在看电视上的平均时间两个变量线性相关,
且相关程度很强,所以这个线性回归方程是有意义的.
(3)将代入线性回归方程,可得,
即平均每天看电视3小时,心脏功能水平约为69.
4.(24-25高三·上海·课堂例题)如图,在实验室细菌培养过程中,细菌生长主要经历调整期、指数期、稳定期和衰亡期四个时期.在一定条件下,培养基上细菌的最大承载量(达到稳定期时的细菌数量)与培养基质量具有线性相关关系.某实验室在培养细菌的过程中,通过大量实验获得了以下统计数据:
培养基质量(g)
20
40
50
60
80
细菌的最大承载量(单位)
300
400
500
600
700
(1)建立关于的回归直线方程,并预测当培养基质量为100g时细菌的最大承载量;
(2)研究发现,细菌的调整期一般为3小时,其在指数期的细菌数量(单位)与细菌被植入培养基的时间近似满足函数关系,试估计在100g培养基上培养细菌时指数期的持续时间(精确到1小时).
【答案】(1),850(单位)
(2)10小时
【分析】(1)根据表中的数据求出,,,,然后根据公式求出,从而可求出回归直线方程,把代入方程可求出培养基质量为100g时细菌的最大承载量;
(2)由(1)可知,代入可求出的值.
【详解】(1)由题意可得,
,,
,
,
所以,
故,
所以关于的回归直线方程为,
当培养基质量为100克时细菌的最大承载量为(单位);
(2)在100g培养基上培养细菌时,由(1)可知最大承载量为850单位,
又,
即,
化简可得,
所以,则,
所以在100克培养基上培养细菌时指数期的持续时间为10小时.
5.(24-25高三·上海·课堂例题)某电商分析了近8年“双十一”期间的宣传费用(单位:万元)和利润(单位:万元)之间的关系,得到下列数据:
2
3
4
5
6
8
9
11
1
2
3
3
4
5
6
8
请回答:
(1)由表中数据,求线性回归方程,并预测当时,对应的利润为多少(、、精确到0.1)
参考数据:,.
(2)为了更好地完成任务,某电商决定让宣传部门的3名成员各自制订两个方案,从中任选2个方案进行宣传,求这2个方案出自同一个人的概率.
【答案】(1),9.6万元
(2)
【分析】(1)先求出,再结合已知的数据和公式求出,从而可求出回归方程,然后将代入回归方程可求出对应的利润;
(2)利用列举法求解即可.
【详解】(1)因为,,,,
所以
因为,
所以回归直线方程为,
当时,,
即利润约为9.6万元;
(2)记3名成员的方案分别、;、;、.
从中任选2个方案的基本事件含有:、、、、,
、、、、、、、、
、共15种.
其中这2个方案出自同一个人的基本事件含有、、,共3种.
所以.
6.(24-25高三·上海·课堂例题)某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,得到的实验数据经整理得到如下的折线图:
参考数据:,,.
(1)由图可以看出,这种酶的活性指标值与温度具有较强的线性相关性,请用相关系数加以说明;
(2)求关于的线性回归方程,并预测当温度为30℃时,这种酶的活性指标值.(计算结果精确到0.01)
【答案】(1)理由见解析
(2),13.22
【分析】(1)根据折线图中的数据求出,,然后根据已知数据和公式可求出相关系数,从而进行判断;
(2)根据已知的数据结合公式求出,从而可求出回归方程,把代入回归方程可预测当温度为30℃时,这种酶的活性指标值.
【详解】(1)由题可知,
,
,
则,
因为非常接近1,所以酶的活性与温度具有较强的线性相关性;
(2)由题可知,,
,
,
所以关于的线性回归方程为,
当时,.
故预测当温度为30℃时,这种酶的活性指标值为13.22.
7.(24-25高三·上海·课堂例题)有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第二行表示此种食品所含热量的百分比,第三行数据表示由一些美食家以百分制给出的对此种食品口味的评价:
品牌
A
B
C
D
E
F
G
H
I
J
所含热量的百分比
25
34
20
19
26
20
19
24
19
13
口味记录
89
89
80
78
75
71
65
62
60
52
(1)作出散点图;
(2)你能从散点图中发现两者之间的近似关系吗?
(3)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;
(4)对于食品,为什么人们更喜欢吃位于直线上方的食品而不是下方的?
【答案】(1)作图见解析
(2)基本近似成线性相关关系
(3)作图见解析
(4)因为直线上方的食品口味更好.
【分析】对于(1),首先以两个变量分别为横轴和纵轴作平面直角坐标系,再在坐标系中描出各点坐标,即作出散点图;
对于(2),由散点图中点的分布规律可判断两变量的相关性;
对于(3),根据(1)的散点图,画一条直线近似地表示两个变量线性相关即可;
对于(4),从口味分析.
【详解】(1)散点图如图所示;
(2)从散点图上可以看出,食品所含热量的百分比与口味值之间总体趋势近似地成一条直线,也就是说他们之间是线性相关的;
(3)直线如上图所示;
(4)因为当直线上方的食品和下方的食品所含热量相同时,直线上方的食品口味更好.
8.(25-26高三上·上海·单元测试)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2016
2017
2018
2019
2020
时间代号
1
2
3
4
5
储蓄存款/千亿元
5
6
7
8
10
(1)求关于的线性回归方程;
(2)用所求回归方程预测该地区2022年()的人民币储蓄存款.
【答案】(1)
(2)(千亿元)
【分析】(1)由已知,求出,,再求出,,则可求出,,即可求出关于的线性回归方程;
(2)将代入回归方程,即可求出该地区2022年的人民币储蓄存款.
【详解】(1)根据题意得:,,
,
,
,,
所以关于的线性回归方程;
(2)当时,(千亿元),
即该地区2022年()的人民币储蓄存款为12千亿元.
9.(2025·上海·模拟预测)某航天公司研发一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:
飞行距离
56
63
71
79
90
102
110
117
损坏零件数(个)
61
73
90
105
119
136
149
163
(1)建立关于的回归模型,根据所给数据及回归模型,求回归方程及相关系数;(精确到0.1,精确到整数,精确到0.0001)
(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,飞行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的推进器占比,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?
\
保养
未保养
合计
报废
20
未报废
合计
60
100
参考数据、公式如下:
,其中,.
,.
保养
未保养
合计
报废
未报废
合计
,其中.
0.25
0.1
0.05
0.025
0.01
0.001
1.323
2.706
3.841
5.024
6.635
10.828
【答案】(1),
(2)列联表见解析,有的把握认为是否报废与是否保养有关
【分析】(1)利用最小二乘法求出,即可得出回归方程,再根据公式求出相关系数即可.
(2)根据题意可将列联表补充完整,根据公式可求得,再对照临界值表即可得出结论.
【详解】(1)由题意可得,
,
又由,
所以,
,
所以变量关于的线性回归方程为.
,
.
(2)设零假设:是否报废与是否保养无关.
由题意,报废推进器中保养过得共台,未保养的推进器共台,
补充列联表如下:
保养
未保养
合计
报废
6
14
20
未报废
54
26
80
合计
60
40
100
则,
根据小概率值的独立性检验,我们推断不成立,即认为是否报废与是否保养有关,此判断错误的概率不大于0.01.
10.(2025·上海宝山·二模)某游乐园的活动项目共有三类,分别是“过山车”等10个体验类项目、“海豚之舞”等4个表演类项目、“智力闯关”等3个互动类项目.因设备维护需要,项目并非每日都全部开放.以下数据是项目开放的数量(个)和游客平均等待时间(分钟/个)的关系:
项目类别
体验类
演出类
互动类
开放数量(个)
4
5
6
7
8
2
4
2
3
平均等待时间(分钟/个)
76
73
67
60
53
30
46
30
(1)体验类项目中,若关于的回归方程为,请计算的值,并依据该模型预测所有体验类项目均开放时的平均等待时间(精确到整数);
(2)小王游玩当日,体验类、演出类、互动类项目分别开放了8个、4个、3个,他计划随机游玩其中的3个项目,已知他选择的项目中至少包含1个互动类项目,求他的等待总时间恰为120分钟的概率;
(3)为提高游客的参与度,园方在互动类项目“智力闯关”中设计了两关.通过第一关的游客奖励20个游园币,游客可以选择结束或继续闯关.若继续闯关,则必须完成第二关的所有题目.第二关包含2道相互独立的选择题,每答对1题可再奖励20个游园币,每答错1题则要扣除10个游园币.每个游园币可兑换园区内任意一个项目的1分钟等待时间.小王已通过第一关,假设他在第二关中每道题答对的概率均为,为了获得更多项目等待时间的兑换奖励,小王是否应该继续闯关?请你帮他做出决策.
【答案】(1),51分钟;
(2);
(3)答案见解析.
【分析】(1)根据表中数据分别求出,代入回归方程即可求出,将代入回归方程可求出平均等待时间;
(2)利用条件概率公式,结合分步计数乘法原理和分类计数加法原理以及组合数,计算即可求得概率;
(3)通过计算得到小王参加第二关获得的游园币数的期望,根据每道题答对的概率的取值分类讨论,做出相关决策.
【详解】(1),
代入回归方程,得,解得.
当时,,即开放所有体验类项目时的平均等待时间约为51分钟.
(2)记事件“等待总时间恰为120分钟”,事件“选择的3个项目中至少包含1个互动类项目”,
因为全部的项目数为15个,其中互动类项目有3个,则事件共包含了种;
在事件的条件下,等待总时间恰为120分钟,此时的可能情况有:
①一个互动类项目,一个体验类项目,一个演出类项目,此时共有种情况;
②两个互动类项目,一个体验类项目,此时共有种情况.
由条件概率公式得.
(3)设小王参加第二关获得的游园币数为随机变量,则所有可能取值为,
则
所以.
所以,当时,,不建议小王继续闯关;
当时,,小王可根据自己的情况随机选择;
当时,,建议小王继续闯关.
题型三 独立性检验
1.(25-26高三上·上海·单元测试)某校随机抽出30名女教师和20名男教师参加学校组织的知识竞赛(满分100分),成绩统计如表:
女教师成绩分布表
成绩分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
5
2
3
m
8
男教师成绩分布表
成绩分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
1
3
10
n
2
(1)试估计所有老师成绩的平均分(同一组中的数据用该组区间的中点值作代表);
(2)若分数为80分及以上为优秀,低于80分为非优秀,请完成下面2×2列联表,并判断是否有99%的把握认为这次竞赛成绩优秀与性别有关?
女教师
男教师
总计
优秀
非优秀
总计
参考数据
0.15
0.10
0.05
0.025
0.010
0.005
0.001
χ
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)
(2)填表见解析;没有99%的把握认为这次竞赛成绩优秀与性别有关.
【分析】(1)根据成绩分布表数据以及抽样人数,先确定值,结合平均数公式,即可求解;
(2)根据已知条件结合独立性检验公式计算,并与临界值对比分析,即可求解
【详解】(1)由题设可知,,,设所有教师成绩的平均分为,则分;
故答案为:
(2)2×2列联表如下:
女老师
男老师
总计
优秀
20
6
26
非优秀
10
14
24
总计
30
20
50
零假设:假设这次竞赛成绩优秀与性别无关,
因为,
故没有99%的把握认为这次竞赛成绩优秀与性别有关.
2.(25-26高三上·上海·单元测试)某校开设了体育运动兴趣班.为了解学生对开设课程的满意程度,设置了满分为10分的满意度调查表,统计了1000名学生的调查结果,得到题图所示的频率分布直方图:
(1)求这1000名学生满意度打分的平均数(同一组中的数据用该组区间的中点值为代表);
(2)如果认为打分6分及以上为满意,6分以下为不满意,为了解满意度与学生性别是否有关,现从上述1000名学生的满意度打分中按照“打分组别”用分层抽样的方法抽取容量为200的样本,得到如下2×2列联表.请将列联表补充完整,并根据列联表判断是否有99%的把握认为满意度与学生性别有关.
打分性别
不满意
满意
总计
男生
100
女生
60
总计
200
附:,
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)6.68
(2)表格见解析,有99%的把握认为满意度与性别有关.
【分析】(1)根据平均数的定义列式计算;
(2)求出200人中满意的人数和不满意的人数,补充列联表,求出,查表比较数据判断是否有99%的把握认为满意度与学生性别有关.
【详解】(1)根据统计数据,计算平均数为:;
(2)由频率分布直方图可知满意和不满意的频率比值为7∶3,
根据比较计算200人中满意的人数为人,不满意的有60分,
补充完整的列联表如下:
不满意
满意
总计
男生
20
80
100
女生
40
60
100
总计
60
140
200
零假设为:满意度与学生性别独立,
则,
经查表,得,所以有99%的把握认为满意度与性别有关.
3.(24-25高三·上海·课堂例题)“日行万步”正成为健康生活的代名词.某地一研究团队统计了该地区1000位居民的日行步数,得到如下表格:
日行步数(单位:千步)
人数(人)
20
60
170
200
300
200
50
(1)为研究日行步数与居民年龄的关系,以日行步数是否超过8千步为标准进行分层抽样,从上述1000位居民中抽取200人,得到如下列联表,请将列联表补充完整,并根据2列联表判断是否有95%把握认为日行步数与居民年龄超过40岁有关;
日行步数千步
日行步数>8千步
总计
40岁以上(人)
100
40岁以下(含40岁)(人)
50
总计
200
0.50
0.40
0.25
0.15
0.010
0.05
0.025
0.010
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
(2)以这1000位居民日行步数超过8千步的频率,代替该地区1位居民日行步数超过8千的概率,每位居民日行步数是否超过8千相互独立.为了深入研究,该研究团队随机调查了20位居民,其中日行步数超过8千的最有可能(即概率最大)是多少位居民?
【答案】(1)列联表见解析,没有
(2)
【分析】(1)根据表中数据可以将列联表补充完整,进而可以求出卡方值,进而可以判断是否有把握;
(2)依题意列出不等式,解不等式即可.
【详解】(1)1000人中,步数不超过8千步的有人,超过8千步有550人,
按分层抽样,抽取的人数中不超过8千步的有90人,超过8千步的有110人,
列联表如下:
日行步数千步
日行步数>8千步
总计
40岁以上
40
60
100
40岁以下(含40岁)
50
50
100
总计
90
110
200
零假设 日行步数与居民年龄超过40岁无关.
.
故没有95%把握认为日行步数与居民年龄超过40岁有关;
(2)每位居民步数超过8千的概率为,设步数超过8千的最有可能是位居民,
所以
所以,因为,所以,即最有可能是11位居民.
4.(24-25高三上·上海·开学考试)为了缓解高三学生学业压力,学校开展健美操活动,高三某班文艺委员调查班级学生是否愿意参加健美操,得到如下的列联表.
性别
愿意
不愿意
男生
6
10
女生
18
6
(1)根据该列联表,并依据显著水平的独立性检验,判断能否认为“学生性别与是否愿意参加健美操有关”;
(2)在愿意参加的所有学生中,根据性别,分层抽样选取8位学生组织班级健美操队,并从中随机选取2人作为领队,记这2人中女生人数为随机变量,求的分布及期望.
附:.
【答案】(1)能
(2)分布列见解析,
【分析】(1)完善列联表,作出零假设,根据独立性检验公式计算的值,推断出零假设成立与否,从而得出判断;
(2)根据列联表得出选取8人中男生与女生人数,由超几何分布计算出对应概率值,得出随机变量的分布列,求出数学期望.
【详解】(1)列联表如下:
性别
愿意
不愿意
合计
男生
6
10
16
女生
18
6
24
合计
24
16
40
零假设为:是否愿意参加健美操与学生性别无关.
根据列联表中的数据,可得,
根据小概率值的独立性检验,我们推断不成立,
既认为是否愿意参加健美操与学生性别有关联,此判断犯错误的概率不大于0.005.
(2)根据列联表可得愿意参加健美操的学生中女生占全部的,
∴选取的8人中,女生有人,男生有人,
∴随机变量的可取值:0,1,2.
∴,,.
∴随机变量的分布列:
0
1
2
数学期望.
5.(24-25高三下·上海杨浦·开学考试)随着5G时代的全面来临,借助手机,网银等实施的非接触式电信诈骗迅速发展蔓延,不法分子甚至将“魔爪”伸向了学生.为了调查同学们对“反诈”知识的了解情况,某校进行了一次抽样调查,统计得到以下列联表.
不了解
了解
合计
女生
20
20
40
男生
10
合计
80
(1)取进行独立性检验,判断该校学生对“反诈”知识的了解与性别是否有关;
(2)用频率估计概率,样本估计总体,从全校男生中随机抽取5人,记其中对“反诈”知识了解的人数为,求的分布及数学期望;
(3)为了增强同学们的防范意识,该校举办了主题为“防电信诈骗,做反诈达人”的知识竞赛.已知全校参加本次竞赛的学生分数近似服从正态分布,若某同学成绩满足,则该同学被评为“反诈标兵”;若,则该同学被评为“反诈达人”.
(i)试判断分数为88分的同学能否被评为“反诈标兵”;
(ii)若全校共有50名同学被评为“反诈达人”,估计参与本次知识竞赛的学生人数.(四舍五入后取整)
附:(1),其中,;
(2)若,则:,,.
【答案】(1)答案见解析;
(2)分布列见解析,3.75;
(3)(i)能被评为“反诈标兵”;(ii)2198人.
【分析】(1)完善列联表,计算卡方值,判断求解即得;
(2)由已知,根据二项分布得出的分布列和数学期望;
(3)(i)依题意求出,由即可判断;(ii)利用正态曲线的对称性,计算出,即可估计出学生总人数.
【详解】(1)完成列联表:
性别
不了解
了解
合计
女生
20
20
40
男生
10
30
40
合计
30
50
80
零假设该校学生对“反诈”知识的了解与性别无关,
则,依题意,,
因为进行独立性检验,推断不成立,所以判断该校学生对“反诈”知识的了解与性别有关.
(2)由(1)知,样本中的男生对“反诈”知识了解的频率为是,
用样本估计总体,从全校男生中随机抽取一人,
对“反诈”知识了解的概率为,则,
,
,
,
,
,
.
则X的分布列为
X
0
1
2
3
4
5
P
所以.
(3)(i)依题意,,因,故该同学可被评为“反诈标兵”;
(ii)因,
则估计参与本次知识竞赛的学生人数约为人.
6.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(附:,其中.)
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
【答案】(1)有的把握认为Sora的应用与视频从业人员的减少有关,理由见解析;
(2)(i);(ii)人.
【分析】(1)先零假设,然后计算,根据小概率值的独立性检验即可判断;
(2)(i)设“员工经过培训能应用Sora”,结合互斥事件概率加法公式,独立事件概率乘法公式即可求解;
(ii)设视频部调人至其他部门,为培训后视频部能应用Sora的人数,则,由条件列不等式可求结论.
【详解】(1)零假设:Sora的应用与视频从业人员的减少无关,
,
根据小概率值的独立性检验,可以推断出不成立,
所以有的把握认为Sora的应用与视频从业人员的减少有关;
(2)(i)设“员工经过培训能应用Sora”,
所以,
所以员工经过培训能应用Sora的概率为;
(ii)设视频部调人至其他部门,,为培训后视频部能应用Sora的人数,
则,因此,
调整后视频部的期望年利润为:(万元),
令,解得,又,所以,
因此视频部最多可以调人到其他部门.
7.(24-25高三下·上海·阶段练习)第二十二届卡塔尔世界杯足球决赛中,阿根廷队通过扣人心弦的点球大战战胜了法国队,某校为了丰富学生课余生活,组建了足球社团,足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各名进行调查,部分数据如下表所示.
喜欢足球
不喜欢足球
合计
男生
女生
合计
(1)根据所给数据求出、、、的值,并判断是否有95%的把握认为该校学生喜欢足球与性别有关?(附)
(2)社团指导老师从喜欢足球的学生中抽取了名男生和名女生示范点球射门.已知男生进球的概率为,女生进球的概率为,每人射门一次,假设各人射门相互独立,求人进球总次数的分布和数学期望.
【答案】(1),,、,有关
(2)分布列见解析,期望
【分析】(1)根据列联表可得出、、、的值,计算出的观测值,结合临界值表可得出结论;
(2)由题意可知,人进球总次数的所有可能取值为、、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值.
【详解】(1)由列联表中的数据可得,,
,,
所以,,
故有的把握认为该校学生喜欢足球与性别有关.
(2)人进球总次数的所有可能取值为、、、,
,,
,,
所以,随机变量的分布列如下表所示:
数学期望.
8.(24-25高三下·上海·阶段练习)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市M社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜
不喜欢网上买菜
合计
年龄不超过45岁的市民
40
10
50
年龄超过45岁的市民
20
30
50
合计
60
40
100
(1)是否有95%的把握认为社区的市民喜欢网上买菜与年龄有关?
(2)社区的市民小张周一、二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选择平台买菜,那么周二选择平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从社区随机抽取20名市民,记其中喜欢网上买菜的市民人数为随机变量,并记随机变量,求的期望和方差.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
3.841
6.635
10.828
【答案】(1)有95%的把握认为喜欢网上买菜与年龄有关
(2)
(3),;,
【分析】(1)卡方检验表明年龄与网上买菜偏好相关;
(2)全概率计算得周二选的概率为;
(3)二项分布的期望和方差通过参数推导得出.
【详解】(1)有95%的把握认为喜欢网上买菜与年龄有关.
,
查表得临界值3.841,由于,认为喜欢网上买菜与年龄有关;
(2)
;
(3)喜欢网上买菜的概率,,
则
对于,利用线性变换性质:
.
9.(24-25高三下·上海·阶段练习)向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展.如人工智能中的大语言模型DeepSeek(以下简称DeepSeek).为调查DeepSeek的应用是否会对相关从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示:
DeepSeek的应用情况
相关从业人员
合计
减少
未减少
应用
54
72
没有应用
42
合计
90
150
(1)根据所给数据完成上表,并判断是否有95%的把握认为的应用与相关从业人员的减少有关?
(2)某公司视频部现有员工100人,公司拟开展DeepSeek培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用DeepSeek.
(ⅰ)求员工经过培训能应用DeepSeek的概率.
(ⅱ)已知开展DeepSeek培训前,员工每人每年平均为公司创造利润6万元;开展DeepSeek培训后,能应用DeepSeek的员工每人每年平均为公司创造利润10万元;DeepSeek培训平均每人每年成本为1万元.根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后剩余员工开展DeepSeek培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
附:其中,)
【答案】(1)表格见解析,有的把握认为的应用与视频从业人员的减少有关
(2)(i);(ii)人
【分析】(1)分析数据关系,完善列联表,提出零假设,计算,比较其与临界值大小,判断结论;
(2)(i)设“员工第轮获得优秀”, “员工经过培训能应用”,则,结合互斥事件概率加法公式,独立事件概率乘法公式求结论;
(ii)设视频部调人至其他部门,为培训后视频部能应用的人数,则,由条件列不等式可求结论.
【详解】(1)依题意,列联表如下:
DeepSeek的应用情况
视频从业人员
合计
减少
未减少
应用
没有应用
合计
零假设为:的应用与视频从业人员的减少独立,的应用前后视频从业人员无差异,
由列联表中数据得,.
根据小概率值的的独立性检验,推断不成立,
所以有的把握认为的应用与视频从业人员的减少有关.
(2)(i)设“员工第轮获得优秀”,且相互独立.
设“员工经过培训能应用”,则
,
所以员工经过培训能应用的概率是.
(ii)设视频部调人至其他部门,为培训后视频部能应用的人数,
则,因此,
调整后视频部的年利润为
(万元),
令,解得,又,所以.
所以视频部最多可以调人到其他部门.
10.(2025·上海奉贤·二模)某疾病预防中心随机调查了339名50岁以上的公民,研究吸烟习惯与慢性气管炎患病 的关系,测得数据如表所示:
不吸烟者
吸烟者
总计
不患慢性气管炎者
121
283
患慢性气管炎者
总计
134
339
(1)估算样本中吸烟者中患慢性支气管炎的百分比;
(2)有多少把握认为患慢性支气管炎与吸烟有关?
附:,其中,,,.
【答案】(1)26.54%
(2)有把握
【分析】(1)计算可得吸咽者为,吸烟者中患有慢性支气管炎的人数为,
(2)利用表格中的数据计算的观测值,再与临界值比对得解.
【详解】(1)因为,解得,,解得,
所以吸咽者为,吸烟者中患有慢性支气管炎的人数为,
所以,
所以,估算样本中吸烟者约有26.54%患有慢性支气管炎.
(2)零假设:假设患慢性支气管炎与吸烟无关, 计算,
,
,从而不成立,
所以我们有把握认为患慢性支气管炎与吸烟有关.
11.(2025·上海金山·二模)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
附:;
0.10
0.01
0.001
2.706
6.635
10.828
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布和期望.
【答案】(1)列联表见解析,0.35;
(2)有;
(3)分布列见解析,期望为.
【分析】(1)完善列联表,求出经验概率.
(2)求出的观测值,与临界值比对得解.
(3)求出的可能值及对应概率,列出分布列并求出期望.
【详解】(1)完善列联表,如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
6
20
不是每天都整理数学错题人数
5
15
20
合计
19
21
40
每天都整理数学错题且数学成绩总评优秀的经验概率为.
(2)由(1)得,
所以有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(3)不是每天都整理数学错题的学生有20人,其中数学成绩总评优秀人数为5,
的所有可能值为0,1,2,3,
,
,
所以的分布列为:
0
1
2
3
期望.
12.(24-25高三上·上海·期末)某区体育老师为了了解初中学生的性别和喜欢篮球是否有关,随机调查了该区1000名初中学生,得到成对样本数据的分类统计结果,如下表所示:
性别
是否喜欢篮球
合计
喜欢
不喜欢
男生
350
250
600
女生
250
150
400
合计
600
400
1000
(1)依据的独立性检验,能否认为该区初中学生的性别与喜欢篮球有关联;
(2)用按性别比例分配的分层随机抽样的方法从参与调查的,喜欢篮球的600名初中学生中抽取12名学生做进一步调查,将这12名学生作为一个样本,从中随机抽取3人,用X 表示随机抽取的3人中女生的人数,求X 的分布列和数学期望.
附:参考数据
其中
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【答案】(1)不能
(2)分布列见解析,
【分析】(1)计算,与对应的临界值比较,根据独立性检验的基本思想即可得结论;
(2)先根据喜欢篮球的男、女比例求出抽取的的12名学生中男生、女生人数,再根据超几何分布的概率公式计算可得分布列,进而求得数学期望.
【详解】(1)零假设:该区初中学生的性别与喜欢篮球无关,
则,
依据的独立性检验,没有理由认为假设不成立,
即不能认为该区初中学生的性别与喜欢篮球有关联;
(2)由题意,按性别比例分配的分层随机抽样的方法抽取的12名学生中,男生有7名,女生有5名,
则X的取值可能为:0,1,2,3,且服从超几何分布,,
则,
,
故X 的分布列为
X
0
1
2
3
P
数学期望.
13.(24-25高三下·上海虹口·期中)已知某区组建了一支120人的志愿者队伍,并由其中72人组成“志愿模范队”.经过一年的实践,全队共有72人的周平均服务时长超过2小时,其中有54人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
54
72
周平均服务时长不超过2小时
总计
72
120
(1)已知一名志愿者是“志愿模范队”成员,求其周平均服务时长超过2小时的概率.
(2)请完成列联表,并根据表中数据回答:是否有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系?
(3)现从周平均服务时长超过2小时的人员中按照是否为“志愿模范队”成员进行分层抽样,选取8人组建“志愿突击队”,并从这8人中再随机选取2人做深度访谈,记随机变量为这2人中来自于“志愿模范队”的人数,求的分布与方差
附录:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)
(2)有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系.
(3)见解析.
【分析】(1)利用古典概率求解即可;
(2)计算出的值,即可判断;
(3)利用超几何分布求出分布列,然后利用期望和方差的公式求解即可.
【详解】(1)由表可知,若一名志愿者是“志愿模范队”成员,则其周平均服务时长超过2小时的概率:.
(2)根据题意,可将表格补充完整:
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
54
18
72
周平均服务时长不超过2小时
18
30
48
总计
72
48
120
故,
所以有99.9%的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系.
(3)由分层抽样可知,这8人中有6个来自“志愿模范队”,2个不是“志愿模范队”成员,
故随机变量可能为
且,
故分布列如下:
0
1
2
所以期望:,
方差:.
题型四 概率
1.(25-26高三上·上海·单元测试)2021年1至4月,教育部先后印发五个专门通知,对中小学生手机、睡眠、读物、作业、体质管理作出规定.“五项管理”是“双减”工作的一项具体抓手,是促进学生身心健康、解决群众急难愁盼问题的重要举措.为了在“控量”的同时力求“增效”,提高作业质量,某学校计划设计差异化作业.因此该校对初三年级的400名学生每天完成作业所用时间进行统计,部分数据如下表:
男生
女生
总计
90分钟以上
80
180
90分钟以下
220
总计
160
240
400
(1)求、、的值,并根据题中的列联表,判断是否可以认为完成作业所需时间在90分钟以上与性别有关?
(2)学校从完成作业所需时间在90分钟以上的学生中用分层抽样的方法抽取9人了解情况,甲老师再从这9人中选取3人进行访谈,求甲老师选取的3人中男生人数大于女生人数的概率.
【答案】(1),,,不能认为
(2)
【分析】(1)根据表中已有的数据可求出、、的值,再计算即可判断.
(2)由分层抽样可知男生人数与女生人数,再根据男生人数大于女生人数分类求概率即可.
【详解】(1)由可得;由可得;由可得;
所以列联表如下:
男生
女生
合计
90分钟以上
80
100
180
90分钟以下
80
140
220
合计
160
240
400
,
所以不能认为完成作业所需时间在90分钟以上与性别有关.
(2)抽取的9人中,男生:人,女生:人,
男生人数大于女生人数的情况分为:
①男生2人,女生1人;
②男生3人,女生0人;
所以所求概率.
2.(25-26高三上·上海·单元测试)盲盒里面通常装的是动漫、影视作品的周边产品,或者设计师单独设计出来的玩偶,由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A,B,C三种样式,且每个盲盒只装一个.某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.据统计,有50%的人购买了该盲盒.在这些购买者中,女生占;而在未购买者中,男生女生各占50%.
(1)请根据以上信息填写下表,并判断是否有95%的把握认为购买该盲盒与性别有关?
女生
男生
合计
购买者
未购买者
合计
(2)在购买者中按照性别分层抽样抽取5名,再从这5名中随机抽取2人,求抽取的这两人恰好是女生的概率.
【答案】(1)填表见解析;没有
(2)
【分析】(1)由题中数据可得2×2列联表,求出结合临界值表得结论;
(2)结合古典摡型的概率计算公式,即可求解.
【详解】(1)由题意可得2×2列联表:
女生
男生
总计
购买
60
40
100
未购买
50
50
100
总计
110
90
200
.因为,
所以没有95%把握认为“购买该款盲盒与性别有关”;
(2)购买者中女生和男生的比例为3∶2,所以抽取的5人中女生3人,男生2人.
所以抽取的这两人恰好是女生的概率为.
3.(24-25高三下·上海·阶段练习)某甜品店打算推出三款新品,在前期市场调研时,将顾客按照年龄分为青少年组中年组和老年组,随机调查了名顾客对这三款新品的购买意愿,统计数据如下(单位:人):
青少年组
中年组
老年组
愿意
不愿意
愿意
不愿意
愿意
不愿意
第一款
第二款
第三款
假设顾客的购买意愿相互独立.用频率估计概率.
(1)从顾客中随机抽取人,估计该名顾客愿意购买第一款新品的概率;
(2)从三个不同年龄组的顾客中各随机抽取人,记为这人中愿意购买第二款新品的人数,求的分布列和数学期望;
(3)用“”表示顾客愿意购买第款新品,“”表示顾客不愿意购买第款新品.写出方差、、的大小关系并说明理由.
【答案】(1)
(2)分布列见解析,
(3),理由见解析
【分析】(1)由表格中的数据结合古典概型的概率公式可求得所求事件的概率;
(2)分析可知,随机变量的可能取值有、、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求出的值;
(3)根据离散型随机变量的概率公式求解即可.
【详解】(1)由表格中的数据结合古典概型的概率公式可知,
从顾客中随机抽取人,估计该名顾客愿意购买第一款新品的概率.
(2)在三个不同年龄组的顾客中各随机抽取人,青
少年组、中年组、老年组的顾客愿意购买第二款新品的概率分别为、、,
由题意可知,随机变量的可能取值有:、、、,
所以,,
,
,,
所以,随机变量的分布列如下表所示:
故随机变量的期望为.
(3)用频率估计概率,由表可知顾客愿意购买第款新品的概率为,
顾客愿意购买第款新品的概率为,
顾客愿意购买第款新品的概率为,
所以,,
所以,
,
所以.
4.(2025·上海闵行·二模)某社团共有12名成员,其中高一男生2人,女生4人,高二男生3人,女生3人.现从中随机抽选2人参加数学知识问答.
(1)若逐个抽选,求恰好第一个抽选的是男生的概率;
(2)若恰好抽选了1名男生与1名女生,求这2人都是高二学生的概率;
(3)若恰好抽选了1名高一学生与1名高二学生,记抽选出来的男生与女生的人数之差的绝对值为,求的分布列与数学期望.
【答案】(1)
(2)
(3)分布列见解析;
【分析】(1)结合题意,由古典概率求解即可;
(2)由条件概率计算公式即可;
(3)列出的可能取值,求出相应概率,然后再由期望公式求出期望即可.
【详解】(1)逐个抽选,恰好第一个抽选的是男生的情况为男生所占人数总比例,故概率为.
(2)记事件为恰好抽选了1名男生与1名女生,事件为这2人都是高二学生,
由条件概率可得.
(3)因为共抽取了2名学生,所以男生人数与女生人数之差只能为偶数,分两种情况讨论:
当时,
男
女
高一
1
0
高二
0
1
或
男
女
高一
0
1
高二
1
0
所以;
当时,
男
女
高一
1
0
高二
1
0
或
男
女
高一
0
1
高二
0
1
所以,
所以的分布列为
0
2
.
5.(2025·上海浦东新·二模)为测试、两款人工智能软件解答数学问题的能力,将道难度相当的数学试题从到编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,并记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
几何试题
函数试题
(1)分别估计软件、软件能正确解答数学问题的概率;
(2)小浦准备用这两款软件来解决某次数学测试中的第题(假设其难度和测试的道题基本相同),但该题内容还未知,从已往情况来看,该题是几何题的概率为,是函数题的概率为.将频率视为概率,试通过计算来说明小浦应该用哪款软件解决这道试题?
(3)小浦决定采用这两款软件解答道类似试题,其中几何、函数各道,每道试题只用其中一款软件解答一次.将频率视为概率,小浦比较了这两款软件在解答几何和函数题上的正确率,决定用表现较好的那款软件解决其擅长的题型.用、分别表示这道几何试题与道函数试题被正确解答的个数,求随机变量的数学期望和方差.
【答案】(1)软件、软件能正确解答数学问题的概率分别为、
(2)应该使用软件来解决这道试题.
(3),
【分析】(1)利用古典概型的概率公式可求得软件、软件能正确解答数学问题的概率;
(2)利用全概率公式计算出、软件分别能解答对第题的概率,比较大小后可得出结论;
(3)利用二项分布的期望公式和方差公式可求出随机变量、的期望和方差,由题意可知、相互独立,可得出,,即可得出答案.
【详解】(1)记、软件能正确解答数学问题的概率为和,
结合题中数据以及古典概型的概率公式可得,.
(2)记“软件能正确解答这道题”为事件,“软件能正确解答这道题”为事件,
“该题为几何题”为事件.
则,,,,,,
由全概率公式可得.
.
因为,所以软件能够正确解决这道试题的概率更大,
故小浦应该使用软件来解决这道试题.
(3)几何试题用软件解答,函数试题用软件解答.
因为,,
由二项分布的期望公式可得,,
由二项分布的方差公式可得,,
因为、相互独立,则,
.
题型五 随机变量及其分布
1.(24-25高三下·上海·阶段练习)截至2024年底,我国新能源汽车保有量达到3140万辆,占汽车总量的.某市调查了1000名汽车驾驶员对新能源汽车的偏好程度,调查结果如下:
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
女性驾驶员
100
400
合计
400
1000
(1)请根据所给数据,完成上面的列联表;
(2)判断是否有的把握认为偏好燃油汽车或新能源汽车与驾驶员的性别有关;
(3)用频率估计概率,在所有参加调查的驾驶员按男性和女性进行分层抽样,随机抽取10名驾驶员,再从这10名驾驶员中随机抽取2人进行问卷调查.抽取的2人中,求在有女性驾驶员参加问卷调查的条件下,恰有1名男性驾驶员也参加问卷调查的概率.
附:, 其中
【答案】(1)列联表见解析
(2)有的把握认为偏好燃油汽车或新能源汽车与驾驶员的性别有关
(3)
【分析】(1)根据题干数据完善列联表;
(2)计算出卡方,即可判断;
(3)利用古典概率及条件概率公式计算得解.
【详解】(1)依题意可得列联表如下:
偏好燃油汽车
偏好新能源汽车
合计
男性驾驶员
300
300
600
女性驾驶员
100
300
400
合计
400
600
1000
(2)由(1)可得,
所以有的把握认为偏好燃油汽车或新能源汽车与驾驶员的性别有关.
(3)抽取的名驾驶员中,女性驾驶员有(人),男性驾驶员有6人,
记有女性驾驶员参加问卷调查的事件为,恰有1名男性驾驶员参加问卷调查的事件为,
则,,
所以,
所以在有女性驾驶员参加问卷调查的条件下,恰有1名男性驾驶员也参加问卷调查的概率为.
2.(23-24高二下·湖南·期中)2024年两会期间民生问题一直是百姓最关心的热点,某调查组利用网站从参与调查者中随机选出200人,数据显示关注此问题的约占,并将这200人按年龄分组,第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.
(1)求a,并估计参与调查者的平均年龄;
(2)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,若选出的200人中不关注民生问题的中老年人有10人,得到如下2×2列联表.请将列联表补充完整填入答题卡,并回答:依据小概率值的独立性检验,能否认为是否关注民生与年龄有关?
关注民生问题
不关注民生问题
合计
青少年
中老年
10
合计
200
(3)将此样本频率视为总体的概率,从网站随机抽取4名青少年,记录4人中“不关注民生问题”的人数为,求随机变量时的概率和随机变量的数学期望.
附:.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)0.035;41.5岁
(2)表格见解析;有关
(3);1
【分析】(1)利用频率直方图面积和为1,即可得到,根据频率直方图计算平均数即可;
(2)根据频率分布直方图得到青少年组、中老年组人数,从而得到列联表,再零假设计算出,根据独立性检验可得答案;
(3)将频率视为概率,计算出青少年“不关注民生问题”的概率,根据每次抽取的结果是相互独立的得,可得答案
【详解】(1),
,
,
估计参与调查者的平均年龄为:41.5岁;
(2)选出的200人中,各组的人数分别为:
第1组:人,第2组:人,
第3组:人,第4组:人,
第5组:人,
青少年组有人,中老年组有人,
参与调查者中关注此问题的约占有人不关心民生问题,
选出的200人中不关注民生问题的青少年有30人,
列联表如下;
关注民生问题
不关注民生问题
合计
青少年
90
30
120
中老年
70
10
80
合计
160
40
200
零假设:假设关注民生问题与性别相互独立,
,
根据独立性检验,可以认为零假设不成立,
即能依据小概率值的独立性检验,认为是否关注民生与年龄有关;
(3)由题意,青少年“不关注民生问题”的频率为,
将频率视为概率,每个青少年“不关注民生问题”的概率为,
因为每次抽取的结果是相互独立的,所以,
所以,
所以,.
3.(24-25高三·上海·课堂例题)若是一个三位正整数,且的个位数字大于十位数字,十位数字大于百位数字,则称为“三位递增数”(如137,359,567等).在某次数学趣味活动中,每位参加者需从所有的“三位递增数”中随机抽取1个数,且只能抽取一次.得分规则如下:若抽取的“三位递增数”的三个数字之积不能被5整除,参加者得0分;若能被5整除,但不能被10整除,得分;若能被10整除,得1分.
(1)写出所有个位数字是5的“三位递增数”;
(2)若甲参加活动,求甲得分的期望.
【答案】(1)125、135、145、235、245、345;
(2).
【分析】(1)根据“三位递增数”的定义,即可写出所有个位数字是5的“三位递增数”;
(2)由题意得随机变量的取值为:0、、1,求出相应的概率,即可求出甲得分的期望.
【详解】(1)个位数字是5的“三位递增数”有125、135、145、235、245、345;
(2)由题意知,全部“三位递增数”的个数为,随机变量的取值为:0、、1,
当时,可以选择除去5以外的剩下8个数字中选择3个进行组合,即有种,
所以,
当时,首先选择5,由于不能被10整除,因此不能选择数字2,4,6,8,可以从1,3,7,9中选择2个数字和5进行组合,即有种,
所以,
当时,有两种组合方式,第一种:首先选5,然后从2,4,6,8中选择2个数字和5进行组合,即可种,
第二种:首先选5,然后从2,4,6,8中选择1个数字,再从1,3,7,9中选择1个数字,最后把3个数进行组合,即有种,
所以或
所以的分布为,
则.
4.(24-25高三·上海·课堂例题)某线上健身学习平台,从用户系统中随机选出200名学员,对该平台的教学成效评价和课后跟踪辅导评价进行了统计,并用以估计所有学员对该平台的满意度.其中对教学成效满意率为0.9,课后跟踪辅导的满意率为0.8,对教学成效和课后跟踪辅导都不满意的有10人.
(1)完成下面列联表,并分析是否有把握认为教学成效满意度与跟踪辅导满意度有关.
对教学成效满意(人)
对教学成效不满意(人)
合计(人)
对课后跟踪辅导满意
对课后跟踪辅导不满意
合计
(2)若用频率代替概率,假设在服务协议终止时对教学成效和课后跟踪辅导都满意学员的续签率为90%,只对其中一项不满意的学员续签率为60%,对两项都不满意的续签率为10%.从该学习平台中任选10名学员,估计在学习服务终止时续签学员人数.
【答案】(1)列联表见解析,有
(2)
【分析】(1)完成列联表,利用公式计算的观测值结合表格做出判断;
(2)分别计算各种续签人数然后得到平台的续签率,根据二项分布得到平台续签人数.
【详解】(1)列联表答案见解析,有把握认为教学成效满意度与跟踪辅导满意度有关;
对教学成效满意
对教学成效不满意
合计
对课后跟踪辅导满意
150
10
160
对课后跟踪辅导不满意
30
10
40
合计
180
20
200
计算得,
故有把握认为教学成效满意度与跟踪辅导满意度有关;
(2)在200人中对平台的双满意的续签人数为,
仅一项满意的续签人数为,
都不满意的续签人数为,
所以该平台的续签率为
依题意有,
所以任选10人,该平台续签人数为8人.
5.(25-26高三上·上海·单元测试)某中学选派40名学生参加上海市高中生志愿者的培训活动,他们参加培训的次数统计如下表所示:
培训次数
1
2
3
参加人数
5
15
20
(1)从这40名学生中任选3名,求这3名学生中至少有2名学生参加培训次数恰好相等的概率(结果用最简分数表示);
(2)从这40名学生中任选2名,用表示这2人参加培训次数之差的绝对值,求随机变量的期望(结果用最简分数表示).
【答案】(1)
(2)
【分析】(1)使用间接法,计算这3名学生中没有学生参加培训次数相等的概率后用1减去即可得;
(2)求出可能取值及其对应概率即可得其分布列,由分布列即可得其期望.
【详解】(1)这3名学生中至少有2名学生参加培训次数恰好相等的概率;
(2)由题意知可能取值为0、1、2,
,
,
,
则随机变量的分布为,
所以的期望.
6.(24-25高三下·上海·阶段练习)某公司为招聘新员工设计了一个面试方案:应聘者从道备选题中一次性随机抽取 道题,按照题目要求独立完成. 规定:至少正确完成其中道题便可通过面试.已知道备选题中应聘者甲有道题能正确完成,道题不能完成;应聘者乙每题正确完成的概率都是,且两位应聘者每题正确完成与否互不影响.
(1)求甲正确完成面试题数的分布列及其期望;
(2)求乙正确完成面试题数的分布列及其方差;
(3)试问:甲和乙谁通过面试的可能性更大?并说明理由.
【答案】(1)分布列见解析;
(2)分布列见解析;
(3)甲通过面试的可能性更大;理由见解析
【分析】(1)确定的可能取值,利用超几何分布求概率公式求出概率,列出分布列,求出期望即可;
(2)确定的可能取值,利用二项分布求概率公式求出概率,列出分布列,求出期望方差即可;
(3)确定甲、乙通过面试的概率,比较即可的结论.
【详解】(1)甲正确完成试题数的可能取值为,,,
,,,
所以甲正确完成面试题数的分布列为:
.
(2)乙正确完成面试题数的可能取值为:,,,
,,
,,
所以乙正确完成面试题数的分布列为:
所以,
.
(3)因为,,
所以,所以甲通过面试的可能性大.
7.(2025·上海普陀·二模)某区为推进教育数字化转型,通过聚合区域学校的教育资源,依托AI技术搭建了区域智慧题库系统,形成了“通识过关—综合拓展—创新提升”三层动态原库,且三层题量之比为,设该题库中任意1道题被选到的可能性都相同.
(1)现有4人参加一项比赛,若每人分别独立地从该题库中随机选取一道题作答,求这4人中至少有2人的选题来自层的概率;
(2)现采用分层随机抽样的方法,使用智能组卷系统从该题库中选取12道题生成试卷,若某老师要从生成的这份12道题的试卷中随机选取3道题做进一步改编,记该老师选到层题的题数为,求的分布与期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)先求出在层选题的概率和不在层选题的概率,再结合题意得到,最后利用二项分布概率公式求解即可.
(2)先依据题意求出在层最多抽到7道,再求出对应概率,进而求出分布列和数学期望即可.
【详解】(1)因为三层题量之比为,
所以在层选题的概率为,不在层选题的概率为,
设至少2人的选题来自层的概率为,从层选题数量为,
由题意得,而二项分布概率公式为,
则至少2人的选题来自层的概率为,
故.
(2)因为三层题量之比为,
所以在层最多抽到7道,且可取,
则,
,
其分布列为
所以期望.
8.(2025·上海黄浦·二模)一盒子中有大小与质地均相同的20个小球,其中白球个,其余为黑球.
(1)当盒中的白球数时,从盒中不放回地随机取两次,每次取一个球,用表示事件“第一次取到白球”,用表示事件“第二次取到白球”,求和,并判断事件与是否相互独立;
(2)某同学要策划一个抽奖活动,参与者从盒中一次性随机取10个球,若其中恰有3个白球,则获奖,否则不获奖,要使参与者获奖的可能性最大、最小,该同学应该分别如何放置白球的数量?
【答案】(1),不独立;
(2)当时,获奖的可能性最大;当时,获奖的可能性最小.
【分析】(1)根据给定条件,利用古典概率及条件概率公式求解,再利用全概率公式求出,利用相互独立事件定义判断即可.
(2)求出获奖的概率,再构造函数,结合组合数公式探讨单调性确定概率最大、最小值.
【详解】(1)当时,盒中有6个白球,14个黑球,,,
,
,则,所以事件与相互不独立.
(2)从20个球中取10个球,恰有3个白球的概率,
设,当时,,
,当时,,
当时,,因此,
而,则,
所以当时,参与者获奖的可能性最大;当时,参与者获奖的可能性最小.
9.(2025·上海徐汇·二模)某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布.
(1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到);
(2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到).
参考数据:,,,其中为标准正态分布函数.
【答案】(1)
(2)分布列见解析,
【分析】(1)根据正态分布的性质即可求解;
(2)先求任取一包糖果,净含量小于497.5g的概率,服从二项分布,二项分布即可求解.
【详解】(1)由题意,,的概率等于.
令,则.
因此,
.
故净含量误差超过5g的概率约为.
(2)可能的取值为0、1、2、3.
由(1)可知,任取一包糖果,净含量小于497.5g的概率为.
故服从二项分布,记,
,
从而的分布为
0
1
2
3
0.595
0.337
0.064
0.004
因此.
10.(24-25高三下·上海·阶段练习)若数列满足,则称数列为k项数列,集合是由所有k项数列组成的集合,从集合中任意取出两个不同数列,记变量.
(1)若,求随机变量X的分布列与数学期望;
(2)求,其中且.
【答案】(1)分布列见解析,
(2)
【分析】(1)将时,所有数列排出来,从而得到X的取值有1,2,3,结合组合数求解;
(2)由(1)可推出,X的可能取值为:1,2,3,…,k,再分析当时,则数列的具体选择情况,将这个问题转化为组合问题,从而得到即可;
【详解】(1)若,则中的数列有0,0,0;1,0,0;0,1,0;0,0,1;1,1,0;1,0,1;0,1,1;1,1,1;
从集合中任意取出两个不同数列,,,
∴X的取值有1,2,3,从8个数列中任选2个,共有种情况,
其中当时,若选择0,0,0,可从1,0,0;0,1,0;0,0,1任选1个,共有3种情况,
若选择1,1,1,可以从1,1,0;1,0,1;0,1,1任选1个,共有3种情况,
另外1,0,0和1,0,1;1,1,0两者之一满足要求,0,1,0和1,1,0;0,1,1两者之一满足要求,0,0,1和1,0,1;0,1,1两者之一满足要求,共有种情况,故,
当时,0,0,0,和1,1,1满足要求,1,0,0和0,1,1满足要求,0,1,0和1,0,1满足要求,0,0,1和1,1,0满足要求,共有4种情况,,
,
随机变量X的分布列:
X
1
2
3
P
则随机变量X的数学期望为;
(2)证明:数列是从集合中任意取出的两个数列,
∴数列为k项数列,
∴X的可能取值为:1,2,3,…,k,
根据数列中0的个数可得,集合中元素的个数共有个,
当时,则数列中有m项取值不同,有项取值相同,
从k项中选择m项,和在m项的某一项数字相同,其余项,两者均在同一位置数字不同,
,这个问题是组合问题,
∴所有的情况会重复1次,∴一共有种情况,
,
∴随机变量X的分布列为:
X
1
2
3
……
k
P
……
11.(24-25高三下·上海·阶段练习)马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第n次的状态有关,为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐.已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为,前一天选择面食套餐后继续选择面食套餐的概率为,如此往复.
(1)求该同学第二天中午选择米饭套餐的概率;
(2)记该同学第n天选择米饭套餐的概率为;
①证明:为等比数列;
②当时,恒成立,求m的取值范围.
【答案】(1);
(2)①证明见解析;②
【分析】(1)根据全概率公式求得正确答案.
(2)①先求得的关系式,然后利用构造法证得为等比数列;
②先求得,然后求得的最大值,由此求得的取值范围.
【详解】(1)设为“第一天选择米饭套餐”:为“第二天选择米饭套餐”,
则为“第一天不选择米饭套餐”,
根据题意,,,,
由全概率公式得:.
(2)①:证明:设为“第n天选择米饭套餐”,则,,
根据题意,,,
由全概率公式得:
因此,.
是以为首,为公比的等比数列.
②:根据①可得,
所以,下求的最大值,
要求的最大值,则为偶数,
当为偶数时,,
此时是单调递减数列,
所以的最大值为,
因此,则m的取值范围是.
6 / 6
学科网(北京)股份有限公司
$$