专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(复习讲义)(上海专用)2026年高考数学二轮复习讲练测

2026-02-06
| 2份
| 68页
| 4916人阅读
| 107人下载
精品

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 概率
使用场景 高考复习-二轮专题
学年 2026-2027
地区(省份) 上海市
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 4.70 MB
发布时间 2026-02-06
更新时间 2026-02-06
作者 汪洋
品牌系列 上好课·二轮讲练测
审核时间 2026-01-07
下载链接 https://m.zxxk.com/soft/55822824.html
价格 3.00储值(1储值=1元)
来源 学科网

摘要:

该高中数学高考复习讲义聚焦概率与统计解答题,系统整合频率分布直方图、回归分析、独立性检验、二项分布等8大核心知识点,按“考情精解-题型攻坚-真题演练”逻辑架构,通过考点梳理、方法提炼、真题剖析等环节,帮助学生构建从基础统计估计到复杂概率模型的解题体系,提升复习针对性。 讲义突出“以题带点”教学策略,如在马尔科夫链题型中,通过传球模型实例引导学生用数学思维抽象概率递推关系,结合决策问题训练数据解读与方案优化能力,培养数学眼光与表达。设置基础巩固、创新应用分层练习,配套真题题型预测,助力教师精准把控复习节奏,高效提升学生概率统计综合解题与应考能力。

内容正文:

专题20概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题) 目录 01 析·考情精解 02 破·题型攻坚 考点 概率与统计解答题全归纳 真题动向 必备知识 知识点1根据频率分布直方图求平均数、中位数和众数 知识点2样本相关系数 知识点3回归分析 知识点4独立性检验 知识点5离散型随机变量分布列均值,方差 知识点6二项分布 知识点7超几何分布 知识点8正态分布 命题预测 题型01 统计估计与概率 题型02 统计图表与概率 题型03 残差与决定系数 题型04 回归分析 题型05 独立性检验 题型06二项分布与超几何分布 题型07正态分布 题型08 概率中的决策问题 题型09 概率中的赛制问题 题型10 马尔科夫链 命题轨迹透视 题型以中档解答题为主,分值为14分左右。整体难度中档,是得分的关键板块之一。 1. 高频基础考点:样本空间、随机事件的关系与运算,频率与概率的区别,互斥事件、对立事件的辨析及简单概率计算。 2. 核心基础考点:概率模型,古典概型,条件概率、全概率公式考查频率较高,还会涉及相互独立事件的概率计算。 试题多以校园活动、生活安全、保险、竞赛等实际场景为背景,考查学生将实际问题转化为概率模型的能力。。 考点频次总结 考点 2025年 2024年 2023年 概率统计 上海卷T17,14分 上海卷T19,14分 上海卷T19,14分 2026命题预测 预计在2026年高考中,解答题中利用排列、组合考查离散型随机变量的分布列、期望、方差、二项分布和正态分布等问题,有时亦考查回归方程、统计案例的相关内容,加强阅读理解与信息处理能力. 考点 概率与统计解答题全归纳 1.(2025·上海·高考真题)2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列. 206.78 207.46 207.95 209.34 209.35 210.68 213.73 214.84 216.93 216.93 (1)求这组数据的极差与中位数; (2)从这10个数据中任选3个,求恰有2个数据在211以上的概率; (3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒). 2.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示: 时间范围学业成绩 优秀 5 44 42 3 1 不优秀 134 147 137 40 27 (1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少? (2)估计该地区初中学生日均体育锻炼的时长(精确到0.1) (3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关? (附:其中,.) 3.(2023.上海·高考真题)21世纪汽车博览会在上海2023年6月7日在上海举行,下表为某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示: 红色外观 蓝色外观 米色内饰 8 12 棕色内饰 2 3 (1)若小明从这些模型中随机拿一个模型,记事件A为小明取到的模型为红色外观,事件B取到模型有棕色内饰,求,并据此判断事件A和事件B是否独立; (2)为回馈客户,该公司举行了一个抽奖活动,并规定,在一次抽奖中,每人可以一次性抽取两个汽车模型。为了得到奖品类型,现作出如下假设: 假设1:每人抽取的两个模型会出现三种结果:①两个模型的外观和内饰均为同色;②两个模型的外观和内饰均为不同色;③两个模型的外观同色但内饰不同色,或内饰同色但外观不同色。 假设2:该抽奖设置三类奖,奖金金额分别为:一等奖600元,二等奖300元,三等奖150元。 假设3:每种抽取的结果都对应一类奖。出现某种结果的概率越小,奖金金额越高。 请判断以上三种结果分别对应几等奖。设中奖的奖金数是,写出的分布,并求的数学期望。 知识点1根据频率分布直方图求平均数、中位数和众数 众数、中位数、平均数与频率分布直方图的关系 (1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替. (2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (3)众数:众数是最高小矩形底边的中点所对应的数据. 知识点2样本相关系数 (1)样本相关系数:设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示: 变量x … 变量y … 两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量, 其计算公式为, 其中,,,它们分别是这两组数据的算术平均数. (2)相关系数r与相关程度 (1)当时,称成对样本数据正相关; 当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系; (2)样本相关系数r的取值范围为[-1,1]; 当越接近1时,成对样本数据的线性相关程度越强; 当越接近0时,成对样本数据的线性相关程度越弱. 知识点3回归分析 (1)残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测称为残差; (2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号或身高数据,或体重的估计值等,这样作出的图形称为残差图; (3)残差图法:残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽带越窄,说明模型拟合精度越高; 一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析,借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策; (4)残差平方和:称为残差平方和,残差平方和越小,模型的拟合效果越好; (5)决定系数R2比较,,R2越大,表示残差平方和越小,模型的拟合效果越好,R2越小,残差平方和越大,即模型的拟合效果越差. 知识点4独立性检验 (1)计算公式:,其中. (2)临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值越大. (3)独立性检验:,通常称为零假设或原假设. 基于小概率值的检验规则是: 当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过; 当时,我们没有充分证据推断不成立,可以认为和独立. 这种利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验. (4)独立性检验中几个常用的小概率值和相应的临界值 0. 1 0. 05 0. 01 0. 005 0. 001 2. 706 3. 841 6. 635 7. 879 10. 828 (5)独立性检验的一般方法 ①根据题目信息,完善列联表; ②提出零假设:假设两个变量相互独立,并给出在问题中的解释。 ③根据列联表中的数据及计算公式求出的值; ④当时,我们就推断不成立,即两个变量不独立,该推断犯错误的概率不超过; 当时,我们没有充分证据推断不成立,可以认为两个变量相互独立。 知识点5离散型随机变量分布列均值,方差 (1) (2) 知识点6二项分布 1、定义 一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,) 于是得到的分布列 … … … … 由于表中第二行恰好是二项式展开式 各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率. 注意:①由二项分布的定义可以发现,两点分布是一种特殊的二项分布,即时的二项分布,所以二项分布可以看成是两点分布的一般形式. ②本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的. 3、二项分布的期望、方差 若,则,. 知识点7超几何分布 1、定义 在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布. 0 1 … … 2、超几何分布的适用范围件及本质 (1)适用范围: ①考察对象分两类; ②已知各类对象的个数; ③从中抽取若干个个体,考察某类个体个数的概率分布. (2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的. 知识点8正态分布 1、定义 随机变量落在区间的概率为,即由正态曲线,过点和点的两条轴的垂线,及轴所围成的平面图形的面积,如下图中阴影部分所示,就是落在区间的概率的近似值. 一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为. 其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计. 2、原则 若,则对于任意的实数,为下图中阴影部分的面积,对于固定的和而言,该面积随着的减小而变大.这说明越小,落在区间的概率越大,即集中在周围的概率越大 特别地,有;;. 由,知正态总体几乎总取值于区间之内.而在此区间以外取值的概率只有,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用中,通常认为服从于正态分布的随机变量只取之间的值,并简称之为原则. 题型01 统计估计与概率 1.小明有自觉体锻的习惯,某运动软件记录了其每天运动的时长(单位:min),小明从最近90天的记录中随机选取了10天的记录,具体数据如下: (1)求这组数据的第60百分位数: (2)运动时长不超过60min为不达标,估算从90天记录中随机抽取1天,该天运动时长不达标的概率: (3)从这10个数中随机删除2个数得到一组新的数据,求前后两组数据的极差相同的概率. 2.一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:kg),按从小到大的排序结果如下:62,74,75,84,84,85,85,85,86,87,89,92,93,94,97,99,101,104,107,117. (1)求该水果店过去20天苹果日销售量的平均数; (2)若以过去20天苹果的日销售量的第80百分位数作为下个月每日苹果的平均进货量,试确定下个月每日苹果的平均进货量; (3)若从过去20天中随机抽取3天,分别求“3天中每天的苹果销售量均超过90kg”与“3天中恰有2天的苹果销售量超过90kg”的概率. 3.小闵同学某一天进行了10次100米短跑集训,其中上午进行了6次,下午进行了4次;如下是他上午集训6次的成绩(单位:s):、、、、、. (1)求这6次成绩的中位数; (2)参考这一天上午集训的数据,用经验概率估计概率,求该同学训练100米短跑3次至少有一次用时小于13s的概率; (3)若该同学下午4次的集训原始成绩记录丢失,但记得这4次的平均成绩是14.25s,方差是0.75,求他这一天10次训练成绩的平均值和方差. 题型02 统计图表与概率 4.为培养学生的社会责任感,某校开展了为期一学期的“温暖社区,青春奉献”志愿服务活动.活动结束后,学校从甲、乙两个班级中统计了部分学生的志愿服务时长(单位:小时),统计结果用茎叶图记录如图所示(十位数字作为“茎”,个位数字作为“叶”).已知甲组有9名学生的数据,乙组有10名学生的数据. (1)分别写出甲、乙两组学生服务时长的第70百分位数; (2)从甲、乙两组学生中各随机抽取1人,求抽取的2人中恰有1人的服务时长超过30小时的概率; (3)记甲组志愿服务时长的方差为;在甲组中增加一名学生得到“新甲组”,若的志愿服务时长为27,则记“新甲组”志愿服务时长的方差为;若的志愿服务时长为20,则记“新甲组”志愿服务时长的方差为;通过计算比较的大小(结果精确到0.1),并从数学角度解释这一现象. 5.某区2025年3月31日至4月13日的天气预报如图所示. (1)从3月31日至4月13日某天开始,连续统计三天,求这三天中至少有两天是阵雨的概率; (2)根据天气预报,该区4月14日的最低气温是9,温差是指一段时间内最高温度与最低温度之间的差值,例如3月31日的最高温度为17,最低温度为9,当天的温差为8记4月1日至4日这4天温差的方差为,4月11日至14日这4天温差的方差为,若,求4月14日天气预报的最高气温; (3)从3月31日至4月13日中随机抽取两天,用X表示一天温差不高于9的天数,求X的分布列及期望. 6.某校高三年级学生参加了一次时政知识竞赛,为了了解本次竞赛的成绩情况,从所有答卷中随机抽取份作为样本进行统计,将样本的成绩(满分分,成绩均为不低于分的整数)分成六段:、、、得到如图所示的频率分布直方图. (1)求实数的值;若年级准备选取分及以上的学生进入下一轮竞赛,已知该校高三年级有名学生,估计该校高三年级参加下一轮竞赛的人数; (2)王老师抽取了名参加竞赛的学生,他们的分数为:、、、、.已知这个分数的平均数,标准差,若剔除其中的和这个分数,求剩余个分数的平均数与方差. 7.王老师将全班40名学生的高一数学期中考试(满分100分)成绩分成5组,绘制成如图所示的频率分布直方图,现将记作第一组,、、、分别记作第二、三、四、五组.已知第一组、第二组的频率之和为0.3,第一组和第五组的频率相同. (1)估计此次考试成绩的平均值(同一组数据用该组数据的中点值代替); (2)王老师将测试成绩在和内的试卷进行分析,再从中选2人的试卷进行优秀答卷展示,求被选中进行优秀答卷展示的这2人的测试成绩至少1个在内的概率; (3)已知第二组考生成绩的平均数和方差分别为65和40,第四组考生成绩的平均数和方差分别为83和70,据此计算第二组和第四组所有学生成绩的方差. 题型03 残差与决定系数 8.(2025·云南丽江·三模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了次试验,得到数据如下: 零件的个数x(个) 2 3 4 5 加工的时间y(小时) 2.5 3 4 4.5 参考公式:用最小二乘法求线性回归方程系数公式, (1)求关于的线性回归方程; (2)求各样本的残差; (3)试预测加工个零件需要的时间. 9.某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如下: 并计算得,. (1)根据散点图求y关于x的经验回归方程(精确到0.01); (2)根据线性回归方程,绘制残差图,并分析线性回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差). 附:,. 10.某公司为了解年研发资金(单位:亿元)对年产值(单位:亿元)的影响,对公司近8年的年研发资金和年产值(,)的数据对比分析中,选用了两个回归模型,并利用最小二乘法求得相应的关于的经验回归方程: ①;②. (1)求的值; (2)已知①中的残差平方和,②中的残差平方和,请根据决定系数选择拟合效果更好的经验回归方程,并利用该经验回归方程预测年研发资金为20亿元时的年产值. 参考数据:,,,. 参考公式;刻画回归模型拟合效果的决定系数. 11.(2025·湖南·三模)中国的非遗项目丰富多样,涵盖广泛,体现了中华民族的智慧和独特的文化魅力.春节期间某地为充分宣扬该地非遗物质文化,加大非遗传承人的技艺展示.该地市场开发与发展机构统计了非遗传承人的技艺展示量与市场消费收入的6组数据如下表: 技艺展示量x(单位:个) 21 23 24 27 29 32 市场消费收入y(单位:万元) 6 11 20 27 57 77 (1)若用线性回归理论进行统计分析,求市场消费收入y关于技艺展示量x的回归方程(精确到0.1); (2)若用非线性回归模型求得市场消费收入y关于技艺展示量x的回归方程为,且决定系数,与(1)中的线性回归模型相比,应用决定系数说明哪种模型的拟合效果更好. 附:一组数据,,…,,其回归直线的斜率和截距的最小二乘估计为,;决定系数 参考数据:,,, 线性回归模型的残差平方和为(其中,分别为非遗传承人的技艺展示量和市场消费收入,). 题型04 回归分析 12.为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:克每立方米)与样本对原点的距离(单位:米)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中). 6 97.90 0.21 240 0.14 14.12 26.13 (1)利用相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型; (2)根据(1)的结果建立关于的回归方程,并估计样本对原点的距离米时,平均金属含量是多少? 13.某科研活动共进行了5次试验,其数据如表所示: 特征量 第1次 第2次 第3次 第4次 第5次 (1)求成对数据的相关系数; (2)求特征量关于的回归方程,并据此估算特征量时的值; (3)设特征量作为随机变量服从正态分布,其中为5次试验中的平均数,为5次试验中的方差.求.(本题所有答数精确到0.01.) 14.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,得到的实验数据经整理得到如下的折线图: 参考数据:,,. (1)由图可以看出,这种酶的活性指标值与温度具有较强的线性相关性,请用相关系数加以说明; (2)求关于的线性回归方程,并预测当温度为30℃时,这种酶的活性指标值.(计算结果精确到0.01) 题型05 独立性检验 15.某工厂生产某款电池,在满电状态下能够持续放电时间不低于10小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表: 产品 合格 不合格 合计 调试前 45 15 60 调试后 35 5 40 合计 80 20 100 (1)根据表中数据,依据显著性水平的独立性检验,能否认为参数调试与产品质量有关联; (2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析,记抽取的3件中合格的件数为,求的分布和期望; (3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为,求使事件“”的概率最大时的取值. 参考公式及数据:,其中. 0.05 0.025 0.01 0.005 0.001 3.841 5.024 6.635 7.879 10.828 16.某地同城闪送为了提高服务质量,进行了服务改进,并对服务进行评分.已知服务改进前某天共有1000个订单,其好评率为85%;服务改进后某天共有1500个订单,其中好评订单为1350个. (1)已知某100个好评订单评分的极差为2,数据如下(其中,是正整数) 服务评分 8.5 9 9.5 10 订单数量 32 13 11 4 求这100个好评订单的第40百分位数. (2)根据服务改进前后的这两天的订单数据完成下列列联表,并依据的独立性检验,判断订单获得好评与服务改进是否有关. 好评订单 非好评订单 合计 服务改进前 1000 服务改进后 1350 1500 合计 附:,. 17.某中学为探究“周末使用手机时长是否影响学业成绩”,随机调查100名学生,得到部分统计数据如下表: 学业成绩 使用手机小时 使用手机小时 良好 20 不良好 40 记事件“学业成绩良好且使用手机小时”,事件“学业成绩不良好且使用手机小时”,已知事件的频率是事件的频率的3倍. (1)求表中的,的值; (2)记使用手机小时的学生中学业成绩良好的概率为,求的估计值; (3)根据上述数据,请画出列联表,并判断是否有95%的把握认为“周末使用手机时长”与“学业成绩”有关?请说明理由. 参考数据:,其中. 0.10 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 题型06二项分布与超几何分布 18.2025年11月9日至11月21日,第15届全运会在广东,香港,澳门成功举办,某运动场馆内共有志愿者36名,其中男生12名,女生24名,这些志愿者中会说日语和会说韩语的人数统计如下: 男生志愿者 女生志愿者 会说日语 8 12 会说韩语 其中均为正整数,. (1)从这36名志愿者中随机抽取两名作为某活动主持人,求:抽取的两名志愿者中至少有一名会说日语的概率; (2)从这些志愿者中随机抽取一名去接待外宾,用表示事件“抽到的志愿者是男生”,用表示事件“抽到的志愿者会说韩语”;试给出所有符合条件的的值,使得事件与相互独立,并说明理由. 19.图为某平台向100名观众征集某电影的评分结果的频率分布直方图. (1)求的值; (2)估计这100名观众评分的平均数; (3)从评分在和的观众中按照分层抽样的方法随机抽取7人进行问卷调查,再从这7人中随机抽取3人进行访谈,求被抽到的3人中评分在的人数的分布、期望和方差. 20.已知一个不透明的盒中有个小球(小球除编号不同外其余均相同),这个小球的编号分别为1,2,3,…,(,).现进行如下摸球活动: (1)若,从盒中一次性摸取2个小球,求这2个小球编号不相邻的概率; (2)如果摸球前约定“固定重叠原则”:即随机摸取盒中个小球(,),记录编号后放回,再重复以上操作一次,记这两次操作中被重复摸取的小球数为. (ⅰ)若,,求概率; (ⅱ)求使概率取得最大值时m的值. 21.随着智能手表的普及,越来越多的学生使用其功能,为了了解学生使用智能手表功能的情况,现从某校随机抽取了300名学生,对使用 四种功能的情况统计如下: 功能种数 性别 0 种 1 种 2 种 3 种 4 种 男 18 52 42 28 10 女 12 58 48 22 10 在上述样本所有使用 3 种功能的人中,统计使用的人次如下: 功能 人次 37 40 35 38 假设不同学生使用智能手表功能的情况相互独立,用频率估计概率. (1)从该校随机选取一人,若已知该学生至少使用两种功能,估计该学生恰好使用三种功能的概率; (2)从该校使用三种功能的学生中,随机选出3人,记使用功能的人数为人,求的分布列和期望; (3)从该校男、女生中各随机选一人,记他们使用功能的种数分别为,试比较期望的估计值的大小 (结论不要求证明). 题型07正态分布 22.A校抽取66名高一年级学生测量身高,因某种原因原始数据遗失.已知该样本是按照分层随机抽样的方法抽取的,其中男生34名,身高平均数为173cm;女生32名,身高平均数为161cm.该66名学生身高的方差为60,其频率分布直方图如下: (1)求该66名学生中身高在(单位:cm)内的人数; (2)试用已知数据估计A校高一年级全体学生身高的平均数;(结果精确到0.1cm) (3)若一组数据落在(是平均数,是标准差)内的频率不小于92%,则称这组数据满足“常态”.试判断这66个身高数据是否满足“常态”,并说明理由. 23.某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布. (1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到); (2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到). 参考数据:,,,其中为标准正态分布函数. 24.某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生是否同意“三项体育活动中要有篮球”,学校随机调查了名学生,数据如表: 男生 女生 合计 同意 不同意 合计 (1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关? (2)现有足球、篮球、跳绳供学生选择.若甲、乙两学生从三项运动中随机选一种(他们的选择相互独立).若在甲学生选择足球的前提下,两人的选择不同的概率为.记事件为“甲学生选择足球”,事件为“甲、乙两名学生的选择不同”,判断事件是否独立,并说明理由. (3)经观察,该校学生每分钟跳绳个数,由往年经验,训练后每人每分钟跳绳个数比开始时增加个,该校有名学生,预估经过训练后每分钟跳个以上人数(结果四舍五入到整数). 参考公式和数据:,其中; 若,则,,. 题型08 概率中的决策问题 25.为响应国家促进消费的政策,某大型商场举办了“消费满减乐翻天”的优惠活动,顾客消费满800元(含800元)可抽奖一次,抽奖方案有两种(顾客只能选择其中的一种) 方案1:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,有放回地依次摸出3个球.每摸出1次红球,立减150元,若3次都摸到红球,则额外再减200元(即总共减650元); 方案2:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,不放回地依次摸出3个球.中奖规则为:若摸出3个红球,享受免单优惠;若摸出2个红球,则打5折;其余情况无优惠. (1)顾客A选择抽奖方案2,已知他第一次摸出红球,求他能够享受优惠的概率; (2)顾客B恰好消费了800元, ①若他选择抽奖方案1,求他实付金额的分布列和期望(结果精确到0.01); ②试从实付金额的期望值分析顾客B选择何种抽奖方案更合理. 26.由于X病毒正在传染蔓延,对人的身体健康造成危害,某校拟对学生被感染病毒的情况进行摸底调查,首先从两个班共100名学生中随机抽取20人,并对这20人进行逐个抽血化验,化验结果如下:.已知指数不超过8表示血液中不含病毒;指数超过8表示血液中含病毒且该生已感染病毒. (1)从已获取的20份血样中任取2份血样混合,求该混合血样含病毒的概率; (2)已知该校共有1020人,现在学校想从还未抽血化验的1000人中,把已感染病毒的学生全找出. 方案A:逐个抽血化验; 方案B:按40人分组,并把同组的40人血样分成两份,把其中的一份血样混合一起化验,若发现混合血液含病毒,再分别对该组的40人的另一份血样逐份化验; 方案C:将方案中的40人一组改为4人一组,其他步骤与方案相同. 如果用样本频率估计总体频率,且每次化验需要不少的费用.试通过计算回答:选用哪一种方案更合算?(可供参考数据:) 27.根据相关研究报告显示,预计年电商交易额突破亿元,网购用户规模接近亿.下表为某网店统计的近个月的利润(单位:万元),其中为月份代号. 月份 2024年12月 2025年1月 2025年2月 2025年3月 2025年4月 月份代号 1 2 3 4 5 利润/万元 8 6.3 5.1 3.2 2.4 (1)依据表中的统计数据,计算样本相关系数(精确到),判断是否可以用线性回归模型拟合与的关系;若可用,求出关于的经验回归方程,并估计年月该网店利润;若不可用,请说明理由; (2)该专营店为了吸引顾客,推出两种抽奖方案.方案一:一次性购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折,其余情况不打折.方案二:从装有个形状大小、完全相同的小球(其中红球个,白球个,黑球个)的抽奖盒中,一次性摸出个球,其中奖规则为:若摸出个红球和一个白球打六折,摸出个黑球打八折,其余情况不打折.某顾客计划在此网店购买元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠. 参考:,, 题型09 概率中的赛制问题 28.(2025·安徽蚌埠·模拟预测)某市举行中学生排球比赛,甲、乙两所学校代表队争夺比赛的冠军,比赛采用三局两胜制.根据以往对战的经历,甲、乙在一局比赛中获胜的概率分别为0.6,0.4,且每局比赛的结果相互独立. (1)求甲代表队夺冠的概率; (2)比赛开始前,工作人员采购了5个新球作为比赛用球放在袋子中,新球一经使用就变成“旧球”,“旧球”可继续使用.每局比赛前,裁判员从袋中的5个球中随机取出一个球用于比赛,且局中不换球.每局比赛结束后,将本局使用的球放回袋中,与袋中原有的球混合.记甲、乙两校代表队决出冠军后,袋中新球数量为X,求随机变量X的分布列与数学期望. 29.甲、乙、丙、丁四支球队进行单循环小组赛,比赛分三轮,每轮两场比赛,具体赛程如下表: 第一轮 甲VS乙 丙VS丁 第二轮 甲VS丙 乙VS丁 第三轮 甲VS丁 乙VS丙 规定:每场比赛获胜的球队记3分,输的球队记0分,平局两队各记1分,三轮比赛结束后以总分排名.总分相同的球队以抽签的方式确定排名,排名前两位的球队出线.假设甲、乙、丙三支球队水平相当,彼此间胜、负、平的概率均为,丁的水平较弱,面对其他任意一支球队胜、负、平的概率都分别为,,.每场比赛结果相互独立. (1)求丁的总分为7分的概率;判断此时丁能否出线,并说明理由; (2)若第一轮比赛结束,甲、乙、丙、丁四支球队积分分别为3,0,3,0,求丁以6分的成绩出线的概率. 30.某电视台举办的闯关节目共有五关,只有通过五关才能获得奖金,规定前三关若有失败即结束,后两关若有失败再给一次从失败的关开始继续向前闯的机会(后两关总共只有一次机会).已知某个选手前三关每关通过的概率都是,后两关每关通过的概率都是. (1)求该选手获得奖金的概率. (2)设该选手通过的关数为X,求随机变量x的分布列及数学期望. 31.在一场乒乓球赛中,甲、乙、丙、丁四人角逐冠军.现有两种赛制,一种是“单败淘汰制”,具体赛制:抽签决定两两对阵人员,胜者晋级“胜者区”,并进行最后的冠军决赛,胜者获得冠军,败者获得第二名;败者进入“败者区”,并进行比赛,决定第三、四名的归属.另一种是“双败淘汰制”,具体赛制:首先,四人通过抽签两两对阵,胜者进入“胜区”,败者进入“败区”;接下来,“胜区”的两人对阵,胜者进入最后决赛;“败区”的两人对阵,败者直接淘汰出局获得第四名;紧接着,“败区”的胜者和“胜区”的败者对阵,胜者晋级最后的决赛,败者获得第三名;最后,剩下的两人进行最后的冠军决赛,胜者获得冠军,败者获得第二名.已知甲对阵乙、丙、丁获胜的概率均为,且不同对阵的结果相互独立. (1)若,经抽签,第一轮由甲对阵乙,丙对阵丁,求甲在“双败淘汰制”下参与对阵的比赛场数的数学期望. (2)依据的取值情况,判断哪种赛制对甲夺冠有利?请说明理由. 题型10 马尔科夫链 32.(2025·四川凉山·三模)在国务院新闻办公室举行的“推动高质量发展”系列主题新闻发布会上,教育部相关负责人表示,要在关键环节方面,让“健康第一”落细落地.实施学生体质强健计划、心理健康促进行动等,保障中小学生每天综合体育活动时间不低于2小时,全面培育学生积极心理品质.要让孩子们动起来、互动起来,多见阳光,多呼吸新鲜空气. (1)为了解喜爱排球运动是否与性别有关,某统计部门在某地随机抽取了男性和女性各100名进行调查,得到列联表如下: 喜爱排球运动 不喜爱排球运动 合计 男性 60 40 100 女性 45 55 100 合计 105 95 200 依据小概率值的独立性检验,能否认为喜爱排球运动与性别有关? (2)某校排球队的甲、乙、丙、丁四名球员进行传球训练,甲等可能地随机传向另外3人中的1人,乙也等可能地随机传向另外3人中的1人,丙、丁均等可能地随机传向甲、乙中的1人,第1次由甲将球传出,如此不停地传下去,且假定每次传球都能被接到.记第n次传球之后球在丙或丁手上的概率为. (ⅰ)计算,,并求的通项公式; (ⅱ)记第n次传球之后球在乙手上的概率为,求的通项公式. 附: 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 33.(2025·广东湛江·一模)甲进行摸球跳格游戏.图上标有第1格,第2格,…,第25格,棋子开始在第1格.盒中有5个大小相同的小球,其中3个红球,2个白球(5个球除颜色外其他都相同).每次甲在盒中随机摸出两球,记下颜色后放回盒中,若两球颜色相同,棋子向前跳1格;若两球颜色不同,棋子向前跳2格,直到棋子跳到第24格或第25格时,游戏结束.记棋子跳到第n格的概率为. (1)甲在一次摸球中摸出红球的个数记为X,求X的分布列和期望; (2)证明:数列为等比数列. 34.(2025·福建宁德·三模)桌上有除颜色外其他没有任何区别的7个黑球和7个白球,现将3个黑球和4个白球装入不透明的袋中.第一次从袋中任取一个球,若取出的是黑球则放入一个白球,若取出的是白球则放入一个黑球,本次操作完成.第二次起每次取球、放球的规则和第一次相同. (1)求第2次取出黑球的概率; (2)记操作完成次后袋中黑球的个数为变量. (i)求的概率分布列及数学期望; (ii)求的数学期望. 35.(湖北省鄂南高级中学等三校联考2025届高三下学期4月模拟)甲、乙、丙三人进行玩具传递游戏,每次抛掷一枚质地均匀的正方体骰子决定传递方式,当玩具在甲手中时,若骰子点数大于4,甲将玩具传给乙;若骰子点数不大于4,甲保留玩具;当玩具在乙手中时,若骰子点数大于3,乙将玩具传给甲;若骰子点数不大于3,乙传给丙;当玩具在丙手中时,若骰子点数大于2,丙将玩具传给甲;若骰子点数不大于2,丙传给乙.初始时,玩具在甲手中. (1)设前三次抛掷骰子后,玩具在甲手中的次数为,求的分布列和数学期望; (2)抛掷次骰子后,玩具在乙手中的概率为,求的通项公式; (3)求证:. 学科网(北京)股份有限公司 学科网(北京)股份有限公司 学科网(北京)股份有限公司/ 学科网(北京)股份有限公司 $ 专题20概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题) 目录 01 析·考情精解 02 破·题型攻坚 考点 概率与统计解答题全归纳 真题动向 必备知识 知识点1根据频率分布直方图求平均数、中位数和众数 知识点2样本相关系数 知识点3回归分析 知识点4独立性检验 知识点5离散型随机变量分布列均值,方差 知识点6二项分布 知识点7超几何分布 知识点8正态分布 命题预测 题型01 统计估计与概率 题型02 统计图表与概率 题型03 残差与决定系数 题型04 回归分析 题型05 独立性检验 题型06二项分布与超几何分布 题型07正态分布 题型08 概率中的决策问题 题型09 概率中的赛制问题 题型10 马尔科夫链 命题轨迹透视 题型以中档解答题为主,分值为14分左右。整体难度中档,是得分的关键板块之一。 1. 高频基础考点:样本空间、随机事件的关系与运算,频率与概率的区别,互斥事件、对立事件的辨析及简单概率计算。 2. 核心基础考点:概率模型,古典概型,条件概率、全概率公式考查频率较高,还会涉及相互独立事件的概率计算。 试题多以校园活动、生活安全、保险、竞赛等实际场景为背景,考查学生将实际问题转化为概率模型的能力。。 考点频次总结 考点 2025年 2024年 2023年 概率统计 上海卷T17,14分 上海卷T19,14分 上海卷T19,14分 2026命题预测 预计在2026年高考中,解答题中利用排列、组合考查离散型随机变量的分布列、期望、方差、二项分布和正态分布等问题,有时亦考查回归方程、统计案例的相关内容,加强阅读理解与信息处理能力. 考点 概率与统计解答题全归纳 1.2024年巴黎奥运会,中国获得了男子米混合泳接力金牌.以下是历届奥运会男子米混合泳接力项目冠军成绩记录(单位:秒),数据按照升序排列. 206.78 207.46 207.95 209.34 209.35 210.68 213.73 214.84 216.93 216.93 (1)求这组数据的极差与中位数; (2)从这10个数据中任选3个,求恰有2个数据在211以上的概率; (3)若比赛成绩y关于年份x的回归方程为,年份x的平均数为2006,预测2028年冠军队的成绩(精确到0.01秒). 【解】(1)由题意,数据的最大值为,最小值为, 则极差为; 数据中间两数为与, 则中位数为. 故极差为,中位数为; (2)由题意,数据共个,以上数据共有个, 故设事件“恰有个数据在以上”, 则, 故恰有个数据在以上的概率为; (3)由题意,成绩的平均数 , 由直线过, 则, 故回归直线方程为. 当时,. 故预测年冠军队的成绩为秒. 2.为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示: 时间范围学业成绩 优秀 5 44 42 3 1 不优秀 134 147 137 40 27 (1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少? (2)估计该地区初中学生日均体育锻炼的时长(精确到0.1) (3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关? (附:其中,.) 【解】(1)由表可知锻炼时长不少于1小时的人数为占比, 则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为. (2)估计该地区初中生的日均体育锻炼时长约为 . 则估计该地区初中学生日均体育锻炼的时长为0.9小时. (3)由题列联表如下: 其他 合计 优秀 45 50 95 不优秀 177 308 485 合计 222 358 580 提出零假设:该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关. 其中. . 则零假设不成立, 即有的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关. 3.21世纪汽车博览会在上海2023年6月7日在上海举行,下表为某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示: 红色外观 蓝色外观 米色内饰 8 12 棕色内饰 2 3 (1)若小明从这些模型中随机拿一个模型,记事件A为小明取到的模型为红色外观,事件B取到模型有棕色内饰,求,并据此判断事件A和事件B是否独立; (2)为回馈客户,该公司举行了一个抽奖活动,并规定,在一次抽奖中,每人可以一次性抽取两个汽车模型。为了得到奖品类型,现作出如下假设: 假设1:每人抽取的两个模型会出现三种结果:①两个模型的外观和内饰均为同色;②两个模型的外观和内饰均为不同色;③两个模型的外观同色但内饰不同色,或内饰同色但外观不同色。 假设2:该抽奖设置三类奖,奖金金额分别为:一等奖600元,二等奖300元,三等奖150元。 假设3:每种抽取的结果都对应一类奖。出现某种结果的概率越小,奖金金额越高。 请判断以上三种结果分别对应几等奖。设中奖的奖金数是,写出的分布,并求的数学期望。 【解】(1)由给定的数表知,,,, 而,因此事件相互独立, 所以,事件相互独立. (2)设事件:外观和内饰均为同色,事件:外观内饰都异色,事件:仅外观或仅内饰同色, 依题意,;; ,则, 因此抽取的两个模型的外观和内饰均为不同色是一等奖;外观和内饰均为同色是二等奖; 外观同色但内饰不同色,或内饰同色但外观不同色是三等奖, 奖金额的可能值为:, 奖金额的分布列: 600 300 150 奖金额的期望(元). 知识点1根据频率分布直方图求平均数、中位数和众数 众数、中位数、平均数与频率分布直方图的关系 (1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替. (2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (3)众数:众数是最高小矩形底边的中点所对应的数据. 知识点2样本相关系数 (1)样本相关系数:设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示: 变量x … 变量y … 两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量, 其计算公式为, 其中,,,它们分别是这两组数据的算术平均数. (2)相关系数r与相关程度 (1)当时,称成对样本数据正相关; 当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系; (2)样本相关系数r的取值范围为[-1,1]; 当越接近1时,成对样本数据的线性相关程度越强; 当越接近0时,成对样本数据的线性相关程度越弱. 知识点3回归分析 (1)残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测称为残差; (2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号或身高数据,或体重的估计值等,这样作出的图形称为残差图; (3)残差图法:残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽带越窄,说明模型拟合精度越高; 一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析,借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策; (4)残差平方和:称为残差平方和,残差平方和越小,模型的拟合效果越好; (5)决定系数R2比较,,R2越大,表示残差平方和越小,模型的拟合效果越好,R2越小,残差平方和越大,即模型的拟合效果越差. 知识点4独立性检验 (1)计算公式:,其中. (2)临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值越大. (3)独立性检验:,通常称为零假设或原假设. 基于小概率值的检验规则是: 当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过; 当时,我们没有充分证据推断不成立,可以认为和独立. 这种利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验. (4)独立性检验中几个常用的小概率值和相应的临界值 0. 1 0. 05 0. 01 0. 005 0. 001 2. 706 3. 841 6. 635 7. 879 10. 828 (5)独立性检验的一般方法 ①根据题目信息,完善列联表; ②提出零假设:假设两个变量相互独立,并给出在问题中的解释。 ③根据列联表中的数据及计算公式求出的值; ④当时,我们就推断不成立,即两个变量不独立,该推断犯错误的概率不超过; 当时,我们没有充分证据推断不成立,可以认为两个变量相互独立。 知识点5离散型随机变量分布列均值,方差 (1) (2) 知识点6二项分布 1、定义 一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,) 于是得到的分布列 … … … … 由于表中第二行恰好是二项式展开式 各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率. 注意:①由二项分布的定义可以发现,两点分布是一种特殊的二项分布,即时的二项分布,所以二项分布可以看成是两点分布的一般形式. ②本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的. 3、二项分布的期望、方差 若,则,. 知识点7超几何分布 1、定义 在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布. 0 1 … … 2、超几何分布的适用范围件及本质 (1)适用范围: ①考察对象分两类; ②已知各类对象的个数; ③从中抽取若干个个体,考察某类个体个数的概率分布. (2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的. 知识点8正态分布 1、定义 随机变量落在区间的概率为,即由正态曲线,过点和点的两条轴的垂线,及轴所围成的平面图形的面积,如下图中阴影部分所示,就是落在区间的概率的近似值. 一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为. 其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计. 2、原则 若,则对于任意的实数,为下图中阴影部分的面积,对于固定的和而言,该面积随着的减小而变大.这说明越小,落在区间的概率越大,即集中在周围的概率越大 特别地,有;;. 由,知正态总体几乎总取值于区间之内.而在此区间以外取值的概率只有,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用中,通常认为服从于正态分布的随机变量只取之间的值,并简称之为原则. 题型01 统计估计与概率 1.小明有自觉体锻的习惯,某运动软件记录了其每天运动的时长(单位:min),小明从最近90天的记录中随机选取了10天的记录,具体数据如下: (1)求这组数据的第60百分位数: (2)运动时长不超过60min为不达标,估算从90天记录中随机抽取1天,该天运动时长不达标的概率: (3)从这10个数中随机删除2个数得到一组新的数据,求前后两组数据的极差相同的概率. 【解】(1)把10天的记录按照从小到大排列为:, 因为是整数,所以第60百分位数为第6个数与第7个数的平均数, 因为,这组数据的第60百分位数为71; (2)因为选取的样本中运动时长不达标的频率为, 所以估计该天运动时长不达标的概率为0.3; (3)因为前后两组数据的极差相同,所以随机删除的2个数为中的两个, 则概率 2.一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:kg),按从小到大的排序结果如下:62,74,75,84,84,85,85,85,86,87,89,92,93,94,97,99,101,104,107,117. (1)求该水果店过去20天苹果日销售量的平均数; (2)若以过去20天苹果的日销售量的第80百分位数作为下个月每日苹果的平均进货量,试确定下个月每日苹果的平均进货量; (3)若从过去20天中随机抽取3天,分别求“3天中每天的苹果销售量均超过90kg”与“3天中恰有2天的苹果销售量超过90kg”的概率. 【解】(1)该水果店过去20天苹果日销售量的平均数. (2)因为,所以第百分位数为,所以下个月每日苹果的平均进货量为. (3)20天中苹果销售量超过的有9天. 设“3天中每天的苹果销售量均超过”为事件,“3天中恰有2天的苹果销售量超过”为事件, 则,. 3.小闵同学某一天进行了10次100米短跑集训,其中上午进行了6次,下午进行了4次;如下是他上午集训6次的成绩(单位:s):、、、、、. (1)求这6次成绩的中位数; (2)参考这一天上午集训的数据,用经验概率估计概率,求该同学训练100米短跑3次至少有一次用时小于13s的概率; (3)若该同学下午4次的集训原始成绩记录丢失,但记得这4次的平均成绩是14.25s,方差是0.75,求他这一天10次训练成绩的平均值和方差. 【解】(1)将这6次成绩从小到大排列为: 12.9、13.3、13.7、13.9、14.9、15.3, 这6次成绩的中位数为:; (2)用时小于13s的概率为:,所以该同学训练100米短跑3次至少有一次用时小于13s的概率为: ; (3)上午六次的成绩平均数为: , 上午六次的方差为: , 设下午四次成绩平均数为 ,下午四次的方差为 , 总的平均数为: , 总的方差为: 题型02 统计图表与概率 4.为培养学生的社会责任感,某校开展了为期一学期的“温暖社区,青春奉献”志愿服务活动.活动结束后,学校从甲、乙两个班级中统计了部分学生的志愿服务时长(单位:小时),统计结果用茎叶图记录如图所示(十位数字作为“茎”,个位数字作为“叶”).已知甲组有9名学生的数据,乙组有10名学生的数据. (1)分别写出甲、乙两组学生服务时长的第70百分位数; (2)从甲、乙两组学生中各随机抽取1人,求抽取的2人中恰有1人的服务时长超过30小时的概率; (3)记甲组志愿服务时长的方差为;在甲组中增加一名学生得到“新甲组”,若的志愿服务时长为27,则记“新甲组”志愿服务时长的方差为;若的志愿服务时长为20,则记“新甲组”志愿服务时长的方差为;通过计算比较的大小(结果精确到0.1),并从数学角度解释这一现象. 【解】(1)因为,所以甲组学生服务时长的第70百分位数为; 因为,所以乙组学生服务时长的第70百分位数为; (2)因为甲组有9名学生,乙组有10名学生,根据分步乘法计数原理,从甲、乙两组学生中各随机抽取1人,有种选取方法, 又甲、乙两组学生中各有3人的服务时长超过30小时,所以抽取的2人中恰有1人的服务时长超过30小时有种选取方法, 记事件“抽取的2人中恰有1人的服务时长超过30小时”,则, 故从甲、乙两组学生中各随机抽取1人,抽取的2人中恰有1人的服务时长超过30小时的概率为; (3)对甲组: 甲组9名学生服务时长的平均数为, 甲组志愿服务时长的方差为, 对新甲组1:,所以. 对新甲组2:,所以. 所以. 数学解释:由于甲组均值为27,方差反映了数据的离散程度,当增加数据27(原样本均值),数据相对更集中,所以方差变小;当增加数据20,数据更加分散,方差变大. 5.某区2025年3月31日至4月13日的天气预报如图所示. (1)从3月31日至4月13日某天开始,连续统计三天,求这三天中至少有两天是阵雨的概率; (2)根据天气预报,该区4月14日的最低气温是9,温差是指一段时间内最高温度与最低温度之间的差值,例如3月31日的最高温度为17,最低温度为9,当天的温差为8记4月1日至4日这4天温差的方差为,4月11日至14日这4天温差的方差为,若,求4月14日天气预报的最高气温; (3)从3月31日至4月13日中随机抽取两天,用X表示一天温差不高于9的天数,求X的分布列及期望. 【解】(1)设“从3月31日至4月13日某天开始,连续统计三天,这三天中至少有两天是阵雨”为事件A,连续统计三天共有12个样本点,事件A共有4个样本点,所以 (2)4月1日至4日这4天温差分别为9、8、9、9, 因此,设4月14日的温差为x, 则4月11日至14日这4天温差分别为8、9°C、8、x, 因此, 解得,因此,4月11日这天最高气温是18. (3)从3月31日至4月13日,一天温差不超过9的共有11天,高于9的共有3天 X可能取值为0,1,2. ,, 随机变量X的分布列为: X 0 1 2 P 随机变量X的期望. 6.某校高三年级学生参加了一次时政知识竞赛,为了了解本次竞赛的成绩情况,从所有答卷中随机抽取份作为样本进行统计,将样本的成绩(满分分,成绩均为不低于分的整数)分成六段:、、、得到如图所示的频率分布直方图. (1)求实数的值;若年级准备选取分及以上的学生进入下一轮竞赛,已知该校高三年级有名学生,估计该校高三年级参加下一轮竞赛的人数; (2)王老师抽取了名参加竞赛的学生,他们的分数为:、、、、.已知这个分数的平均数,标准差,若剔除其中的和这个分数,求剩余个分数的平均数与方差. 【解】(1)在频率分布直方图中,所有矩形的面积之和为, 即,解得, 分及以上的学生所占的比例为, 故估计该校高三年级参加下一轮竞赛的人数为人. (2)不妨设,,根据题意可得, 故剩余个分数的平均数为, 因为原数据的方差为, 所以, 故剩余个分数的方差为. 7.王老师将全班40名学生的高一数学期中考试(满分100分)成绩分成5组,绘制成如图所示的频率分布直方图,现将记作第一组,、、、分别记作第二、三、四、五组.已知第一组、第二组的频率之和为0.3,第一组和第五组的频率相同. (1)估计此次考试成绩的平均值(同一组数据用该组数据的中点值代替); (2)王老师将测试成绩在和内的试卷进行分析,再从中选2人的试卷进行优秀答卷展示,求被选中进行优秀答卷展示的这2人的测试成绩至少1个在内的概率; (3)已知第二组考生成绩的平均数和方差分别为65和40,第四组考生成绩的平均数和方差分别为83和70,据此计算第二组和第四组所有学生成绩的方差. 【解】(1)由题意得,解得 所以平均数等于 (2)由题意,内有8人,内有2人, 所以被选中进行优秀答卷展示的这2人的测试成绩至少1个在内的概率为. (3)设第二组、第四组的平均数与方差分别为, 由题意,第二组、第四组分别有10人和8人, 所以成绩在第二组、第四组的平均数 成绩在第二组、第四组的方差 故估计成绩在第二组、第四组的方差是. 题型03 残差与决定系数 8.(2025·云南丽江·三模)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了次试验,得到数据如下: 零件的个数x(个) 2 3 4 5 加工的时间y(小时) 2.5 3 4 4.5 参考公式:用最小二乘法求线性回归方程系数公式, (1)求关于的线性回归方程; (2)求各样本的残差; (3)试预测加工个零件需要的时间. 【解】(1)    ,, ∴所求线性回归方程为. (2)计算每个对应的预测值: , , , ; 计算残差: 所以,各样本的残差依次为:. (3)当时,, ∴预测加工个零件需要小时. 9.某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如下: 并计算得,. (1)根据散点图求y关于x的经验回归方程(精确到0.01); (2)根据线性回归方程,绘制残差图,并分析线性回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差). 附:,. 【解】(1)由图得,, 则, 故, 则y关于x的经验回归方程为. (2)结合(1),计算得残差如下表: 行驶速度 60 70 80 90 100 110 油耗实际值 7.5 6.8 6.2 5.7 5.4 5 油耗估计值 7.35 6.85 6.35 5.85 5.35 4.85 残差 0.15 0.05 0.15 因此残差分布图如下: 因为, 所以经验回归方程的拟合效果较好. 10.某公司为了解年研发资金(单位:亿元)对年产值(单位:亿元)的影响,对公司近8年的年研发资金和年产值(,)的数据对比分析中,选用了两个回归模型,并利用最小二乘法求得相应的关于的经验回归方程: ①;②. (1)求的值; (2)已知①中的残差平方和,②中的残差平方和,请根据决定系数选择拟合效果更好的经验回归方程,并利用该经验回归方程预测年研发资金为20亿元时的年产值. 参考数据:,,,. 参考公式;刻画回归模型拟合效果的决定系数. 【解】(1)根据题意,,, 所以样本中心点为,代入经验回归方程, 得,解得. 所以的值为. (2)设经验回归方程①的决定系数为,由, 则, 设经验回归方程②的决定系数为,由, 则, 因为,所以经验回归方程②的拟合效果更好; 当时,, 所以年研发资金为20亿元时的年产值约为亿元. 11.(2025·湖南·三模)中国的非遗项目丰富多样,涵盖广泛,体现了中华民族的智慧和独特的文化魅力.春节期间某地为充分宣扬该地非遗物质文化,加大非遗传承人的技艺展示.该地市场开发与发展机构统计了非遗传承人的技艺展示量与市场消费收入的6组数据如下表: 技艺展示量x(单位:个) 21 23 24 27 29 32 市场消费收入y(单位:万元) 6 11 20 27 57 77 (1)若用线性回归理论进行统计分析,求市场消费收入y关于技艺展示量x的回归方程(精确到0.1); (2)若用非线性回归模型求得市场消费收入y关于技艺展示量x的回归方程为,且决定系数,与(1)中的线性回归模型相比,应用决定系数说明哪种模型的拟合效果更好. 附:一组数据,,…,,其回归直线的斜率和截距的最小二乘估计为,;决定系数 参考数据:,,, 线性回归模型的残差平方和为(其中,分别为非遗传承人的技艺展示量和市场消费收入,). 【解】(1)由题意,则, , ,, y关于x的线性回归方程为. (2)对于线性回归模型,,, 决定系数为, 因为,所以用非线性回归模型拟合效果更好. 题型04 回归分析 12.为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:克每立方米)与样本对原点的距离(单位:米)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中). 6 97.90 0.21 240 0.14 14.12 26.13 (1)利用相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型; (2)根据(1)的结果建立关于的回归方程,并估计样本对原点的距离米时,平均金属含量是多少? 【解】(1)因为的线性相关系数, 的线性相关系数, 因为, 所以更适宜作为平均金属含量关于样本对原点的距离的回归方程类型. (2)依题意,, 则,于是, 所以关于的回归方程为. 当时,金属含量的预报值为. 13.某科研活动共进行了5次试验,其数据如表所示: 特征量 第1次 第2次 第3次 第4次 第5次 (1)求成对数据的相关系数; (2)求特征量关于的回归方程,并据此估算特征量时的值; (3)设特征量作为随机变量服从正态分布,其中为5次试验中的平均数,为5次试验中的方差.求.(本题所有答数精确到0.01.) 【解】(1)由条件可知,,, , , , 所以; (2), , 所以, 当时,; (3),所以,, ,, 所以. 14.某生物小组为了研究温度对某种酶的活性的影响进行了一组实验,得到的实验数据经整理得到如下的折线图: 参考数据:,,. (1)由图可以看出,这种酶的活性指标值与温度具有较强的线性相关性,请用相关系数加以说明; (2)求关于的线性回归方程,并预测当温度为30℃时,这种酶的活性指标值.(计算结果精确到0.01) 【解】(1)由题可知, , , 则, 因为非常接近1,所以酶的活性与温度具有较强的线性相关性; (2)由题可知,, , , 所以关于的线性回归方程为, 当时,. 故预测当温度为30℃时,这种酶的活性指标值为13.22. 题型05 独立性检验 15.某工厂生产某款电池,在满电状态下能够持续放电时间不低于10小时的为合格品,工程师选择某台生产电池的机器进行参数调试,在调试前后,分别在其产品中随机抽取样本数据进行统计,制作了如下的列联表: 产品 合格 不合格 合计 调试前 45 15 60 调试后 35 5 40 合计 80 20 100 (1)根据表中数据,依据显著性水平的独立性检验,能否认为参数调试与产品质量有关联; (2)现从调试前的样本中按合格和不合格,用分层随机抽样法抽取8件产品重新做参数调试,再从这8件产品中随机抽取3件做对比分析,记抽取的3件中合格的件数为,求的分布和期望; (3)用样本分布的频率估计总体分布的概率,若现在随机抽取调试后的产品1000件,记其中合格的件数为,求使事件“”的概率最大时的取值. 参考公式及数据:,其中. 0.05 0.025 0.01 0.005 0.001 3.841 5.024 6.635 7.879 10.828 【解】(1)零假设为:假设依据的独立性检验,认为参数调试与产品质量无关联; 则 故依据的独立性检验,没有充分证据说明零假设不成立, 因此可认为成立,即认为参数调试与产品质量无关联; (2)依题意,用分层随机抽样法抽取的8件产品中, 合格产品有件,不合格产品有2件, 而从这8件产品中随机抽取3件,其中的合格品件数的可能值有1,2,3. 则 故的分布为: 1 2 3 则; (3)依题意,因随机抽取调试后的产品的合格率为, 故, 则, 由, 故由可解得, 因,故当时,单调递增; 由可解得, 即当时,单调递减. 故当事件“”的概率最大时,. 16.某地同城闪送为了提高服务质量,进行了服务改进,并对服务进行评分.已知服务改进前某天共有1000个订单,其好评率为85%;服务改进后某天共有1500个订单,其中好评订单为1350个. (1)已知某100个好评订单评分的极差为2,数据如下(其中,是正整数) 服务评分 8.5 9 9.5 10 订单数量 32 13 11 4 求这100个好评订单的第40百分位数. (2)根据服务改进前后的这两天的订单数据完成下列列联表,并依据的独立性检验,判断订单获得好评与服务改进是否有关. 好评订单 非好评订单 合计 服务改进前 1000 服务改进后 1350 1500 合计 附:,. 【解】(1)根据题意,这100个好评订单评分的极差为2, 因此,解得, 又有,解得, 因为, 所以这100个好评订单的第40百分位数为服务评分按从小到大的顺序排列后的第40个订单和第41个订单服务评分的平均数,即. 故这100个好评订单的第40百分位数为8.25. (2)根据题意,服务改进前好评订单的数量为,由此可得列联表如下: 好评订单 非好评订单 合计 服务改进前 850 150 1000 服务改进后 1350 150 1500 合计 2200 300 2500 零假设:订单获得好评与服务改进无关, , 所以根据小概率值的独立性检验,我们推断不成立, 即订单获得好评与服务改进有关,该推断犯错误的概率不超过0.05. 17.某中学为探究“周末使用手机时长是否影响学业成绩”,随机调查100名学生,得到部分统计数据如下表: 学业成绩 使用手机小时 使用手机小时 良好 20 不良好 40 记事件“学业成绩良好且使用手机小时”,事件“学业成绩不良好且使用手机小时”,已知事件的频率是事件的频率的3倍. (1)求表中的,的值; (2)记使用手机小时的学生中学业成绩良好的概率为,求的估计值; (3)根据上述数据,请画出列联表,并判断是否有95%的把握认为“周末使用手机时长”与“学业成绩”有关?请说明理由. 参考数据:,其中. 0.10 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【解】(1)由样本容量为,得,即. 又事件A的频率是事件B的频率的3倍,所以,即. 故,. (2)因为在样本中用手机小时的学生中学业成绩良好的频率为, 根据用样本频率估计总体频率,估计总体中用手机小时的学生中学业成绩良好的频率为, 再由频率估计概率,故用手机小时的学生中学业成绩良好的概率为. 故的估计值为. (3)设假设:周末使用手机时长与学业成绩相互独立.由题得列联表: 学业成绩 使用手机小时 使用手机小时 合计 良好 30 20 50 不良好 10 40 50 合计 40 60 100 可知,,,,,. 所以 故假设不成立,有95%的把握认为“周末使用手机时长”与“学业成绩”有关 题型06二项分布与超几何分布 18.2025年11月9日至11月21日,第15届全运会在广东,香港,澳门成功举办,某运动场馆内共有志愿者36名,其中男生12名,女生24名,这些志愿者中会说日语和会说韩语的人数统计如下: 男生志愿者 女生志愿者 会说日语 8 12 会说韩语 其中均为正整数,. (1)从这36名志愿者中随机抽取两名作为某活动主持人,求:抽取的两名志愿者中至少有一名会说日语的概率; (2)从这些志愿者中随机抽取一名去接待外宾,用表示事件“抽到的志愿者是男生”,用表示事件“抽到的志愿者会说韩语”;试给出所有符合条件的的值,使得事件与相互独立,并说明理由. 【解】(1)设事件“抽取的两名志愿者中至少有一名会说日语”为 ,则其对立事件为“两名志愿者都不会说日语”, 由题意,志愿者总人数为 36,其中会说日语的人数为 ,故不会说日语的人数为 , 于是 所以,抽取的两名志愿者中至少有一名会说日语的概率为 . (2)由题意, 事件 与 相互独立的充要条件是 即, 化简得 又 均为正整数,且 ,同时需满足 , 当 时,; 当 时,; 当 时,. 因此,符合条件的 的值为: 19.图为某平台向100名观众征集某电影的评分结果的频率分布直方图. (1)求的值; (2)估计这100名观众评分的平均数; (3)从评分在和的观众中按照分层抽样的方法随机抽取7人进行问卷调查,再从这7人中随机抽取3人进行访谈,求被抽到的3人中评分在的人数的分布、期望和方差. 【解】(1)由题意可得:, 解得:. (2)估计这100名观众评分的平均数为: . (3)评分在的观众人数为:, 评分在的观众人数为:. 按照分层抽样的方法,从评分在和的观众中抽取7人,则评分在的观众人数为3人,在的观众人数为4人. 所以的值可能为:0,1,2,3. 且,,,. 所以的分布列如下: 0 1 2 3 所以:. . 20.已知一个不透明的盒中有个小球(小球除编号不同外其余均相同),这个小球的编号分别为1,2,3,…,(,).现进行如下摸球活动: (1)若,从盒中一次性摸取2个小球,求这2个小球编号不相邻的概率; (2)如果摸球前约定“固定重叠原则”:即随机摸取盒中个小球(,),记录编号后放回,再重复以上操作一次,记这两次操作中被重复摸取的小球数为. (ⅰ)若,,求概率; (ⅱ)求使概率取得最大值时m的值. 【解】(1)编号相邻的可能有“1,2”、“2,3”、“3,4”、“4,5”四种可能,所以2个小球编号不相邻的概率为. (2)(ⅰ). (ⅱ)当时,整数m满足,其中为0和的较大者,即. “”所包含的事件总数为, ∴, 设, . 令. ①当时,(比较与k大小) ②当时,(比较与大小) ∴. 则当能被整除即时,在或处达到最大值: 当不能被整除即时,在(表示不超过x的最大整数). 当时,只能取,此时符合上述不能被整除的情况. 综上:使概率取得最大值时. 21.随着智能手表的普及,越来越多的学生使用其功能,为了了解学生使用智能手表功能的情况,现从某校随机抽取了300名学生,对使用 四种功能的情况统计如下: 功能种数 性别 0 种 1 种 2 种 3 种 4 种 男 18 52 42 28 10 女 12 58 48 22 10 在上述样本所有使用 3 种功能的人中,统计使用的人次如下: 功能 人次 37 40 35 38 假设不同学生使用智能手表功能的情况相互独立,用频率估计概率. (1)从该校随机选取一人,若已知该学生至少使用两种功能,估计该学生恰好使用三种功能的概率; (2)从该校使用三种功能的学生中,随机选出3人,记使用功能的人数为人,求的分布列和期望; (3)从该校男、女生中各随机选一人,记他们使用功能的种数分别为,试比较期望的估计值的大小 (结论不要求证明). 【解】(1)至少使用两种功能的学生数为,恰好使用三种功能的学生数为, 则已知该学生至少使用两种功能,估计该学生恰好使用三种功能的概率. (2)抽取的300名学生中恰好使用三种功能的学生数为,其中使用功能的学生数为40, 因此该校使用三种功能的学生中使用功能的概率大约为, 由已知的可能取值为,且, ,, ,. 的分布列为 0 1 2 3 . (3)由题意可得样本中男,女学生人数分别为:150和150, 则的可能取值为,,, ,,. 所以; 的可能取值为,,, ,,. 所以,故. 题型07正态分布 22.A校抽取66名高一年级学生测量身高,因某种原因原始数据遗失.已知该样本是按照分层随机抽样的方法抽取的,其中男生34名,身高平均数为173cm;女生32名,身高平均数为161cm.该66名学生身高的方差为60,其频率分布直方图如下: (1)求该66名学生中身高在(单位:cm)内的人数; (2)试用已知数据估计A校高一年级全体学生身高的平均数;(结果精确到0.1cm) (3)若一组数据落在(是平均数,是标准差)内的频率不小于92%,则称这组数据满足“常态”.试判断这66个身高数据是否满足“常态”,并说明理由. 【解】(1)由频率分布直方图可知,身高在的频率为, ,所以该66名学生中身高在(单位:cm)内的人数为人. (2)这66名高一年级学生身高平均数为, 因为该样本是按照分层随机抽样的方法抽取的,所以估计校高一年级全体学生身高的平均数为. (3)由(2)知,所以约为, 数据落在内的频率为, 因为,所以数据落在内的频率不小于, 所以这66个身高数据满足“常态”. 23.某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布. (1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到); (2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到). 参考数据:,,,其中为标准正态分布函数. 【解】(1)由题意,,的概率等于. 令,则. 因此, . 故净含量误差超过5g的概率约为. (2)可能的取值为0、1、2、3. 由(1)可知,任取一包糖果,净含量小于497.5g的概率为. 故服从二项分布,记, , 从而的分布为 0 1 2 3 0.595 0.337 0.064 0.004 因此. 24.某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生是否同意“三项体育活动中要有篮球”,学校随机调查了名学生,数据如表: 男生 女生 合计 同意 不同意 合计 (1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关? (2)现有足球、篮球、跳绳供学生选择.若甲、乙两学生从三项运动中随机选一种(他们的选择相互独立).若在甲学生选择足球的前提下,两人的选择不同的概率为.记事件为“甲学生选择足球”,事件为“甲、乙两名学生的选择不同”,判断事件是否独立,并说明理由. (3)经观察,该校学生每分钟跳绳个数,由往年经验,训练后每人每分钟跳绳个数比开始时增加个,该校有名学生,预估经过训练后每分钟跳个以上人数(结果四舍五入到整数). 参考公式和数据:,其中; 若,则,,. 【解】(1)提出零假设:学生对该问题的态度与性别无关. 根据列联表中的数据可求得,. 因为当成立时,的概率约为, 所以有的把握认为,学生对该观点的态度与性别有关. (2)事件、独立.理由如下: 因为,, 所以, 所以,即事件、独立. (3)记经过训练后每人每分钟跳绳个数为, 由已知,经过训练后每人每分钟跳绳个数, 即,因为, 所以, 所以(人). 所以经过训练后该校每分钟跳个以上人数约为. 题型08 概率中的决策问题 25.为响应国家促进消费的政策,某大型商场举办了“消费满减乐翻天”的优惠活动,顾客消费满800元(含800元)可抽奖一次,抽奖方案有两种(顾客只能选择其中的一种) 方案1:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,有放回地依次摸出3个球.每摸出1次红球,立减150元,若3次都摸到红球,则额外再减200元(即总共减650元); 方案2:从装有5个红球,3个蓝球(形状、大小完全相同)的抽奖盒中,不放回地依次摸出3个球.中奖规则为:若摸出3个红球,享受免单优惠;若摸出2个红球,则打5折;其余情况无优惠. (1)顾客A选择抽奖方案2,已知他第一次摸出红球,求他能够享受优惠的概率; (2)顾客B恰好消费了800元, ①若他选择抽奖方案1,求他实付金额的分布列和期望(结果精确到0.01); ②试从实付金额的期望值分析顾客B选择何种抽奖方案更合理. 【解】(1)设事件表示“第一次摸到红球”,事件表示“能够享受优惠”, 在第一次摸到红球后,抽奖盒中还剩4个红球和3个蓝球,共7个球, 享受优惠包含摸出2个红球和摸出3个红球这两种情况, 从7个球中不放回摸2个球,总情况有种, 摸出两个红球的情况有种, 摸出1红1蓝的情况有种, 所以; (2)①设顾客B选择抽奖方案1时实付金额为元, 从装有5个红球,3个蓝球的抽奖盒中摸一个球,摸到红球的概率为,摸到蓝球的概率为, 当摸出0个红球时,, 当摸出1个红球时,, 当摸出2个红球时,, 当摸出3个红球时,, 所以实付金额的分布列为 800 650 500 150 实付金额的期望为 ; ②设顾客B选择抽奖方案2时实付金额为元, 当摸出0个红球或1个红球时,, 当摸出2个红球时,, 当摸出3个红球时,, 所以, 所以,所以从实付金额的期望值分析,顾客B选择抽奖方案2更合理. 26.由于X病毒正在传染蔓延,对人的身体健康造成危害,某校拟对学生被感染病毒的情况进行摸底调查,首先从两个班共100名学生中随机抽取20人,并对这20人进行逐个抽血化验,化验结果如下:.已知指数不超过8表示血液中不含病毒;指数超过8表示血液中含病毒且该生已感染病毒. (1)从已获取的20份血样中任取2份血样混合,求该混合血样含病毒的概率; (2)已知该校共有1020人,现在学校想从还未抽血化验的1000人中,把已感染病毒的学生全找出. 方案A:逐个抽血化验; 方案B:按40人分组,并把同组的40人血样分成两份,把其中的一份血样混合一起化验,若发现混合血液含病毒,再分别对该组的40人的另一份血样逐份化验; 方案C:将方案中的40人一组改为4人一组,其他步骤与方案相同. 如果用样本频率估计总体频率,且每次化验需要不少的费用.试通过计算回答:选用哪一种方案更合算?(可供参考数据:) 【解】(1)分血样中,不含病毒的有份,含有病毒的有份, 混合血样含病毒的概率 (2)设每次化验的费用为,每个人感染病毒的概率为, 方案:费用为; 方案:每组化验次数的分布列为: , 故总费用为; 方案:每组化验次数的分布列为: , 故总费用为; 综上所述:选用方案更合算. 27.根据相关研究报告显示,预计年电商交易额突破亿元,网购用户规模接近亿.下表为某网店统计的近个月的利润(单位:万元),其中为月份代号. 月份 2024年12月 2025年1月 2025年2月 2025年3月 2025年4月 月份代号 1 2 3 4 5 利润/万元 8 6.3 5.1 3.2 2.4 (1)依据表中的统计数据,计算样本相关系数(精确到),判断是否可以用线性回归模型拟合与的关系;若可用,求出关于的经验回归方程,并估计年月该网店利润;若不可用,请说明理由; (2)该专营店为了吸引顾客,推出两种抽奖方案.方案一:一次性购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折,其余情况不打折.方案二:从装有个形状大小、完全相同的小球(其中红球个,白球个,黑球个)的抽奖盒中,一次性摸出个球,其中奖规则为:若摸出个红球和一个白球打六折,摸出个黑球打八折,其余情况不打折.某顾客计划在此网店购买元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠. 参考:,, 【解】(1)由题意可得,, , , , 所以,, 因为接近于,所以可以用线性回归模型拟合与的关系, ,则, 所以,关于的经验回归方程为, 将代入经验回归方程为, 故估计年月该网点利润估计知为万元. (2)设方案一的中奖次数为,由题意可知,实际付款金额为万元, 则的可能取值有、、、, 则,, ,, 故, 设方案二实际付款金额为万元,由题意可知,的可能取值有、、, ,,, 故 因为,所以,从实际付款金额的数学期望的角度分析,选择方案二更优惠. 题型09 概率中的赛制问题 28.(2025·安徽蚌埠·模拟预测)某市举行中学生排球比赛,甲、乙两所学校代表队争夺比赛的冠军,比赛采用三局两胜制.根据以往对战的经历,甲、乙在一局比赛中获胜的概率分别为0.6,0.4,且每局比赛的结果相互独立. (1)求甲代表队夺冠的概率; (2)比赛开始前,工作人员采购了5个新球作为比赛用球放在袋子中,新球一经使用就变成“旧球”,“旧球”可继续使用.每局比赛前,裁判员从袋中的5个球中随机取出一个球用于比赛,且局中不换球.每局比赛结束后,将本局使用的球放回袋中,与袋中原有的球混合.记甲、乙两校代表队决出冠军后,袋中新球数量为X,求随机变量X的分布列与数学期望. 【解】(1)记甲代表队夺冠为事件A,甲代表队以比分夺冠为事件,比分夺冠为事件, , , , 所以甲代表队夺冠的概率为0.648. (2)比赛2局结束的概率为, 比赛3局结束的概率为, 随机变量X的可能取值为2,3,4, , , , 故随机变量X的分布列为 X 2 3 4 P 0.2304 0.6464 0.1232 . 29.甲、乙、丙、丁四支球队进行单循环小组赛,比赛分三轮,每轮两场比赛,具体赛程如下表: 第一轮 甲VS乙 丙VS丁 第二轮 甲VS丙 乙VS丁 第三轮 甲VS丁 乙VS丙 规定:每场比赛获胜的球队记3分,输的球队记0分,平局两队各记1分,三轮比赛结束后以总分排名.总分相同的球队以抽签的方式确定排名,排名前两位的球队出线.假设甲、乙、丙三支球队水平相当,彼此间胜、负、平的概率均为,丁的水平较弱,面对其他任意一支球队胜、负、平的概率都分别为,,.每场比赛结果相互独立. (1)求丁的总分为7分的概率;判断此时丁能否出线,并说明理由; (2)若第一轮比赛结束,甲、乙、丙、丁四支球队积分分别为3,0,3,0,求丁以6分的成绩出线的概率. 【解】(1)记第轮比赛丁胜、平、负的事件分别为,每场比赛结果相互独立. 丁总分为7分,则丁三场比赛两胜一平,记丁三轮比赛两胜一平的事件为, 丁总分7分一定出线. 理由如下:丁三场比赛中赢两场,这两场丁的对手比分最多6分. 小组赛两队出线,所以丁一定出线. (2)第一轮比赛,甲胜乙,丙胜丁,又丁总分为6分,则丁对战甲、乙都获胜,此时,乙队总分最多3分,少于丁队总分, ①第二轮中若甲负于丙或平丙时,甲总分最多4分,少于丁队总分,此时甲、乙两队少于丁队总分,丁一定出线,其相应的概率, ②第二轮中若甲胜丙、第三轮中丙平乙或负于乙时,丙总分最多4分,此时丙、乙两队少于丁队总分,丁一定出线,其相应的概率, ③第二轮中若甲胜丙时、第三轮中丙胜乙时,甲、丁、丙队总分均为6分,此时由抽签确定出线,三队中有两队出线,每队出线概率为, 丁队出线的概率, 综上,丁以6分出线的概率为. 30.某电视台举办的闯关节目共有五关,只有通过五关才能获得奖金,规定前三关若有失败即结束,后两关若有失败再给一次从失败的关开始继续向前闯的机会(后两关总共只有一次机会).已知某个选手前三关每关通过的概率都是,后两关每关通过的概率都是. (1)求该选手获得奖金的概率. (2)设该选手通过的关数为X,求随机变量x的分布列及数学期望. 【解】(1)设事件为“第关通过”,事件为“获得奖金” 所以 (2)可取的值为0,1,2,3,4,5 , , 所以 所以的分布列为: 所以 31.在一场乒乓球赛中,甲、乙、丙、丁四人角逐冠军.现有两种赛制,一种是“单败淘汰制”,具体赛制:抽签决定两两对阵人员,胜者晋级“胜者区”,并进行最后的冠军决赛,胜者获得冠军,败者获得第二名;败者进入“败者区”,并进行比赛,决定第三、四名的归属.另一种是“双败淘汰制”,具体赛制:首先,四人通过抽签两两对阵,胜者进入“胜区”,败者进入“败区”;接下来,“胜区”的两人对阵,胜者进入最后决赛;“败区”的两人对阵,败者直接淘汰出局获得第四名;紧接着,“败区”的胜者和“胜区”的败者对阵,胜者晋级最后的决赛,败者获得第三名;最后,剩下的两人进行最后的冠军决赛,胜者获得冠军,败者获得第二名.已知甲对阵乙、丙、丁获胜的概率均为,且不同对阵的结果相互独立. (1)若,经抽签,第一轮由甲对阵乙,丙对阵丁,求甲在“双败淘汰制”下参与对阵的比赛场数的数学期望. (2)依据的取值情况,判断哪种赛制对甲夺冠有利?请说明理由. 【解】(1)记甲在“双败淘汰制”下参与对阵的比赛场数为随机变量, 则的所有可能取值为2,3,4. :甲连负两局得第四名,. :甲连胜两局进决赛,或负胜负得第三名,或胜负负得第三名, . :甲以前三局依次为胜负胜或负胜胜的赛果进入决赛, . 故的分布列为 2 3 4 0.16 0.552 0.288 . (2)在“双败淘汰制”下甲夺冠的概率, 在“单败淘汰制”下甲夺冠的概率, ,, 则当时,,“双败淘汰制”对甲夺冠有利; 当时,,“单败淘汰制”对甲夺冠有利; 当时,,两种赛制下甲夺冠的概率一样. 题型10 马尔科夫链 32.(2025·四川凉山·三模)在国务院新闻办公室举行的“推动高质量发展”系列主题新闻发布会上,教育部相关负责人表示,要在关键环节方面,让“健康第一”落细落地.实施学生体质强健计划、心理健康促进行动等,保障中小学生每天综合体育活动时间不低于2小时,全面培育学生积极心理品质.要让孩子们动起来、互动起来,多见阳光,多呼吸新鲜空气. (1)为了解喜爱排球运动是否与性别有关,某统计部门在某地随机抽取了男性和女性各100名进行调查,得到列联表如下: 喜爱排球运动 不喜爱排球运动 合计 男性 60 40 100 女性 45 55 100 合计 105 95 200 依据小概率值的独立性检验,能否认为喜爱排球运动与性别有关? (2)某校排球队的甲、乙、丙、丁四名球员进行传球训练,甲等可能地随机传向另外3人中的1人,乙也等可能地随机传向另外3人中的1人,丙、丁均等可能地随机传向甲、乙中的1人,第1次由甲将球传出,如此不停地传下去,且假定每次传球都能被接到.记第n次传球之后球在丙或丁手上的概率为. (ⅰ)计算,,并求的通项公式; (ⅱ)记第n次传球之后球在乙手上的概率为,求的通项公式. 附: 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【解】(1)假设:喜爱篮球运动与性别独立,即喜爱篮球运动与性别无关. 根据列联表数据,经计算得 , 依据小概率值的独立性检验,我们没有充分证据推断不成立, 可以认为喜爱篮球运动与性别独立,即喜爱排球运动与性别无关. (2)(ⅰ)由题意,, 且时, 所以 又,所以是以为首项,为公比的等比数列, 所以,即 (ⅱ)由题意,, 且时, 所以 又, 所以是以为首项,为公比的等比数列. 则, 即 33.(2025·广东湛江·一模)甲进行摸球跳格游戏.图上标有第1格,第2格,…,第25格,棋子开始在第1格.盒中有5个大小相同的小球,其中3个红球,2个白球(5个球除颜色外其他都相同).每次甲在盒中随机摸出两球,记下颜色后放回盒中,若两球颜色相同,棋子向前跳1格;若两球颜色不同,棋子向前跳2格,直到棋子跳到第24格或第25格时,游戏结束.记棋子跳到第n格的概率为. (1)甲在一次摸球中摸出红球的个数记为X,求X的分布列和期望; (2)证明:数列为等比数列. 【解】(1)根据题意可知,X的所有可能取值为0,1,2; 则,,; 可得X的分布列如下: 0 1 2 期望值为. (2)依题意,当时,棋子跳到第格有两种可能: 第一种,棋子先跳到第格,再摸出两球颜色不同; 第二种,棋子先跳到第格,再摸出两球颜色相同; 又可知摸出两球颜色不同,即跳两格的概率为, 摸出两球颜色相同,即跳一格的概率为; 因此可得; 所以, 因此可得, 即数列是公比为的等比数列. 34.(2025·福建宁德·三模)桌上有除颜色外其他没有任何区别的7个黑球和7个白球,现将3个黑球和4个白球装入不透明的袋中.第一次从袋中任取一个球,若取出的是黑球则放入一个白球,若取出的是白球则放入一个黑球,本次操作完成.第二次起每次取球、放球的规则和第一次相同. (1)求第2次取出黑球的概率; (2)记操作完成次后袋中黑球的个数为变量. (i)求的概率分布列及数学期望; (ii)求的数学期望. 【解】(1)记第次取出的球是黑球为事件, 则, 根据全概率公式得 . 所以第2次取出黑球的概率为. (2)(i)由题知得的可能取值为:1,3,5, 则; 故的分布列为: 1 3 5 所以. (ii)设第次完成操作后袋中黑球数为 则 也可以按如下方法得出递推关系: 即,由此得, 又因为, 所以构成以为首项,为公比的等比数列, 所以,即 35.(湖北省鄂南高级中学等三校联考2025届高三下学期4月模拟)甲、乙、丙三人进行玩具传递游戏,每次抛掷一枚质地均匀的正方体骰子决定传递方式,当玩具在甲手中时,若骰子点数大于4,甲将玩具传给乙;若骰子点数不大于4,甲保留玩具;当玩具在乙手中时,若骰子点数大于3,乙将玩具传给甲;若骰子点数不大于3,乙传给丙;当玩具在丙手中时,若骰子点数大于2,丙将玩具传给甲;若骰子点数不大于2,丙传给乙.初始时,玩具在甲手中. (1)设前三次抛掷骰子后,玩具在甲手中的次数为,求的分布列和数学期望; (2)抛掷次骰子后,玩具在乙手中的概率为,求的通项公式; (3)求证:. 【解】(1)由题意知,. , , ; ,      所以随机变量的分布列为 0 1 2 3 随机变量的数学期望为 (2)由于投掷次骰子后球不在乙手中的概率为,此时无论球在甲手中还是球在丙手中,均有的概率传给乙, 故有,        变形为. 又,所以数列是首项为,公比为的等比数列. 所以 所以数列的通项公式; (3)由(2)可得; 所以 学科网(北京)股份有限公司 学科网(北京)股份有限公司 学科网(北京)股份有限公司/ 学科网(北京)股份有限公司 $

资源预览图

专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(复习讲义)(上海专用)2026年高考数学二轮复习讲练测
1
专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(复习讲义)(上海专用)2026年高考数学二轮复习讲练测
2
专题20 概率与统计解答题全归纳(含决策性、赛制及马尔科夫链等问题)(复习讲义)(上海专用)2026年高考数学二轮复习讲练测
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。