内容正文:
大题06 概率与统计
根据近几年的高考情况,概率与统计是高考解答题必考解答题,考查的内容主要是以统计案例及统计数据分析,随机变量与分布列,正态分布,对立性检验,回归方程分析这几种形式出现。难点在于容易与其他知识点相结合,容易和数列,导数相结合,另外就是条件概率是学生的一个易错点,是很多学生的只是盲区,所以接下来的复习中,条件概率与全概率公式应该要重视。预计2025年高考中将会以分布列及条件概率形式出现,应该予以重视。
题型一 统计案例与统计数据分析
(24-25高三下·重庆南岸·阶段练习)重庆市举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.重庆旅游局承办了志愿者选拔的面试工作.随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求的值,并估计这100名候选者面试成绩的平均数;
(2)若从以上各组中用分层随机抽样的方法选取20人,担任了本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和50,请据此估计这次第二组和第四组所有面试者的面试成绩的平均数和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体的样本平均数为.则总体样本方差.
【思路分析】
(1)由各组的频率和为1列方程可求出,再根据平均数的定义可求出面试成绩的平均数;
(2)先根据频率分布直方图求出第二组、第四组的频率之比,然后再求出这两组的平均数,再利用所给的公式求出第二组和第四组所有面试者的面试成绩的方差.
【规范答题】(1)由图得,解之可得;
根据题意知,
(2)设第二组、第四组所有面试者的面试成绩的平均数、方差分别为,,,,且两组的频率之比为,
则第二组和第四组所有面试者的面试成绩的平均数为,
第二组和第四组所有面试者的面试成绩的方差为
,
,
则第二组和第四组所有面试者的面试成绩的方差为.
设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体的样本平均数为.则总体样本方差
1.(24-25高三上·上海·阶段练习)某学校为提高学生对《红楼梦》的了解,举办了"我知红楼"知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:,并作出如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本数据的第62百分位数所在区间的组中值;
(3)若落在中的样本数据平均数是52,方差是6;落在中的样本数据平均数是64,方差是3,求这两组数据的总平均数和方差.
【答案】(1)0.030(2)79分(3),
【分析】(1)根据每组小矩形的面积之和为1列式即可求解;(2)由频率分布直方图求第百分位数的计算公式即可求解;(3)利用分层抽样的平均数和方差的计算公式即可求解.
【详解】(1)由,
解得;
(2)因为,
,
所以样本数据的第62百分位数在内,
可得,所以样本数据的第62百分位数为分;
(3)样本数据落在的个数为,
落在的个数为,,
总方差.
题型二 随机变量及分布列
1 (24-25高三下·河北·开学考试)春节期间有一过关赢奖励娱乐活动,参与者需先后进行四个关卡挑战,每个关卡都必须参与.前三个关卡至少挑战成功两个才能够进入第四关,否则直接淘汰,若四关都通过,则可以赢得奖励.参与者甲前面三个关卡每个挑战成功的概率均为,第四关挑战成功的概率为,且各关挑战成功与否相互独立.
(1)求参与者甲未能参与第四关的概率;
(2)记参与者甲本次挑战成功的关卡数为X,求X的分布列以及数学期望.
【思路分析】(1)根据题意,甲未能参与第四关包含两种情况,前三个关卡挑战成功0个和1个,利用二项分布,相互独立事件概率乘法公式求解;
(2)的可能取值为0,1,2,3,4,分别求出相应的概率,由此能求出X的分布列和数学期望.
【规范答题】(1)参与者甲未能参与第四关的概率为:
(2)记参与者甲本次挑战成功的关卡数为X,则X的可能取值为0,1,2,3,4,
,
,
,
,
,
的分布列为:
X
0
1
2
3
4
P
数学期望为
2(24-25高三下·北京·开学考试)同学们,你们知道排球比赛的规则和积分制吗?其规则是:每局25分,达到24分时,比赛双方必须相差2分,才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3∶0或3∶1取胜的球队积3分,负队积0分;以3∶2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1
2
3
4
5
6
甲
25
21
27
27
23
25
乙
18
25
25
25
25
17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分X的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,请比较两队积分相等的概率与的大小(结论不要求证明).
【思路分析】(1)根据题意利用频率估计概率即可;
(2)随机变量的所有可能取值为0,1,2,3,再由独立事件的概率公式求得每个的取值所对应的概率即可得分布列,然后由数学期望的计算公式,得解;
(3)设第场甲、乙两队积分分别为,,则,,2,由两队积分相等,可推出,再分四种情况,并结合独立事件的概率公式,即可得解.
【规范答题】(1)由表可知:6场比赛甲赢了4场,则甲每局获胜的频率为,
用频率估计概率,所以甲队每局获胜的概率为.
(2)随机变量的所有可能取值为0,1,2,3,
可得:,,
,,
所以的分布列为
0
1
2
3
所以数学期望.
(3)记“甲、乙比赛两场后,两队积分相等”为事件,
设第场甲、乙两队积分分别为,,则,,2,
因两队积分相等,所以,即,则,
而,
,
,
所以
,
因为,所以两队积分相等的概率小于.
二项分布的适用范围及本质
(1)适用范围:
①各次试验中的事件是相互独立的;
②每次试验只有两种结果:事件要么发生,要么不发生;
③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
超几何分布的适用范围件及本质
(1)适用范围:
①考察对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
【方法技巧与总结】
超几何分布和二项分布的区别
(1)超几何分布需要知道总体的容量,而二项分布不需要;
(2)超几何分布是“不放回”抽取,在每次试验中某一事件发生的概率是不相同的;
而二项分布是“有放回”抽取(独立重复),在每次试验中某一事件发生的概率是相同的.
1(2025·山东烟台·一模)为加强中小学科学教育,某市科协,市教育局拟于2025年4月联合举办第四届全市中小学机器人挑战赛.比赛共设置穿越障碍、搬运物品两个项目.每支参赛队先挑战穿越障碍项目,挑战成功后,方可挑战且必须挑战搬运物品项目.每支参赛队每个项目至多挑战两次,若第一次挑战成功,则获得奖金2000元,该项目不再挑战:若第一次挑战失败,则必须第二次挑战该项目,若第二次挑战成功,则获得奖金1000元,否则,不获得奖金.假设甲参赛队在每个项目中,第一次挑战成功的概率为,第一次挑战失败但第二次挑战该项目成功的概率为;两个项目是否挑战成功相互独立.
(1)设事件“甲参赛队两个项目均挑战成功”,求;
(2)设比赛结束时,甲参赛队获得奖金数为随机变量,求的分布列;
(3)假设本届比赛共有36支参赛队,且根据往届比赛成绩,甲参赛队获得奖金数近似为各参赛队获得奖金数的平均水平.某赞助商计划提供全部奖金,试估计其需提供的奖金总额.
【答案】(1)(2)答案见解析;(3)元
【详解】(1)每个项目挑战成功的概率 ,则 .
(2)甲参赛队获得奖金数为随机变量的所有可能取值为4000,3000,2000,1000,0.
;;
;
;.
∴甲获得奖金数的分布列为:
4000
3000
2000
1000
0
(3)由(2)得出甲参赛队获得奖金数数学期望
元,
因为假设本届比赛共有36支参赛队,估计其需提供的奖金总额为元
2(24-25高三上·江西·阶段练习)随着教育部的“双减政策”落地,为了丰富高中基础年级学生的课余生活,2025年元旦期间,某校师生举行一场惊心动魄的足球比赛;由教师代表队、高一学生代表队和高二学生代表队组成、得分规则为:球队胜一场积3分,平一场积1分,负一场积0分.由教师代表队与高一学生代表队和高二学生代表队的两场比赛.根据前期比赛成绩,教师代表队与高一学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为;由教师代表队与高二学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为,且两场比赛结果相互独立.
(1)求教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分的概率;
(2)用表示教师代表队两场比赛获得积分之和,求的分布列与期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)将事件“教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分”分为“教师胜高二且教师平高一”、“教师胜高二且教师负高一”、“教师平高二且教师负高一”,进而可得;
(2)由题意的所有可能取值为0,1,2,3,4,6,先求随机事件对应的概率进而可得其分布列与期望.
【详解】(1)设事件“教师代表队与高二学生代表队比赛获得积分为3分”,
事件“教师代表队与高二学生代表队比赛获得积分为1分”,
事件“教师代表队与高二学生代表队比赛获得积分为0分”,
事件“教师代表队与高一学生代表队比赛获得积分为3分”,
事件“教师代表队与高一学生代表队比赛获得积分为1分”,
事件“教师代表队与高一学生代表队比赛获得积分为0分”,
事件“教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分”,
,,,
则,
教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分的概率为.
(2)由题意可知的所有可能取值为0,1,2,3,4,6.
,,
,,
,.
的分布列为
0
1
2
3
4
6
.
题型三 随机变量与正态分布
1(2025·吉林延边·一模)某生物研究小组准备探究某地区棉花长绒分布规律,据统计该地区棉花有,个品种,且这两个品种的种植数量大致相等,记种棉花和种棉花的绒长(单位:)分别为随机变量,,其中服从正态分布,服从正态分布.
(1)从该地区的棉花中随机采摘一朵,求这朵棉花的绒长在区间的概率;
(2)记该地区棉花的绒长为随机变量,若用正态分布来近似描述的分布,请你根据(1)中的结果,求参数和的值(精确到0.1);
(3)在(2)的条件下,从该地区的棉花中随机采摘3朵,记这3朵棉花中绒长在区间的个数为,求的分布列及数学期望(分布列写出计算表达式即可).参考数据:若,则,,.
【思路分析】(1)根据正态分布的对称性计算即可;
(2)首先求得,再根据(1)得到方程组,解出即可;
(3)利用二项分布的模型即可得到其分布列,再计算其期望即可.
【规范答题】(1)记这朵棉花的线长为.
因为A种棉花和种棉花的个体数量大致相等,所以这朵棉花是A种还是种的可能性是相等的.
所以.
(2)由于两种棉花的个体数量相等,,的方差也相等,
根据正态曲线的对称性,可知,由(1)可知得.
(3)设棉花的绒长为,则,
由题有,所以,因此的分布列为
0
1
2
3
.
2(24-25高三上·江西南昌·阶段练习)近年来,随着电脑、智能手机的迅速普及,我国在线教育行业出现了较大的发展.某在线教育平台为了解利用该平台学习的高一学生化学学习效果,举行了一次化学测试,并从中随机抽查了200名学生的化学成绩,将他们的成绩分成以下6组:,,,,,统计结果如下面的频数分布表所示.
组别
频数
20
30
40
60
30
20
(1)现利用分层抽样的方法从前3组中抽取9人,再从这9人中随机抽取4人调查其成绩不理想的原因,试求这4人中至少有2人来自前2组的概率.
(2)高一学生的这次化学成绩(单位:分)近似地服从正态分布,其中近似为样本平均数,近似为样本的标准差,并已求得.且这次测试恰有2万名学生参加.
(i)试估计这些学生这次化学成绩在区间内的概率(同一组中的数据用该组区间的中点值为代表);
(ii)为了提升学生的成绩,该平台决定免费赠送给在平台学习的学生若干学习视频,具体赠送方案如下:
方案1:每人均赠送25小时学习视频;
方案2:这次测试中化学成绩不高于56.19分的学生赠送40小时的学习视频,化学成绩在内的学生赠送30小时的学习视频,化学成绩高于84.81分的学生赠送10小时的学习视频.问:哪种方案该平台赠送的学习视频总时长更多?请根据数据计算说明.
参考数据:则,.
【思路分析】(1)由古典概率公式结合对立事件的概率求解即可;
(2)(i)由平均数的计算公式求出,再由原则求解即可;(ii)对于方案2,设每位学生所获赠学习视频的小时数为X,求出X的所有可能取值及其概率,再求出,与方案一比较即可得出答案..
【规范答题】(1)因为抽样比,
所以抽取人,抽取人,
抽取人.
设事件:这4人中至少有2人来自前2组,
.
(2),
所以,,,.
所以
.
对于方案2:设每位学生所获增学习视频小时数为,则.
,
,
.
,
所以方案2该平台赠送的学习视频总时长更多.
(24-25高三下·河南·阶段练习)在某市举行的一次市质检考试中,为了调查考试试题的有效性以及试卷的区分度,该市教研室随机抽取了参加本次质检考试的100名学生的数学考试成绩,并将其统计如下表所示.
成绩X
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
人数Y
6
24
42
20
8
(1)已知本次质检中的数学测试成绩,其中μ近似为样本的平均数,近似为样本方差,若该市有5万考生,试估计数学成绩介于90~120分的人数;(以各组的区间的中点值代表该组的取值)
(2)现按分层抽样的方法从成绩在[75,85)以及[115,125]之间的学生中随机抽取7人,再从这7人中随机抽取3人进行试卷分析,记被抽取的3人中成绩在[75,85)之间的人数为X,求X的分布列以及期望E(X).
参考数据:若,则,,.
【答案】(1)
(2)X的分布列见解析;
【分析】(1)先求出样本数的平均数和方差,再结合正态分布求出数学成绩介于90~120分的人数;
(2)求出X的所有可能取值,分别求得概率,列出分布列求出期望.
【详解】(1)根据统计图表中的数据,结合平均数的计算方法,可得本次质检中数学测试成绩样本的平均数为.
,
则,所以,故所求人数为.
(2)依题意成绩在之间的抽取3人,成绩在之间的抽取4人,故X的可能取值为0,1,2,3.故,,,.
故X的分布列为
0
1
2
3
故E.
2(2022·重庆·模拟预测)在“十三五”期间,我国的扶贫工作进入了“精准扶贫”阶段,到2020年底,全国830个贫困县全部脱贫摘帽,最后4335万贫困人口全部脱贫,这是我国脱贫攻坚史上的一大壮举.重庆市奉节县作为国家贫困县之一,于2019年4月顺利脱贫摘帽,因地制宜发展特色产业,是奉节脱贫攻坚的重要抓手.奉节县规划发展了以高山烟叶、药材、反季节蔬菜;中山油橄榄、养殖;低山脐橙等为主的产业格局,各类特色农产品已经成为了当地村民的摇钱树.尤其是奉节脐橙,因“果皮中厚、脆而易剥,肉质细嫩化渣、无核少络,酸甜适度,汁多爽口,余味清香”而闻名.为了防止返贫,巩固脱贫攻坚成果,各职能部门对脐橙种植、销售、运输、改良等各方面给予大力支持.奉节县种植的某品种脐橙果实按果径X(单位:mm)的大小分级,其中为一级果,为特级果,一级果与特级果统称为优品.现采摘了一大批此品种脐橙果实,从中随机抽取1000个测量果径,得到频率分布直方图如下:
(1)由频率分布直方图可认为,该品种脐橙果实的果径X服从正态分布,其中μ近似为样本平均数,近似为样本标准差s,已知样本的方差的近似值为100.若从这批脐橙果实中任取一个,求取到的果实为优品的概率(同一组中的数据用该组区间的中点值代表)
(2)这批采摘的脐橙按2个特级果和n(,且)个一级果为一箱的规格进行包装,再经过质检方可进入市场.质检员质检时从每箱中随机取出两个果实进行检验,若取到的两个果实等级相同,则该箱脐橙记为“同”,否则该箱脐橙记为“异”.
①试用含n的代数式表示抽检的某箱脐橙被记为“异”的概率p;
②设抽检的5箱脐橙中恰有3箱被记为“异”的概率为,求函数的最大值,及取最大值时n的值.
参考数据:若随机变量X服从正态分布,则,,.
【答案】(1)
(2)① ;②;
【分析】(1)先求出平均数,然后利用正态分布的对称性和原则进行求解;
(2)①先表达出抽检的某箱脐橙被记为“同”的概率,再求出相应的概率;②表达出,利用导函数求出时,取得最大值,进而求出此时n的值.
【详解】(1)由分布图:
则,在内为优品
则
(2)①
②,且,
因为,且,由对勾函数知识可知:在上单调递减,当时,,所以,
因为,且
当时,,当时,,当时,,
∴最大值在时取得,可求得或,因为,所以,
求得
题型四 独立性检验
1
1(2025·山东聊城·一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
【思路分析】(1)由频率分布直方图中,所有矩形面积之和为可得的值,将第一组的容量除以第一组的频率可得出样本容量;
(2)将每个矩形底边的中点值乘以对应矩形的面积,相加可得出平均数;
(3)根据题意完善列联系表,结合临界值表可得出结论.
【规范答题】
(1)由频率分布直方图中,所有矩形面积之和为可得,解得,
样本容量为.
(2)所有参赛学生的平均成绩为.
(3)由题意可知,获奖人数为人,
由题意可得如下列联表
性别
奖励
合计
获奖
未获奖
男
女
合计
所以,,
所以,依据小概率值的独立性检验,男生与女生的获奖无差异.
1(24-25高三下·上海·阶段练习)某兴趣小组对高三刚结束的物理测试成绩进行随机调查,将所有选考物理的考生按是否同时选考化学分为A、B两类,并从中随机抽取100名考生的成绩,整理数据如下表(单位:人)
物理成绩学生分类
A类男生
2
8
15
8
B类男生
3
10
20
4
A类女生
3
4
2
1
B类女生
10
6
4
0
(1)估计该校高三学习物理男生人数与女生人数之比;
(2)求A类考生物现平均成绩的估计值(同一组中的数据用该组区间中点值代表,结果四舍五入到整数);
(3)把成绩在称为“合格”,成绩在称为“不合格”,是否有95%的把握认为该校考生的本次物理成绩合格与否和性别有关?
附:,其中.
【答案】(1)
(2)72
(3)有95%的把握认为该校考生的本次物理成绩合格与否和性别有关.
【分析】(1)根据表中数据求出男生和女生人数即可求解;
(2)根据频数分布列表,利用每组的组中值乘以对应的频率之和即可求解;
(3)根据表中数据可补充列联表,利用卡方的计算公式求出,结合表中的数据即可得出结论.
【详解】(1)由表中数据可知,男生共有,
女生共有,
由此估计该校高三学习物理男生人数与女人数的比值约为.
(2)A类共有:人
类物理平均成绩的估计值为
(3)由表中数据可知,列联表如下:
性别
成绩
合计
及格
不及格
男生
65
5
70
女生
17
13
30
合计
82
18
100
零假设为:该校考生的物理成绩与考生性别无关,
根据表格中数据计算得到
所以有95%的把握认为该校考生的本次物理成绩合格与否和性别有关.
题型五 线性回归方程
1(24-25高三下·广东·开学考试)习近平总书记指出:做好工作要“完整,准确,全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展”.某部门在对新发展理念组织了全面学习后,对同一工作小组中的5名员工采取如下考核制度:
①在本季度末,从部门中另抽120人,每人1票,对这5名员工进行投票;
②在本季度末,统计这5名员工本季度创造的营销收入.
记本季度创造的营销收入为(单位:千元),所得票数为,现将5人的情况用数对表示:关于的相关系数为,部门规定:若,则认为本次统计数据异常.
(1)证明:本次统计数据异常;
(2)经查验,本季度创造的营销收入最少的员工的数据存在异常,将其剔除后,求该工作小组关于的线性回归方程.(系数精确到个位数)
附:对于一组数据,回归直线方程的斜率和截距的最小二乘法估计公式分别为:;相关系数.
参考数据:,.
【思路分析】(1)计算相关系数,从而证得结论成立.
(2)根据线性回归方程的求法求得正确答案.
【规范答题】(1),
故该工作小组本次统计数据异常.
(2)将本季度创造的营销收入最少,即营销收入为75千元的员工数据剔除,
剔除数据后的.
代入计算得,
,
,
,所以,
故.故线性回归方程为.
2(24-25高三上·山西·期末)随着国内人均消费水平的提高,居民的运动健身意识不断增强,加之健康与解压需求的增长,使得健身器材行业发展趋势强劲,下表为年中国健身器材市场规模(单位:百亿元),其中年年对应的代码依次为.
年份代码
中国健身器材市场规模
(1)由上表数据可知,可用指数型函数模型拟合与的关系,请建立关于的归方程(,的值精确到);
(2)数据显示年购买过体育用品类的中国消费者中购买过运动防护类的占比为,用频率估计概率,现从年购买过体育用品类的中国消费者中随机抽取人,记购买过运动防护类的消费者人数为,求的分布列及数学期望.
参考数据:
其中,.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【思路分析】(1)设,可得,结合参考数据及公式求,由此可得结论;
(2)由条件确定的可能取值,判断服从二项分布,再求其取各值的概率,由此可得分布列,再利用二项分布期望公式求期望.
【规范答题】(1)两边同时取自然对数得.
设,所以,
因为,,,
所以.
把代入,得,
可得,.
所以,
即关于的回归方程为.
(2)由题意,得的所有可能取值依次为,,,,,且,
,,
,,
,
所以的分布列为
0
1
2
3
4
.
1(24-25高三上·重庆·阶段练习)一年一度的“双11”促销活动落下帷幕,各大电商平台发布的数据显示,在消费品以旧换新、家电政府补贴等促消费政策和活动的带动下,消费市场潜能加速释放,带动相关商品销售保持增长. 经过调研,得到2019年到2024年“双11”活动当天某电商平台线上日销售额(单位: 百亿元)与年份(第年)的6组数据(时间变量的取值依次为),对数据进行处理,得到如下散点图(图1)及一些统计量的值. 其中.
48.7
3.5
91
1204
1.1
9.4
388.1
分别用两种模型:①;②进行拟合,得到相应的回归方程,并进行残差分析,得到如图所示的残差图(图2)(残差值真实值预测值).
(1)根据题中信息,通过残差图比较模型①,②的拟合效果,应选择哪一个模型进行拟合?请说明理由;
(2)根据(1)中所选模型,
(i)求出关于的经验回归方程(系数精确到0.1);
(ⅱ)若该电商平台每年活动当天线上日销售额与当日营销成本及年份存在线性关系: ,则在第几年活动当日营销成本的预测值最大?
参考公式: ;参考数据:.
【答案】(1)应选择模型②,理由见详解;
(2)①;②第12年活动当日营销成本的预测值最大.
【详解】(1)由残差图可知模型①的残差值比较分散和远离横轴,所以模型①平方和大于模型②的残差平方和,所以应选择模型②.
(2)(i)对于模型②:,
令,可得,
则,
可得,所以关于的经验回归方程为;
(ⅱ)由(i)可得:,整理可得,
,则,
令,解得;令,解得;
可知在内单调递增,在内单调递减,
所以当时,取到最大值,即取得最大值,
所以第12年活动当日营销成本的预测值最大.
2(2025·河北秦皇岛·一模)近几年我国新能源汽车产业快速发展,据行业数据显示,新能源汽车的数量在不断增加.下表为某城市统计的近5年新能源汽车的新增数量,其中为年份代号,(单位:万辆)代表新增新能源汽车的数量.
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
新增新能源汽车万辆
1.2
1.8
2.5
3.2
3.8
(1)计算样本相关系数,判断是否可以用线性回归模型拟合与的关系,当时,可以认为两个变量有很强的线性相关性;否则,没有很强的线性相关性.
(2)求关于的经验回归方程,并据此估计该城市2026年的新增新能源汽车的数量;
参考数据:.参考公式:.
【答案】(1)可以用线性回归模型拟合与的关系.
(2),估计该市2026年新增燃油车5.14万辆.
【分析】(1)根据题意求相关系数r,结合相关系数的性质分析理解;
(2)根据题意求得回归方程为,令,代入运算即可得结果.
【详解】(1)由题意可得:,
则
,
因为,故可以用线性回归模型拟合与的关系.
(2)由题意可得:,,
则,当时,,
所以估计该市2026年新增燃油车5.14万辆.
题型六 条件概率与全概率公式
1(2025·山西·一模)新高考数学试卷中共3道多选题,每题满分为6分,在每小题给出的选项中,有多项符合题目要求,全部选对得6分,部分选对得部分分(如果有两个选项符合题目要求,选对一个得3分;如果有三个选项符合题目要求,选对一个得2分;有错选或不选,得0分),某数学兴趣小组研究多选题时发现:随机事件“多项选择题中,有两个选项符合题目要求”和“多项选择题中,有三个选项符合题目要求”的概率均为.若学生解答某多选题时完全没有思路,只能通过随机选择的方式来完成作答,且选择四个选项的可能性是相同的.
(1)已知某题有三个选项符合题目要求,小张通过随机选择选项的方式来完成作答,且只选一个选项作答的概率为,选两个选项作答的概率为,选三个选项作答的概率为,试求小张该题得0分的概率;
(2)小王在解答完全没有思路的多选题时,有两种策略,一是“随机选择一个选项作答”,二是“随机选择两个选项作答”,试写出小王用两种策略得分的分布列和数学期望.
【答案】(1)
(2)分布列见解析,策略一期望:;策略二期望:
【思路分析】(1)记“随机选择i个选项作答”,,“小张得0分”.由条件概率及全概率公式求解即可;
(2)设用策略一得分为随机变量X,用策略二得分为随机变量Y,确定随机变量的取值,求得相应概率,进而可求解;
【规范答题】(1)记“随机选择i个选项作答”,,“小张得0分”.
,,,,,,
则
(2)设记小王用策略一得分为随机变量X,X的取值为0,2,3;
记小王用策略二得分为随机变量Y,Y的取值为0,4,6
,,.
小王用策略一得分X的分布列为
X
0
2
3
P
故.
,
,.
Y
0
4
6
P
故;
2(2025·四川·一模)某保险公司随机选取了200名不同驾龄的投保司机,调查他们投保后一年内的索赔情况,结果如下:
单位:人
一年内是否索赔
驾龄
合计
不满10年
10年以上
是
10
5
15
否
90
95
185
合计
100
100
200
(1)依据小概率值的独立性检验,分析表中的数据,能否据此推断司机投保后一年内是否索赔与司机的驾龄有关?
(2)保险公司的大数据显示,每年投保的新司机索赔的概率为,投保的老司机索赔的概率均为.假设投保司机中新司机的占比为.随机选取一名投保司机,记事件“这名司机在第年索赔”为,事件“这名司机是新司机”为.已知.
(i)证明:;
(ii)证明:,并给出该不等式的直观解释.
附:,
【答案】(1)司机投保后一年内是否索赔与司机的驾龄无关
(2)(i)证明见解析;(ii)证明见解析,说明投保司机第一年索赔的概率小于他第一年索赔后第二年又索赔的概率.
【思路分析】(1)根据卡方独立性检验的检验规则即可求解;
(2)(i)根据条件概率公式即可证明;
(ii)根据题意可知,由(i)中的结论及已知易得,进而转化为,将该式化简变形即可证明.
【规范答题】(1)零假设为:司机投保后一年内是否索赔与司机的驾龄无关.
根据表中数据,计算得.
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为司机投保后一年内是否索赔与司机的驾龄无关.
(2)(i)根据条件概率的定义,
.
(ii)由题意.
由(i)中的结论及已知得,
,
由概率的性质知.
由全概率公式,.
根据条件概率的定义,.
因为,所以要证,即证,
即证.因为,所以成立.所以.
式子说明投保司机第一年索赔的概率小于他第一年索赔后第二年又索赔的概率.
1(2025·山东·模拟预测)已知两个不透明的袋子中均装有若干个大小,质地完全相同的红球和白球,从袋中摸出一个红球的概率是,从袋中摸出一个红球的概率是.在每轮中,甲同学先选择一个袋子摸一次球并放回,乙再选择一个袋子摸一次球并放回,则该轮结束.已知在每轮中甲选两袋的概率均为.如果甲选袋,则乙选袋的概率为;如果甲选袋,则乙选的概率为.
(1)若,求在一轮中乙从袋中摸出红球的概率;
(2)求在一轮中乙摸出红球的概率;
(3)若甲,乙两位同学进行了3轮摸球.乙同学认为,越大,3轮摸球后他摸出2个红球的概率越大,你同意他的观点吗?请说明理由.
【答案】(1)
(2)
(3)不同意乙的观点,理由见解析
【分析】(1)先利用全概率公式求出乙从袋中摸球的概率,再利用乘法概率公式求解即可;
(2)利用全概率公式求解即可;
(3)由题意知3轮摸球后摸出红球的个数服从二项分布,利用二项分布的概率公式可得3轮摸球后乙摸出2个红球的概率为,令,利用导数求最大时,的值即可.
【详解】(1)设“甲从袋中摸球”,“乙从袋中摸球”,“乙摸出的是红球”,
由全概率公式知,乙从袋中摸球的概率,
所以在一轮中,乙从袋中摸出红球的概率为.
(2)在一轮中,乙摸出红球的概率.
(3)由题意知3轮摸球后摸出红球的个数服从二项分布,
则3轮摸球后乙摸出2个红球的概率为,
设,则,
令,解得,
则当时,单调递增,当时,单调递减,
所以当时,3轮摸球后乙摸出2个红球的概率最大,所以不同意乙的观点
2 (2024·广东汕头·三模)11分制乒乓球比赛规则如下:在一局比赛中,每两球交换发球权,每赢一球得1分,先得11分且至少领先2分者胜,该局比赛结束:当某局比分打成10∶10后,每球交换发球权,领先2分者胜,该局比赛结束现有甲、乙两人进行一场五局三胜、每局11分制的乒乓球比赛,比赛开始前通过抛掷一枚质地均匀的硬币来确定谁先发球假设甲发球时甲得分的概率为,乙发球时甲得分的概率为,各球的比赛结果相互独立,且各局的比赛结果也相互独立.
(1)若每局比赛甲获胜的概率,求该场比赛甲获胜的概率.
(2)已知第一局目前比分为10∶10,求
(ⅰ)再打两个球甲新增的得分的分布列和均值;
(ⅱ)第一局比赛甲获胜的概率;
【答案】(1)
(2)(ⅰ)分布列见详解,;(ⅱ)
【分析】(1)由五局三胜制的规则,可知的所有可能取值为,求出对应概率相加即可求得甲获胜的概率为;
(2)(ⅰ)易知的所有可能取值为,根据条件概率公式可求得对应概率取值可得分布列和均值;(ⅱ)根据获胜规则求出第一局比赛甲获胜概率的表达式,解得.
【详解】(1)因为甲每局获胜的概率均为,根据五局三胜制的规则,
设甲获胜时的比赛总局数为,因为每局的比赛结果相互独立,
所以的所有可能取值为,
可得;
故该场比赛甲获胜的概率.
(2)(ⅰ)依题意,的所有可能取值为
设打成后甲先发球为事件,则乙先发球为事件,且,
所以,
.
所以的分布列为
0
1
2
故的均值为;
(ⅱ)设第一局比赛甲获胜为事件,则.
由(ⅰ)知,,
由全概率公式,得
解得,即第一局比赛甲获胜的概率.
3(2024·上海奉贤·三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.
(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;
(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:
假设1:各回合比赛相互独立;
假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;
求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?
【答案】(1)
(2)不合理,理由见详解
【分析】(1)由全概率公式,即可求解;
(2)由已知条件,求出第一回合发球者在整场比赛中先得第一分的概率,与比较,即可得到答案.
【详解】(1)设事件表示第一回合该中国队运动员赢球,事件表示第二回合该中国队运动员赢球,
事件表示第二回合比赛有运动员得分,
由已知,, ,
则
,
即第二回合比赛有运动员得分的概率为.
(2)设运动员甲先发球,记事件表示第i回合该运动员甲赢球,
记事件表示运动员甲先得第一分,
则,
则,
所以,即则第一回合发球者在整场比赛中先得第一分的概率大于,
则比赛双方运动员实力相当的情况下,先发球者更大概率占据心理上的优势,所以旧制不合理.
题型七 概率统计与其他知识点结合
1(2025·四川成都·二模)某答题挑战赛规则如下:比赛按轮依次进行,只有答完一轮才能进入下一轮,若连续两轮均答错,则挑战终止;每一轮系统随机地派出一道通识题或专识题,派出通识题的概率为,派出专识题的概率为.已知某选手答对通识题与专识题的概率分别为,且各轮答题正确与否相互独立.
(1)求该选手在一轮答题中答对题目的概率;
(2)记该选手在第轮答题结束时挑战依然未终止的概率为,
(i)求;
(ii)证明:存在实数,使得数列为等比数列.
【答案】(1);
(2)(i);(ii)证明见解析.
【思路分析】(1)根据给定条件,利用全概率公式计算得解.
(2)(i)将第3轮答题结束时挑战未终止的事件进行分拆,再利用互斥事件的加法公式及相互独立事件的乘法公式求出,同理求出;(ii)利用概率的加法公式及乘法公式列出递推公式,再利用构造法求解得证.
【规范答题】(1)设事件“一轮答题中系统派出通识题”,事件“该选手在一轮答题中答对”,
依题意,,,
因此,
所以该选手在一轮答题中答对题目的概率为.
(2)(i)设事件“该选手在第轮答对题目”,各轮答题正确与否相互独立,
由(1)知,,
当时,挑战显然不会终止,即,
当时,则第1、2轮至少答对一轮,,
由概率加法公式得;
同理.
(ii)设事件“第轮答题结束时挑战未终止”,
当时,第轮答题结束时挑战未终止的情况有两种:
①第轮答对,且第轮结束时挑战未终止;
②第轮答错,且第轮答对,且第轮结束时挑战未终止,
因此第轮答题结束时挑战未终止的事件可表示为,
则,而各轮答题正确与否相互独立,
因此,
当时,,设存在实数,使得数列为等比数列,
当时,,整理得,
而,则,解得或,
当时,
因此当时,数列是首项为,公比为的等比数列;
当时,数列是首项为,公比为的等比数列,
所以存在实数或,使得数列为等比数列.
2(2025·湖南·模拟预测)高三某班为缓解学生高考压力,班委会决定在周班会课上进行“听音乐、猜歌名”的趣味游戏比赛,现将全班学生分为组,每组人,剩余的学生做裁判.比赛规则如下:比赛共分为两轮,第一轮比赛中个小组分三场进行比赛,每场比赛有个小组参加,在规定的时间内猜对歌名最多的小组获胜,获胜的三个小组进入第二轮比赛,第二轮进行一场比赛,选出获胜队伍.已知甲、乙、丙个小组的学生能成功猜对歌名的概率分别为、、.
(1)现从乙组中任选一名学生进行歌曲试猜,记首歌曲中猜对的歌曲数为,求随机变量的数学期望;
(2)若从甲、乙、丙个小组中任选一名学生参加猜歌游戏,求该学生猜对歌曲的概率;
(3)若第二轮比赛中丁、戊两组并列第一,则设置以下游戏决定最终获胜的小组,游戏规则如下:从丁、戊小组中任选一名代表,从装有个白球和个红球的不透明的盒子中有放回地随机摸出一个球,摸出白球记分,摸出红球记分,以分开始计分,恰好获得分或分则结束摸球.若该代表获得分,则该代表所在小组获得胜利,否则另外一组获得胜利.若该代表来自丁组,试估计丁组获胜的概率.
【答案】(1)(2)(3)
【思路分析】(1)分析可知,由二项分布的期望公式可得出的值;
(2)记事件、、分别表示该学生来自甲、乙、丙组,事件表示该同学能猜对,利用全概率公式可求得的值;
(3)记得分为的概率为,求得,推导出数列为等比数列,确定该数列的首项和公比,可求出数列的通项公式,利用累加法可求得的值,即为所求.
【规范答题】(1)由题意可知,,由二项分布的期望公式可得.
(2)记事件、、分别表示该学生来自甲、乙、丙组,事件表示该同学能猜对,
所以,,,,,
由全概率公式可得.
所以,该学生能猜对的概率为.
(3)由题意可知,积分增加分的概率为,增加分的概率为,
记得分为的概率为,且,,
,所以,,且,
所以,数列是首项为,公比为的等比数列,则,
由累加法可得
.因此,丁组获胜的概率为.
1(2025·黑龙江哈尔滨·一模)“冰雪同梦,亚洲同心”,年第九届亚冬会在哈尔滨举办,本次赛事共有个大项,个分项,个小项,有来自个国家和地区,多名运动员参赛,是一场令人回味无穷的冬季体育盛会,亚冬会圆满结束后,我校团委组织学生参加与亚冬会有关的知识竞赛.为鼓励同学们积极参加此项活动,比赛规定:答对一题得两分,答错一题得一分,选手不放弃任何一次答题机会.已知小明报名参加比赛,每道题回答是否正确相互独立,且每次答对的概率不一定相等.
(1)若前三道试题,小明每道试题答对的概率均为,
①设,记小明答完前三道题得分为,求随机变量的分布列和数学期望;
②若小明答完前四道题得分的概率为,求小明答完前四题时至少答对三题的概率的最小值;
(2)若小明答对每道题的概率均为,因为小明答对第一题或前两题都答错,均可得到两分,称此时小明答题累计得分为,记小明答题累计得分为的概率为,求数列的通项公式.
【答案】(1)①分布列答案见解析,;②
(2)
【分析】(1)①分析可知随机变量的可能取值有、、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值;
②分析可知,第四道试题答对的概率为,根据独立事件和互斥事件的概率公式可得出小明答完前四题时至少答对三题的概率的表达式,利用导数可求出的最小值;
(2)计算出、的值,推导出当时,,推导出数列为等比数列,数列为常数列,求出这两个数列的通项公式,即可求得数列的通项公式.
【详解】(1)①由题意可知,随机变量的可能取值有、、、,
,,
,,
所以,随机变量的分布列如下表所示:
所以,;
②因为前四道试题得分即全对的概率为,所以第四道试题答对的概率为,
所以,小明答完前四题时至少答对三题的概率为,
则,
当时,,此时,函数单调递减,
当时,,此时,函数单调递增,
所以.
(2)依题意可得,,当时,则,
所以,,且,
所以,数列是首项为,公比为的等比数列,
故,
且,
所以数列是各项均为的常数列,则,
所以,解得.
2(24-25高三下·辽宁·阶段练习)现有一个质地均匀的骰子,按照下述规则从左到右依次记录字符:抛掷骰子,点数为1,2,3时,记录字符AA;点数为4时记录字符B,点数为5时记录字符C,点数为6时记录字符D.继续投掷骰子,按照相同的规则向右记录AA,B,C,D的字符.例如抛掷5次骰子得到的点数依次是5,6,2,3,4,则记录的字符为CDAAAAB,共7个字符,其中从左向右第4个字符为A,第7个字符为B.
(1)抛掷3次骰子,并记录字符.记字符中A的个数为,求;
(2)抛掷次骰子,并记录字符.记第个字符为的概率为.
(i)求证:是常数列;
(ii)求的前项和.
【答案】(1)3
(2)(i)证明见解析;(ii)
【分析】(1)由题意可得离散型随机变量的所有可能值,利用概率的乘法公式与组合数,结合数学期望的公式,可得答案;
(2)(i)分情况由概率的乘法公式求概率,利用概率的加法公式求得递推公式,可得答案;(ii)由题意求数列的前两项,由(i)的常数列求得递推公式,利用构造法求得通项,根据等比数列求和,可得答案.
【详解】(1)由题意知,的所有可能取值为0,2,4,6.
则,,
,,
故.
(2)(i)将第个字符为分为两种情形讨论.
①第一次抛掷的结果为1,2或3,
则最左边的两个字符为AA,剩下的个字符中,第个字符为的概率为;
②第一次抛掷的结果为4,5或6,
则在剩下的个字符中,第个字符为的概率为.
综上:.
故,
即是一个常数列.
(ii)容易计算,,故.
故,
即是以为首项,为公比的等比数列,
故,
故的前项和为
.
1.(24-25高三上·江西宜春·期末)2024年5月22日至5月28日是第二届全国城市生活垃圾分类宣传周,本次宣传周的主题为“践行新时尚分类志愿行”某中学高一年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,分为五组,其中第二组的频数是第一组频数的2倍,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求的值,并估计这次竞赛成绩的中位数(同一组中的数据用该组区间的中点值作代表);
(2)某老师在此次竞赛成绩中抽取了10名学生的分数:,已知这10个分数的平均数,标准差,若剔除其中的75和85两个分数,求剩余8个分数的平均数与方差.
【答案】(1),,
(2)80;37.5
【分析】(1)由题意结合各组频率之和为1,即可求得的值,利用中位数的计算方法即可求得中位数;
(2)利用平均值以及方差公式,即可求得答案.
【详解】(1)由第二组的频数是第一组频数的2倍,可知第二组的频率是第一组频率的2倍,
即,则;
又,解得;
由于成绩在内的频率为,在内的频率为,
故中位数位于,设为m,则,解得;
(2)由,可得,
则剔除其中的75和85两个分数,剩余8个数平均数为;
又标准差,
故,
则,
则剩余的8个数的方差为.
2.(2025·陕西西安·一模)某商场进行抽奖活动,设置摸奖箱内有红球个,白球个,黑球个,小球除颜色外没有任何区别.规定:摸到红球记分,摸到白球记分,摸到黑球记分.抽奖人摸个球为一次抽奖,总分记为,若,则获奖.
方案一:从中一次摸个球,记录分数后不放回.
方案二:从中一次摸个球,记录分数后放回.
(1)若甲顾客按照方案一摸球记分,求甲顾客获奖的概率;
(2)若乙顾客按照方案一摸球记分,求第二次摸到红球条件下,乙顾客获奖的概率;
(3)若丙顾客按照方案二摸球记分,求的分布列和数学期望.
【答案】(1)
(2)
(3)分布列答案见解析,
【分析】(1)分析可知,甲顾客摸到个红球个白球、或者是个红球个白球个黑球,利用组合计数原理结合古典概型的概率公式可求得的值;
(2)记事件乙顾客按照方案一摸球获奖,记事件乙顾客第二次摸到红球,求出、的值,利用条件概率公式可求得的值;
(3)分析可知随机变量的可能取值有、、、、、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值.
【详解】(1)若,则甲顾客摸到个红球个白球、或者是个红球个白球个黑球,
所以,.
(2)记事件乙顾客按照方案一摸球获奖,由(1)可知,
记事件乙顾客第二次摸到红球,则,
,
所以,.
(3)摸到次红球的概率为,摸到次白球的概率为,摸到次黑球的概率为,
则的可能取值有、、、、、、,
,,
,,
,,
,
所以,随机变量的分布列如下表所示:
故.
3.(24-25高三下·河北石家庄·开学考试)2024年6月5日《中国教育报》刊发了教育部的“呵护好孩子的眼睛,共创光明的未来”的文章,其中特别强调“幼儿单次使用电子产品的时间不宜超过15分钟,累计每天不超过1小时”等内容.为切实提升儿童青少年视力健康整体水平,某学校积极推进近视综合防控,落实“明眸”工程,开展了近视原因的调查以备有效进行预防.在已近视的学生中随机调查了100人,同时在未近视的学生中随机调查了100人,得到如下数据:
电子产品
近视
未近视
非长时间使用电子产品
40
70
长时间使用电子产品
60
30
(1)依据小概率值的独立性检验,能否认为患近视与长时间使用电子产品有关?
(2)用频率估计概率,从已经近视的学生中采用随机抽样的方式选出1名学生,利用“物理+药物”治疗方案对该学生进行治疗.已知“物理+药物”治疗方案的治愈数据如下:在已近视的学生中,对非长时间使用电子产品的学生的治愈率为,对长时间使用电子产品的学生的治愈率为,求该近视学生被治愈的概率;
(3)若按样本数据利用分层随机抽样的方法从近视学生中抽取5人,再从这5人中抽取3人进行近视矫正实验,记表示这3人中长时间使用电子产品的人数,求的分布列与数学期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关联
(2)
(3)分布列见解析,
【分析】(1)先设零假设,计算再与边界值比较判断即可;
(2)应用全概率公式计算求解即可;
(3)根据超几何分布求出概率再计算数学期望即可.
【详解】(1)零假设为:学生患近视与长时间使用电子产品无关,
,
依据小概率值的独立性检验,我们推断不成立,
即认为学生患近视与长时间使用电子产品有关联,此推断犯错误的概率不大于0.001.
(2)设事件表示使用“物理十药物”治疗方案并且治愈,
事件表示非长时间使用电子产品的近视学生,事件表示长时间使用电子产品的近视学生,
由题意可得,
且,
则
,
所以该近视学生被治愈的概率为.
(3)由样本数据可知近视学生中长时间使用电子产品与非长时间使用电子产品的人数比例为,
所以抽取的5人中有3人是长时间使用电子产品,有2人是非长时间使用电子产品,
所以的可能取值为,
且,
;
,
所以的分布列为:
1
2
3
所以数学期望为.
4.(24-25高三下·北京·阶段练习)无人驾驶技术是汽车研发领域的一个重要方向.某学校技术俱乐部研发了一个感知路况障碍的小汽车模型,该模型通过三个传感器共同判断路段是否有路障.在对该模型进行测试中,该俱乐部同学寻找了个不同的路段作为测试样本,数据如下表:
测试
结果真实
路况
传感器1
传感器2
传感器3
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
无障碍
4
15
1
1
15
4
8
12
0
有障碍
40
10
10
45
5
10
45
10
5
假设用频率估计概率,且三个传感器对路况的判断相互独立.
(1)从这80个路段中随机抽取一个路段,求传感器1对该路况判断正确的概率;
(2)从这80个路段中随机抽取一个有障碍的路段进行测试,设为传感器1和传感器2判断正确的总路段数,求的分布列和数学期望;
(3)现有一辆小汽车同时装载了以上3种传感器.在通过某路段时,只要3个传感器中一个判断有障碍或无法识别,则小汽车减速.那么是否可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于?(结论不要求证明)
【答案】(1)
(2)分布列见解析,
(3)答案见解析
【分析】(1)利用古典概型的概率公式可求得所求事件的概率;
(2)分析可知,随机变量的取值集合为,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值;
(3)计算出三个传感器判断无障碍的概率,比较大小后可得出结论.
【详解】(1)80个路段中,传感器1判断正确的路段有个.
设“传感器1对该路况判断正确”为事件,则.
(2)80个路段中共有60个有障碍的路段.60个有障碍的路段中,传感器1判断正确的路段有40个,
错误的有个,传感器2判断正确的路段有45个,判断错误的路段有个
的取值集合为.
,,
,
故的分布列为
随机变量的数学期望
(3)可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于.
分析:共有20个无障碍地路段,传感器1判断无障碍的有15个,
由频率估计概率,故无障碍路段上,估计传感器1判断无障碍的概率为.
传感2判断无障碍的有15个,由频率估计概率,故无障碍路段上,
估计传感器2判断无障碍的概率为.
若传感器3在无障碍路段上,判断为无障碍的概率为1.
小汽车在无障碍的道路上减速的概率:.
故可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于.
5.(24-25高三上·云南德宏·期末)为更好的发挥高考的育才作用,部分新高考数学试卷采用了多选题这一题型.教育部考试中心通过科学测量分析,指出该题型扩大了试卷考点的覆盖面,有利于提高试卷的区分度,也有利于提高学生的得分率.多选题评分规则如下:对于多选题,每个小题给出的四个选项中,有两项或三项是正确的,满分6分.全部选对得6分,有错选或全不选得0分,正确答案为两项时,选对1个得3分;正确答案为三项时,选对1个得2分,选对2个得4分.多选题正确答案是两个选项的概率为p,正确答案是三个选项的概率为(其中).
(1)在一次模拟考试中,学生甲对某个多选题完全不会,决定随机选择一个选项,若,求学生甲该题得2分的概率;
(2)针对某道多选题,学生甲完全不会,此时他有三种答题方案:
Ⅰ:随机选一个选项; Ⅱ:随机选两个选项; Ⅲ:随机选三个选项.
(i)若,且学生甲选择方案Ⅰ,求本题得分的数学期望;
(ii)以本题得分的数学期望为决策依据,p的取值在什么范围内唯独选择方案Ⅰ最好?
【答案】(1)
(2)(i);(ⅱ)
【分析】(1)由全概率公式求解即可;
(2)(i)记为“从四个选项中随机选择一个选项的得分”,求出的可能取值及其概率,即可求出的分布列,再由期望公式求出;
(ⅱ)记分别为“从四个选项中随机选择一个选项、两个选项和三个选项的得分”,求出的数学威望,由题意可得,解不等式组即可得出答案.
【详解】(1)记事件为“正确答案选两个选项”,事件为“学生甲得分”.
,
即学生甲该题得分的概率为.
(2)(i)记为“从四个选项中随机选择一个选项的得分”,则可以取,,,
, ,
,
所以的分布列为
则数学期望.
(ⅱ)记为“从四个选项中随机选择一个选项的得分”,
则,
,
,
所以
记为“从四个选项中随机选择两个选项的得分”,
则,
,
,
所以
记为“从四个选项中随机选择三个选项的得分”,
则,
,
所以.
要使唯独选择方案Ⅰ最好,则,解得:,
故的取值范围为.
6.(2025高三下·全国·专题练习)小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20家服装店,统计得到了它们的面积X(单位:)和日均客流量Y(单位:百人)的数据,并计算得.
(1)求Y关于X的回归直线方程;
(2)已知服装店每天的经济效益,该商场现有的商铺出租,根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺?
附:回归直线的斜率和截距的最小二乘估计分别为:.
【答案】(1)
(2)
【分析】(1)由已知条件结合回归直线公式可求出回归直线方程,(2)根据题意得,构造函数,利用二次函数的性质可求出其最大值,从而可求出Z的最大值.
【详解】(1)由已知可得,,
,,所以回归直线方程为.
(2)根据题意得.
设,
令,
则,
当,即时,取最大值,又因为k,,所以此时Z也取最大值,因此,小李应该租的商铺.
7.(2025·河北保定·一模)某工厂为了解员工绩效分数达标情况与员工性别的关系,随机对该厂男、女各30名员工的绩效分数达标情况进行调查,整理得到如下列联表:
单位:人
性别
绩效分数达标情况
合计
未达标
达标
男
20
10
30
女
5
25
30
合计
25
35
60
(1)经计算,所调查的男员工绩效分数的平均数为26;女员工绩效分数的平均数为34,求这60人绩效分数的平均数.
(2)根据上表数据,依据小概率值的独立性检验,能否据此推断绩效分数达标情况与性别有关联?
(3)该厂为激励员工,规定每月绩效分数的第一名奖励1千元,其他名次无奖励.甲为该厂员工,他在工厂开工的第一个月赢得奖励的概率为,从第二个月开始,若上个月没有赢得奖励,则这个月赢得奖励的概率为;若上个月赢得奖励,则这个月仍赢得奖励的概率为,求甲在前两个月所得奖金总额(单位:千元)的分布列和数学期望.
附:
0.1
0.01
0.001
2.706
6.635
10.828
参考公式:,其中.
【答案】(1)30;
(2)有关联;
(3)分布列见解析,0.44.
【分析】(1)根据题意计算即可;
(2)由已知数据利用公式计算,与参考数据比较大小即可得出结论;
(3)根据题意计算出可能取值及相应概率,即可得到分布列,再利用公式计算期望值.
【详解】(1)由题意可知,30.
(2)零假设为:绩效分数达标情况与性别无关.
,
根据小概率值的独立性检验,我们推断不成立,即认为绩效分数达标情况与性别有关联,此推断犯错误的概率不大于0.001.
(3)由题意知可能的取值为,
则;
,
所以甲在前两个月所得奖金总额的分布列为
0
1
2
数学期望0.44.
8.(2025·江西上饶·一模)2024年7月26日至8月11日在法国巴黎举行了夏季奥运会.为了普及奥运知识,大学举办了一次奥运知识竞赛,竞赛分为初赛与决赛,初赛通过后才能参加决赛.
(1)初赛从6道题中任选2题作答,2题均答对则进入决赛.已知这6道题中小王能答对其中4道题,求小王在已经答对一题的前提下,仍未进入决赛的概率;
(2)大学为鼓励大学生踊跃参赛并取得佳绩,决定对进入决赛的参赛大学生给予一定的奖励.奖励规则如下:对于进入决赛的每名大学生允许连续抽奖3次,中奖1次奖励120元,中奖2次奖励180元,中奖3次奖励360元,若3次均未中奖,则只奖励60元,假定每次中奖的概率均为,且每次是否中奖相互独立.
(Ⅰ)记一名进入决赛的大学生恰好中奖1次的概率为,求的极大值;
(Ⅱ)大学数学系共有9名大学生进入了决赛,若这9名大学生获得的总奖金的期望值不小于1120元,试求此时的取值范围.
【答案】(1)
(2);
【分析】(1)利用条件概率的概率公式计算即可得解;
(2)(I)由,运用导数研究其极大值即可.(II)分析每名进入决赛的大学生获得的奖金的期望,解不等式即可.
【详解】(1)记事件:小王已经答对一题,事件:小王未进入决赛,
则小王在已经答对一题的前提下,仍未进入决赛的概率.
(2)(I)由题意知,,,
则,令,得或1(舍),
当时,,当时,,
所以在上单调递增,在上单调递减,
所以当时,有极大值,且极大值为.
(II)设每名进入决赛的大学生获得的奖金为随机变量,则的可能取值为,
则,
,
,
,
所以,
令,即,整理得,
因为,
易知,所以,即,
又,所以的取值范围为.
【点睛】关键点点睛:本题解题的关键是求出,,利用导数求极值.
9.(2025·湖北·二模)已知某商店出售商品A,据统计分析,发现顾客对商品A的需求量相对稳定,每周内对商品A的不同需求量(单位:个)与概率的数据如下:
对A的需求量
0
1
2
3
概率
若以商品A的库存作为供给量,为了改善经营,该商店决定每周末对商品A进行盘点存货:如果商品A都售出了,则在周末及时采购2个新的商品,只要商品A还有1个存货,就不采购新的商品.记为该商店第周开始时商品A的供给量,假设.
(1)求的分布列;
(2)记为第周开始时供给量的概率向量,随着的增大,若,则趋向一个定常态分布,记这个定常态分布为.
(i)求商品A的定常态分布;
(ii)从长远来看,求该商店改善经营后商品A需求大于供给的概率.
【答案】(1)分布列见解析;
(2)(i);(ii).
【分析】(1)根据条件概率公式计算得,则;
(2)(i)设,利用全概率公式即可得到方程,解出即可;
(ii)分析得,再利用全概率公式即可.
【详解】(1)由题意,第2周开始时商品A不同供给量的概率为,,
第3周开始时商品A供给量的概率为
,
.
第3周开始时商品A的供给量分布列为
1
2
(2)(i)记为商品A第周内的的需求量,由题意,与的状态有关,
当时,若,则;若,则,
设,即,
由全概率公式可得,
,
由,得,解得,故.
(ii)由(i)可知,定常态分布,所以从长远来看,
,
记商品A需求大于供给的概率为,由全概率公式得
.
【点睛】关键点点睛:本题第二问的关键是理解定常态分布的定义,再结合全概率公式计算即可.
10.(24-25高三下·云南昆明·阶段练习)云南花卉产业作为云南全力打造世界一流“绿色食品牌”的重点产业之一、从起步发展至今仅四十多年的时间,取得了令人瞩目的成绩.目前云南已成为全球公认的三大最适宜鲜切花种植的区域之一,鲜切花种植面积和产量位居全球第一,全省花卉种植面积稳定在190万亩左右.近8年云南省花卉种植面积统计数据及散点图如图
(1)经计算得下表中数据,根据散点图,在模型①:与模型②:,(均为常数)中,选择一个更适合作为云南省花卉种植面积关于年份代码的回归方程类型,求出关于的回归方程;
1.3
165.0
204
17.5
42
3.5
6448.3
1901.5
其中.
(2)运输过程中,为保证鲜切花质量,需对其存活天数进行研究.一品种鲜切花存活天数为随机变量,且最多只能存活天,研究人员发现,存活天数为的样本在存活天数超过的样本里占,存活天数为1的样本在全体样本中占.
①求;
②用表示该品种鲜切花存活天数的数学期望.
附:.
【答案】(1)更适合,
(2)①;②
【分析】(1)根据散点图,确定更适合,再利用换元法,以及题中的数据,代入公式求回归方程;
(2)①根据条件概率,以及递推关系,可证明数列是以0.18为首项,0.8为公比的等比数列,再根据分段函数的形式列出解析式;②根据①的结果,列式,再利用错位相减法,即可求解.
【详解】(1)由散点图可知,更适合作为云南省花卉种植面积y关于年份代码x的回归方程类型.
令,所以.
因为,,,,
所以.
所以,
所以.
云南省花卉种植面积y关于年份代码x的回归方程为.
(2)①由题可得,,
当时,,
又,即,
同理可得,当时,,
两式相减得,
即,,,
因为,
所以,当时,是以0.18为首项,0.8为公比的等比数列,
当时,,
所以.
②
,
令,
则,
两式相减得,
,
所以,
则.
【点睛】关键点点睛:本题的关键是由条件概率,以及公式,从而列出数列的递推关系式.
一、解答题
1.(2024·新高考Ⅰ卷·高考真题)设m为正整数,数列是公差不为0的等差数列,若从中删去两项和后剩余的项可被平均分为组,且每组的4个数都能构成等差数列,则称数列是可分数列.
(1)写出所有的,,使数列是可分数列;
(2)当时,证明:数列是可分数列;
(3)从中任取两个数和,记数列是可分数列的概率为,证明:.
【答案】(1)
(2)证明见解析
(3)证明见解析
【分析】(1)直接根据可分数列的定义即可;
(2)根据可分数列的定义即可验证结论;
(3)证明使得原数列是可分数列的至少有个,再使用概率的定义.
【详解】(1)首先,我们设数列的公差为,则.
由于一个数列同时加上一个数或者乘以一个非零数后是等差数列,当且仅当该数列是等差数列,
故我们可以对该数列进行适当的变形,
得到新数列,然后对进行相应的讨论即可.
换言之,我们可以不妨设,此后的讨论均建立在该假设下进行.
回到原题,第1小问相当于从中取出两个数和,使得剩下四个数是等差数列.
那么剩下四个数只可能是,或,或.
所以所有可能的就是.
(2)由于从数列中取出和后,剩余的个数可以分为以下两个部分,共组,使得每组成等差数列:
①,共组;
②,共组.
(如果,则忽略②)
故数列是可分数列.
(3)定义集合,.
下面证明,对,如果下面两个命题同时成立,
则数列一定是可分数列:
命题1:或;
命题2:.
我们分两种情况证明这个结论.
第一种情况:如果,且.
此时设,,.
则由可知,即,故.
此时,由于从数列中取出和后,
剩余的个数可以分为以下三个部分,共组,使得每组成等差数列:
①,共组;
②,共组;
③,共组.
(如果某一部分的组数为,则忽略之)
故此时数列是可分数列.
第二种情况:如果,且.
此时设,,.
则由可知,即,故.
由于,故,从而,这就意味着.
此时,由于从数列中取出和后,剩余的个数可以分为以下四个部分,共组,使得每组成等差数列:
①,共组;
②,,共组;
③全体,其中,共组;
④,共组.
(如果某一部分的组数为,则忽略之)
这里对②和③进行一下解释:将③中的每一组作为一个横排,排成一个包含个行,个列的数表以后,个列分别是下面这些数:
,,,.
可以看出每列都是连续的若干个整数,它们再取并以后,将取遍中除开五个集合,,,,中的十个元素以外的所有数.
而这十个数中,除开已经去掉的和以外,剩余的八个数恰好就是②中出现的八个数.
这就说明我们给出的分组方式满足要求,故此时数列是可分数列.
至此,我们证明了:对,如果前述命题1和命题2同时成立,则数列一定是可分数列.
然后我们来考虑这样的的个数.
首先,由于,和各有个元素,故满足命题1的总共有个;
而如果,假设,则可设,,代入得.
但这导致,矛盾,所以.
设,,,则,即.
所以可能的恰好就是,对应的分别是,总共个.
所以这个满足命题1的中,不满足命题2的恰好有个.
这就得到同时满足命题1和命题2的的个数为.
当我们从中一次任取两个数和时,总的选取方式的个数等于.
而根据之前的结论,使得数列是可分数列的至少有个.
所以数列是可分数列的概率一定满足
.
这就证明了结论.
【点睛】关键点点睛:本题的关键在于对新定义数列的理解,只有理解了定义,方可使用定义验证或探究结论.
2.(2024·新课标Ⅱ卷·高考真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
【答案】(1)
(2)(i)由甲参加第一阶段比赛;(i)由甲参加第一阶段比赛;
【分析】(1)根据对立事件的求法和独立事件的乘法公式即可得到答案;
(2)(i)首先各自计算出,,再作差因式分解即可判断;(ii)首先得到和的所有可能取值,再按步骤列出分布列,计算出各自期望,再次作差比较大小即可.
【详解】(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,
比赛成绩不少于5分的概率.
(2)(i)若甲先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,
若乙先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,
,
,
,应该由甲参加第一阶段比赛.
(ii)若甲先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,
,
,
,
,
记乙先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,
同理
,
因为,则,,
则,
应该由甲参加第一阶段比赛.
【点睛】关键点点睛:本题第二问的关键是计算出相关概率和期望,采用作差法并因式分解从而比较出大小关系,最后得到结论.
3.(2024·全国甲卷·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见详解
(2)答案见详解
【分析】(1)根据题中数据完善列联表,计算,并与临界值对比分析;
(2)用频率估计概率可得,根据题意计算,结合题意分析判断.
【详解】(1)根据题意可得列联表:
优级品
非优级品
甲车间
26
24
乙车间
70
30
可得,
因为,
所以有的把握认为甲、乙两车间产品的优级品率存在差异,没有的把握认为甲,乙两车间产品的优级品率存在差异.
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为,
用频率估计概率可得,
又因为升级改造前该工厂产品的优级品率,
则,
可知,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
4.(2023·新课标Ⅰ卷·高考真题)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.
【答案】(1)
(2)
(3)
【分析】(1)根据全概率公式即可求出;
(2)设,由题意可得,根据数列知识,构造等比数列即可解出;
(3)先求出两点分布的期望,再根据题中的结论以及等比数列的求和公式即可求出.
【详解】(1)记“第次投篮的人是甲”为事件,“第次投篮的人是乙”为事件,
所以,
.
(2)设,依题可知,,则
,
即,
构造等比数列,
设,解得,则,
又,所以是首项为,公比为的等比数列,
即.
(3)因为,,
所以当时,,
故.
【点睛】本题第一问直接考查全概率公式的应用,后两问的解题关键是根据题意找到递推式,然后根据数列的基本知识求解.
5.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【答案】(1),;
(2),最小值为.
【分析】(1)根据题意由第一个图可先求出,再根据第二个图求出的矩形面积即可解出;
(2)根据题意确定分段点,即可得出的解析式,再根据分段函数的最值求法即可解出.
【详解】(1)依题可知,左边图形第一个小矩形的面积为,所以,
所以,解得:,
.
(2)当时,
;
当时,
,
故,
所以在区间的最小值为.
6.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【答案】(1),;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【分析】(1)直接利用平均数公式即可计算出,再得到所有的值,最后计算出方差即可;
(2)根据公式计算出的值,和比较大小即可.
【详解】(1),
,
,
的值分别为: ,
故
(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
7.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;
(2)实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
实验组的小白鼠体重的增加量从小到大排序为:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:
对照组
实验组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
附:
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(1)分布列见解析,
(2)(i);列联表见解析,(ii)能
【分析】(1)利用超几何分布的知识即可求得分布列及数学期望;
(2)(i)根据中位数的定义即可求得,从而求得列联表;
(ii)利用独立性检验的卡方计算进行检验,即可得解.
【详解】(1)依题意,的可能取值为,
则,,,
所以的分布列为:
故.
(2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,观察数据可得第20位为,第21位数据为,
所以,
故列联表为:
合计
对照组
6
14
20
实验组
14
6
20
合计
20
20
40
(ii)由(i)可得,,
所以能有的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
8.(2022·全国乙卷·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
【答案】(1);
(2)
(3)
【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.
【详解】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为,
又已知树木的材积量与其根部横截面积近似成正比,
可得,解之得.
则该林区这种树木的总材积量估计为
9.(2022·全国甲卷·高考真题)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【答案】(1);
(2)分布列见解析,.
【分析】(1)设甲在三个项目中获胜的事件依次记为,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;
(2)依题可知,的可能取值为,再分别计算出对应的概率,列出分布列,即可求出期望.
【详解】(1)设甲在三个项目中获胜的事件依次记为,所以甲学校获得冠军的概率为
.
(2)依题可知,的可能取值为,所以,
,
,
,
.
即的分布列为
0
10
20
30
0.16
0.44
0.34
0.06
期望.
10.(2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii);
【分析】(1)由所给数据结合公式求出的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求.
【详解】(1)由已知,
又,,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为,
所以
所以,
(ii)
由已知,,
又,,
所以
11.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1)岁;
(2);
(3).
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设{一人患这种疾病的年龄在区间},根据对立事件的概率公式即可解出;
(3)根据条件概率公式即可求出.
【详解】(1)平均年龄
(岁).
(2)设{一人患这种疾病的年龄在区间},所以
.
(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.
12.(2021·新高考全国Ⅰ卷·高考真题)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
【答案】(1)见解析;(2)类.
【分析】(1)通过题意分析出小明累计得分的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答类问题的数学期望,比较两个期望的大小即可.
【详解】(1)由题可知,的所有可能取值为,,.
;
;
.
所以的分布列为
(2)由(1)知,.
若小明先回答问题,记为小明的累计得分,则的所有可能取值为,,.
;
;
.
所以.
因为,所以小明应选择先回答类问题.
13.(2021·新高考全国Ⅱ卷·高考真题)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,.
(1)已知,求;
(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程:的一个最小正实根,求证:当时,,当时,;
(3)根据你的理解说明(2)问结论的实际含义.
【答案】(1)1;(2)见解析;(3)见解析.
【分析】(1)利用公式计算可得.
(2)利用导数讨论函数的单调性,结合及极值点的范围可得的最小正零点.
(3)利用期望的意义及根的范围可得相应的理解说明.
【详解】(1).
(2)设,
因为,故,
若,则,故.
,
因为,,
故有两个不同零点,且,
且时,;时,;
故在,上为增函数,在上为减函数,
若,因为在为增函数且,
而当时,因为在上为减函数,故,
故为的一个最小正实根,
若,因为且在上为减函数,故1为的一个最小正实根,
综上,若,则.
若,则,故.
此时,,
故有两个不同零点,且,
且时,;时,;
故在,上为增函数,在上为减函数,
而,故,
又,故在存在一个零点,且.
所以为的一个最小正实根,此时,
故当时,.
(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.
6 / 15
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
大题06 概率与统计
根据近几年的高考情况,概率与统计是高考解答题必考解答题,考查的内容主要是以统计案例及统计数据分析,随机变量与分布列,正态分布,对立性检验,回归方程分析这几种形式出现。难点在于容易与其他知识点相结合,容易和数列,导数相结合,另外就是条件概率是学生的一个易错点,是很多学生的只是盲区,所以接下来的复习中,条件概率与全概率公式应该要重视。预计2025年高考中将会以分布列及条件概率形式出现,应该予以重视。
题型一 统计案例与统计数据分析
(24-25高三下·重庆南岸·阶段练习)重庆市举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.重庆旅游局承办了志愿者选拔的面试工作.随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求的值,并估计这100名候选者面试成绩的平均数;
(2)若从以上各组中用分层随机抽样的方法选取20人,担任了本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和50,请据此估计这次第二组和第四组所有面试者的面试成绩的平均数和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体的样本平均数为.则总体样本方差.
设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体的样本平均数为.则总体样本方差
1.(24-25高三上·上海·阶段练习)某学校为提高学生对《红楼梦》的了解,举办了"我知红楼"知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:,并作出如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本数据的第62百分位数所在区间的组中值;
(3)若落在中的样本数据平均数是52,方差是6;落在中的样本数据平均数是64,方差是3,求这两组数据的总平均数和方差.
题型二 随机变量及分布列
1 (24-25高三下·河北·开学考试)春节期间有一过关赢奖励娱乐活动,参与者需先后进行四个关卡挑战,每个关卡都必须参与.前三个关卡至少挑战成功两个才能够进入第四关,否则直接淘汰,若四关都通过,则可以赢得奖励.参与者甲前面三个关卡每个挑战成功的概率均为,第四关挑战成功的概率为,且各关挑战成功与否相互独立.
(1)求参与者甲未能参与第四关的概率;
(2)记参与者甲本次挑战成功的关卡数为X,求X的分布列以及数学期望.
2(24-25高三下·北京·开学考试)同学们,你们知道排球比赛的规则和积分制吗?其规则是:每局25分,达到24分时,比赛双方必须相差2分,才能分出胜负;每场比赛采用“5局3胜制”(即有一支球队先胜3局即获胜,比赛结束);比赛排名采用积分制,积分规则如下:比赛中,以3∶0或3∶1取胜的球队积3分,负队积0分;以3∶2取胜的球队积2分,负队积1分.甲、乙两队近期将要进行比赛,为预测它们的积分情况,收集了两队以往6局比赛成绩:
1
2
3
4
5
6
甲
25
21
27
27
23
25
乙
18
25
25
25
25
17
假设用频率估计概率,且甲,乙每局的比赛相互独立.
(1)估计甲队每局获胜的概率;
(2)如果甲、乙两队比赛1场,求甲队的积分X的概率分布列和数学期望;
(3)如果甲、乙两队约定比赛2场,请比较两队积分相等的概率与的大小(结论不要求证明).
二项分布的适用范围及本质
(1)适用范围:
①各次试验中的事件是相互独立的;
②每次试验只有两种结果:事件要么发生,要么不发生;
③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
超几何分布的适用范围件及本质
(1)适用范围:
①考察对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
【方法技巧与总结】
超几何分布和二项分布的区别
(1)超几何分布需要知道总体的容量,而二项分布不需要;
(2)超几何分布是“不放回”抽取,在每次试验中某一事件发生的概率是不相同的;
而二项分布是“有放回”抽取(独立重复),在每次试验中某一事件发生的概率是相同的.
1(2025·山东烟台·一模)为加强中小学科学教育,某市科协,市教育局拟于2025年4月联合举办第四届全市中小学机器人挑战赛.比赛共设置穿越障碍、搬运物品两个项目.每支参赛队先挑战穿越障碍项目,挑战成功后,方可挑战且必须挑战搬运物品项目.每支参赛队每个项目至多挑战两次,若第一次挑战成功,则获得奖金2000元,该项目不再挑战:若第一次挑战失败,则必须第二次挑战该项目,若第二次挑战成功,则获得奖金1000元,否则,不获得奖金.假设甲参赛队在每个项目中,第一次挑战成功的概率为,第一次挑战失败但第二次挑战该项目成功的概率为;两个项目是否挑战成功相互独立.
(1)设事件“甲参赛队两个项目均挑战成功”,求;
(2)设比赛结束时,甲参赛队获得奖金数为随机变量,求的分布列;
(3)假设本届比赛共有36支参赛队,且根据往届比赛成绩,甲参赛队获得奖金数近似为各参赛队获得奖金数的平均水平.某赞助商计划提供全部奖金,试估计其需提供的奖金总额.
2(24-25高三上·江西·阶段练习)随着教育部的“双减政策”落地,为了丰富高中基础年级学生的课余生活,2025年元旦期间,某校师生举行一场惊心动魄的足球比赛;由教师代表队、高一学生代表队和高二学生代表队组成、得分规则为:球队胜一场积3分,平一场积1分,负一场积0分.由教师代表队与高一学生代表队和高二学生代表队的两场比赛.根据前期比赛成绩,教师代表队与高一学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为;由教师代表队与高二学生代表队比赛:教师代表队胜的概率为,平的概率为,负的概率为,且两场比赛结果相互独立.
(1)求教师代表队与高二学生代表队比赛获得积分超过教师代表队与高一学生代表队比赛获得积分的概率;
(2)用表示教师代表队两场比赛获得积分之和,求的分布列与期望.
题型三 随机变量与正态分布
1(2025·吉林延边·一模)某生物研究小组准备探究某地区棉花长绒分布规律,据统计该地区棉花有,个品种,且这两个品种的种植数量大致相等,记种棉花和种棉花的绒长(单位:)分别为随机变量,,其中服从正态分布,服从正态分布.
(1)从该地区的棉花中随机采摘一朵,求这朵棉花的绒长在区间的概率;
(2)记该地区棉花的绒长为随机变量,若用正态分布来近似描述的分布,请你根据(1)中的结果,求参数和的值(精确到0.1);
(3)在(2)的条件下,从该地区的棉花中随机采摘3朵,记这3朵棉花中绒长在区间的个数为,求的分布列及数学期望(分布列写出计算表达式即可).参考数据:若,则,,.
2(24-25高三上·江西南昌·阶段练习)近年来,随着电脑、智能手机的迅速普及,我国在线教育行业出现了较大的发展.某在线教育平台为了解利用该平台学习的高一学生化学学习效果,举行了一次化学测试,并从中随机抽查了200名学生的化学成绩,将他们的成绩分成以下6组:,,,,,统计结果如下面的频数分布表所示.
组别
频数
20
30
40
60
30
20
(1)现利用分层抽样的方法从前3组中抽取9人,再从这9人中随机抽取4人调查其成绩不理想的原因,试求这4人中至少有2人来自前2组的概率.
(2)高一学生的这次化学成绩(单位:分)近似地服从正态分布,其中近似为样本平均数,近似为样本的标准差,并已求得.且这次测试恰有2万名学生参加.
(i)试估计这些学生这次化学成绩在区间内的概率(同一组中的数据用该组区间的中点值为代表);
(ii)为了提升学生的成绩,该平台决定免费赠送给在平台学习的学生若干学习视频,具体赠送方案如下:
方案1:每人均赠送25小时学习视频;
方案2:这次测试中化学成绩不高于56.19分的学生赠送40小时的学习视频,化学成绩在内的学生赠送30小时的学习视频,化学成绩高于84.81分的学生赠送10小时的学习视频.问:哪种方案该平台赠送的学习视频总时长更多?请根据数据计算说明.
参考数据:则,.
(24-25高三下·河南·阶段练习)在某市举行的一次市质检考试中,为了调查考试试题的有效性以及试卷的区分度,该市教研室随机抽取了参加本次质检考试的100名学生的数学考试成绩,并将其统计如下表所示.
成绩X
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
人数Y
6
24
42
20
8
(1)已知本次质检中的数学测试成绩,其中μ近似为样本的平均数,近似为样本方差,若该市有5万考生,试估计数学成绩介于90~120分的人数;(以各组的区间的中点值代表该组的取值)
(2)现按分层抽样的方法从成绩在[75,85)以及[115,125]之间的学生中随机抽取7人,再从这7人中随机抽取3人进行试卷分析,记被抽取的3人中成绩在[75,85)之间的人数为X,求X的分布列以及期望E(X).
参考数据:若,则,,.
2(2022·重庆·模拟预测)在“十三五”期间,我国的扶贫工作进入了“精准扶贫”阶段,到2020年底,全国830个贫困县全部脱贫摘帽,最后4335万贫困人口全部脱贫,这是我国脱贫攻坚史上的一大壮举.重庆市奉节县作为国家贫困县之一,于2019年4月顺利脱贫摘帽,因地制宜发展特色产业,是奉节脱贫攻坚的重要抓手.奉节县规划发展了以高山烟叶、药材、反季节蔬菜;中山油橄榄、养殖;低山脐橙等为主的产业格局,各类特色农产品已经成为了当地村民的摇钱树.尤其是奉节脐橙,因“果皮中厚、脆而易剥,肉质细嫩化渣、无核少络,酸甜适度,汁多爽口,余味清香”而闻名.为了防止返贫,巩固脱贫攻坚成果,各职能部门对脐橙种植、销售、运输、改良等各方面给予大力支持.奉节县种植的某品种脐橙果实按果径X(单位:mm)的大小分级,其中为一级果,为特级果,一级果与特级果统称为优品.现采摘了一大批此品种脐橙果实,从中随机抽取1000个测量果径,得到频率分布直方图如下:
(1)由频率分布直方图可认为,该品种脐橙果实的果径X服从正态分布,其中μ近似为样本平均数,近似为样本标准差s,已知样本的方差的近似值为100.若从这批脐橙果实中任取一个,求取到的果实为优品的概率(同一组中的数据用该组区间的中点值代表)
(2)这批采摘的脐橙按2个特级果和n(,且)个一级果为一箱的规格进行包装,再经过质检方可进入市场.质检员质检时从每箱中随机取出两个果实进行检验,若取到的两个果实等级相同,则该箱脐橙记为“同”,否则该箱脐橙记为“异”.
①试用含n的代数式表示抽检的某箱脐橙被记为“异”的概率p;
②设抽检的5箱脐橙中恰有3箱被记为“异”的概率为,求函数的最大值,及取最大值时n的值.
参考数据:若随机变量X服从正态分布,则,,.
题型四 独立性检验
1
1(2025·山东聊城·一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
1(24-25高三下·上海·阶段练习)某兴趣小组对高三刚结束的物理测试成绩进行随机调查,将所有选考物理的考生按是否同时选考化学分为A、B两类,并从中随机抽取100名考生的成绩,整理数据如下表(单位:人)
物理成绩学生分类
A类男生
2
8
15
8
B类男生
3
10
20
4
A类女生
3
4
2
1
B类女生
10
6
4
0
(1)估计该校高三学习物理男生人数与女生人数之比;
(2)求A类考生物现平均成绩的估计值(同一组中的数据用该组区间中点值代表,结果四舍五入到整数);
(3)把成绩在称为“合格”,成绩在称为“不合格”,是否有95%的把握认为该校考生的本次物理成绩合格与否和性别有关?
附:,其中.
题型五 线性回归方程
1(24-25高三下·广东·开学考试)习近平总书记指出:做好工作要“完整,准确,全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展”.某部门在对新发展理念组织了全面学习后,对同一工作小组中的5名员工采取如下考核制度:
①在本季度末,从部门中另抽120人,每人1票,对这5名员工进行投票;
②在本季度末,统计这5名员工本季度创造的营销收入.
记本季度创造的营销收入为(单位:千元),所得票数为,现将5人的情况用数对表示:关于的相关系数为,部门规定:若,则认为本次统计数据异常.
(1)证明:本次统计数据异常;
(2)经查验,本季度创造的营销收入最少的员工的数据存在异常,将其剔除后,求该工作小组关于的线性回归方程.(系数精确到个位数)
附:对于一组数据,回归直线方程的斜率和截距的最小二乘法估计公式分别为:;相关系数.
参考数据:,.
2(24-25高三上·山西·期末)随着国内人均消费水平的提高,居民的运动健身意识不断增强,加之健康与解压需求的增长,使得健身器材行业发展趋势强劲,下表为年中国健身器材市场规模(单位:百亿元),其中年年对应的代码依次为.
年份代码
中国健身器材市场规模
(1)由上表数据可知,可用指数型函数模型拟合与的关系,请建立关于的归方程(,的值精确到);
(2)数据显示年购买过体育用品类的中国消费者中购买过运动防护类的占比为,用频率估计概率,现从年购买过体育用品类的中国消费者中随机抽取人,记购买过运动防护类的消费者人数为,求的分布列及数学期望.
参考数据:
其中,.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
1(24-25高三上·重庆·阶段练习)一年一度的“双11”促销活动落下帷幕,各大电商平台发布的数据显示,在消费品以旧换新、家电政府补贴等促消费政策和活动的带动下,消费市场潜能加速释放,带动相关商品销售保持增长. 经过调研,得到2019年到2024年“双11”活动当天某电商平台线上日销售额(单位: 百亿元)与年份(第年)的6组数据(时间变量的取值依次为),对数据进行处理,得到如下散点图(图1)及一些统计量的值. 其中.
48.7
3.5
91
1204
1.1
9.4
388.1
分别用两种模型:①;②进行拟合,得到相应的回归方程,并进行残差分析,得到如图所示的残差图(图2)(残差值真实值预测值).
(1)根据题中信息,通过残差图比较模型①,②的拟合效果,应选择哪一个模型进行拟合?请说明理由;
(2)根据(1)中所选模型,
(i)求出关于的经验回归方程(系数精确到0.1);
(ⅱ)若该电商平台每年活动当天线上日销售额与当日营销成本及年份存在线性关系: ,则在第几年活动当日营销成本的预测值最大?
参考公式: ;参考数据:.
2(2025·河北秦皇岛·一模)近几年我国新能源汽车产业快速发展,据行业数据显示,新能源汽车的数量在不断增加.下表为某城市统计的近5年新能源汽车的新增数量,其中为年份代号,(单位:万辆)代表新增新能源汽车的数量.
年份
2020
2021
2022
2023
2024
年份代号
1
2
3
4
5
新增新能源汽车万辆
1.2
1.8
2.5
3.2
3.8
(1)计算样本相关系数,判断是否可以用线性回归模型拟合与的关系,当时,可以认为两个变量有很强的线性相关性;否则,没有很强的线性相关性.
(2)求关于的经验回归方程,并据此估计该城市2026年的新增新能源汽车的数量;
参考数据:.参考公式:.
题型六 条件概率与全概率公式
1(2025·山西·一模)新高考数学试卷中共3道多选题,每题满分为6分,在每小题给出的选项中,有多项符合题目要求,全部选对得6分,部分选对得部分分(如果有两个选项符合题目要求,选对一个得3分;如果有三个选项符合题目要求,选对一个得2分;有错选或不选,得0分),某数学兴趣小组研究多选题时发现:随机事件“多项选择题中,有两个选项符合题目要求”和“多项选择题中,有三个选项符合题目要求”的概率均为.若学生解答某多选题时完全没有思路,只能通过随机选择的方式来完成作答,且选择四个选项的可能性是相同的.
(1)已知某题有三个选项符合题目要求,小张通过随机选择选项的方式来完成作答,且只选一个选项作答的概率为,选两个选项作答的概率为,选三个选项作答的概率为,试求小张该题得0分的概率;
(2)小王在解答完全没有思路的多选题时,有两种策略,一是“随机选择一个选项作答”,二是“随机选择两个选项作答”,试写出小王用两种策略得分的分布列和数学期望.
2(2025·四川·一模)某保险公司随机选取了200名不同驾龄的投保司机,调查他们投保后一年内的索赔情况,结果如下:
单位:人
一年内是否索赔
驾龄
合计
不满10年
10年以上
是
10
5
15
否
90
95
185
合计
100
100
200
(1)依据小概率值的独立性检验,分析表中的数据,能否据此推断司机投保后一年内是否索赔与司机的驾龄有关?
(2)保险公司的大数据显示,每年投保的新司机索赔的概率为,投保的老司机索赔的概率均为.假设投保司机中新司机的占比为.随机选取一名投保司机,记事件“这名司机在第年索赔”为,事件“这名司机是新司机”为.已知.
(i)证明:;
(ii)证明:,并给出该不等式的直观解释.
附:,
1(2025·山东·模拟预测)已知两个不透明的袋子中均装有若干个大小,质地完全相同的红球和白球,从袋中摸出一个红球的概率是,从袋中摸出一个红球的概率是.在每轮中,甲同学先选择一个袋子摸一次球并放回,乙再选择一个袋子摸一次球并放回,则该轮结束.已知在每轮中甲选两袋的概率均为.如果甲选袋,则乙选袋的概率为;如果甲选袋,则乙选的概率为.
(1)若,求在一轮中乙从袋中摸出红球的概率;
(2)求在一轮中乙摸出红球的概率;
(3)若甲,乙两位同学进行了3轮摸球.乙同学认为,越大,3轮摸球后他摸出2个红球的概率越大,你同意他的观点吗?请说明理由.
2 (2024·广东汕头·三模)11分制乒乓球比赛规则如下:在一局比赛中,每两球交换发球权,每赢一球得1分,先得11分且至少领先2分者胜,该局比赛结束:当某局比分打成10∶10后,每球交换发球权,领先2分者胜,该局比赛结束现有甲、乙两人进行一场五局三胜、每局11分制的乒乓球比赛,比赛开始前通过抛掷一枚质地均匀的硬币来确定谁先发球假设甲发球时甲得分的概率为,乙发球时甲得分的概率为,各球的比赛结果相互独立,且各局的比赛结果也相互独立.
(1)若每局比赛甲获胜的概率,求该场比赛甲获胜的概率.
(2)已知第一局目前比分为10∶10,求
(ⅰ)再打两个球甲新增的得分的分布列和均值;
(ⅱ)第一局比赛甲获胜的概率;
3(2024·上海奉贤·三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.
(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;
(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:
假设1:各回合比赛相互独立;
假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;
求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?
题型七 概率统计与其他知识点结合
1(2025·四川成都·二模)某答题挑战赛规则如下:比赛按轮依次进行,只有答完一轮才能进入下一轮,若连续两轮均答错,则挑战终止;每一轮系统随机地派出一道通识题或专识题,派出通识题的概率为,派出专识题的概率为.已知某选手答对通识题与专识题的概率分别为,且各轮答题正确与否相互独立.
(1)求该选手在一轮答题中答对题目的概率;
(2)记该选手在第轮答题结束时挑战依然未终止的概率为,
(i)求;
(ii)证明:存在实数,使得数列为等比数列.
2(2025·湖南·模拟预测)高三某班为缓解学生高考压力,班委会决定在周班会课上进行“听音乐、猜歌名”的趣味游戏比赛,现将全班学生分为组,每组人,剩余的学生做裁判.比赛规则如下:比赛共分为两轮,第一轮比赛中个小组分三场进行比赛,每场比赛有个小组参加,在规定的时间内猜对歌名最多的小组获胜,获胜的三个小组进入第二轮比赛,第二轮进行一场比赛,选出获胜队伍.已知甲、乙、丙个小组的学生能成功猜对歌名的概率分别为、、.
(1)现从乙组中任选一名学生进行歌曲试猜,记首歌曲中猜对的歌曲数为,求随机变量的数学期望;
(2)若从甲、乙、丙个小组中任选一名学生参加猜歌游戏,求该学生猜对歌曲的概率;
(3)若第二轮比赛中丁、戊两组并列第一,则设置以下游戏决定最终获胜的小组,游戏规则如下:从丁、戊小组中任选一名代表,从装有个白球和个红球的不透明的盒子中有放回地随机摸出一个球,摸出白球记分,摸出红球记分,以分开始计分,恰好获得分或分则结束摸球.若该代表获得分,则该代表所在小组获得胜利,否则另外一组获得胜利.若该代表来自丁组,试估计丁组获胜的概率.
1(2025·黑龙江哈尔滨·一模)“冰雪同梦,亚洲同心”,年第九届亚冬会在哈尔滨举办,本次赛事共有个大项,个分项,个小项,有来自个国家和地区,多名运动员参赛,是一场令人回味无穷的冬季体育盛会,亚冬会圆满结束后,我校团委组织学生参加与亚冬会有关的知识竞赛.为鼓励同学们积极参加此项活动,比赛规定:答对一题得两分,答错一题得一分,选手不放弃任何一次答题机会.已知小明报名参加比赛,每道题回答是否正确相互独立,且每次答对的概率不一定相等.
(1)若前三道试题,小明每道试题答对的概率均为,
①设,记小明答完前三道题得分为,求随机变量的分布列和数学期望;
②若小明答完前四道题得分的概率为,求小明答完前四题时至少答对三题的概率的最小值;
(2)若小明答对每道题的概率均为,因为小明答对第一题或前两题都答错,均可得到两分,称此时小明答题累计得分为,记小明答题累计得分为的概率为,求数列的通项公式.
2(24-25高三下·辽宁·阶段练习)现有一个质地均匀的骰子,按照下述规则从左到右依次记录字符:抛掷骰子,点数为1,2,3时,记录字符AA;点数为4时记录字符B,点数为5时记录字符C,点数为6时记录字符D.继续投掷骰子,按照相同的规则向右记录AA,B,C,D的字符.例如抛掷5次骰子得到的点数依次是5,6,2,3,4,则记录的字符为CDAAAAB,共7个字符,其中从左向右第4个字符为A,第7个字符为B.
(1)抛掷3次骰子,并记录字符.记字符中A的个数为,求;
(2)抛掷次骰子,并记录字符.记第个字符为的概率为.
(i)求证:是常数列;
(ii)求的前项和.
1.(24-25高三上·江西宜春·期末)2024年5月22日至5月28日是第二届全国城市生活垃圾分类宣传周,本次宣传周的主题为“践行新时尚分类志愿行”某中学高一年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,分为五组,其中第二组的频数是第一组频数的2倍,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求的值,并估计这次竞赛成绩的中位数(同一组中的数据用该组区间的中点值作代表);
(2)某老师在此次竞赛成绩中抽取了10名学生的分数:,已知这10个分数的平均数,标准差,若剔除其中的75和85两个分数,求剩余8个分数的平均数与方差.
2.(2025·陕西西安·一模)某商场进行抽奖活动,设置摸奖箱内有红球个,白球个,黑球个,小球除颜色外没有任何区别.规定:摸到红球记分,摸到白球记分,摸到黑球记分.抽奖人摸个球为一次抽奖,总分记为,若,则获奖.
方案一:从中一次摸个球,记录分数后不放回.
方案二:从中一次摸个球,记录分数后放回.
(1)若甲顾客按照方案一摸球记分,求甲顾客获奖的概率;
(2)若乙顾客按照方案一摸球记分,求第二次摸到红球条件下,乙顾客获奖的概率;
(3)若丙顾客按照方案二摸球记分,求的分布列和数学期望.
3.(24-25高三下·河北石家庄·开学考试)2024年6月5日《中国教育报》刊发了教育部的“呵护好孩子的眼睛,共创光明的未来”的文章,其中特别强调“幼儿单次使用电子产品的时间不宜超过15分钟,累计每天不超过1小时”等内容.为切实提升儿童青少年视力健康整体水平,某学校积极推进近视综合防控,落实“明眸”工程,开展了近视原因的调查以备有效进行预防.在已近视的学生中随机调查了100人,同时在未近视的学生中随机调查了100人,得到如下数据:
电子产品
近视
未近视
非长时间使用电子产品
40
70
长时间使用电子产品
60
30
(1)依据小概率值的独立性检验,能否认为患近视与长时间使用电子产品有关?
(2)用频率估计概率,从已经近视的学生中采用随机抽样的方式选出1名学生,利用“物理+药物”治疗方案对该学生进行治疗.已知“物理+药物”治疗方案的治愈数据如下:在已近视的学生中,对非长时间使用电子产品的学生的治愈率为,对长时间使用电子产品的学生的治愈率为,求该近视学生被治愈的概率;
(3)若按样本数据利用分层随机抽样的方法从近视学生中抽取5人,再从这5人中抽取3人进行近视矫正实验,记表示这3人中长时间使用电子产品的人数,求的分布列与数学期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
4.(24-25高三下·北京·阶段练习)无人驾驶技术是汽车研发领域的一个重要方向.某学校技术俱乐部研发了一个感知路况障碍的小汽车模型,该模型通过三个传感器共同判断路段是否有路障.在对该模型进行测试中,该俱乐部同学寻找了个不同的路段作为测试样本,数据如下表:
测试
结果真实
路况
传感器1
传感器2
传感器3
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
无障碍
4
15
1
1
15
4
8
12
0
有障碍
40
10
10
45
5
10
45
10
5
假设用频率估计概率,且三个传感器对路况的判断相互独立.
(1)从这80个路段中随机抽取一个路段,求传感器1对该路况判断正确的概率;
(2)从这80个路段中随机抽取一个有障碍的路段进行测试,设为传感器1和传感器2判断正确的总路段数,求的分布列和数学期望;
(3)现有一辆小汽车同时装载了以上3种传感器.在通过某路段时,只要3个传感器中一个判断有障碍或无法识别,则小汽车减速.那么是否可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于?(结论不要求证明)
5.(24-25高三上·云南德宏·期末)为更好的发挥高考的育才作用,部分新高考数学试卷采用了多选题这一题型.教育部考试中心通过科学测量分析,指出该题型扩大了试卷考点的覆盖面,有利于提高试卷的区分度,也有利于提高学生的得分率.多选题评分规则如下:对于多选题,每个小题给出的四个选项中,有两项或三项是正确的,满分6分.全部选对得6分,有错选或全不选得0分,正确答案为两项时,选对1个得3分;正确答案为三项时,选对1个得2分,选对2个得4分.多选题正确答案是两个选项的概率为p,正确答案是三个选项的概率为(其中).
(1)在一次模拟考试中,学生甲对某个多选题完全不会,决定随机选择一个选项,若,求学生甲该题得2分的概率;
(2)针对某道多选题,学生甲完全不会,此时他有三种答题方案:
Ⅰ:随机选一个选项; Ⅱ:随机选两个选项; Ⅲ:随机选三个选项.
(i)若,且学生甲选择方案Ⅰ,求本题得分的数学期望;
(ii)以本题得分的数学期望为决策依据,p的取值在什么范围内唯独选择方案Ⅰ最好?
6.(2025高三下·全国·专题练习)小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20家服装店,统计得到了它们的面积X(单位:)和日均客流量Y(单位:百人)的数据,并计算得.
(1)求Y关于X的回归直线方程;
(2)已知服装店每天的经济效益,该商场现有的商铺出租,根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺?
附:回归直线的斜率和截距的最小二乘估计分别为:.
7.(2025·河北保定·一模)某工厂为了解员工绩效分数达标情况与员工性别的关系,随机对该厂男、女各30名员工的绩效分数达标情况进行调查,整理得到如下列联表:
单位:人
性别
绩效分数达标情况
合计
未达标
达标
男
20
10
30
女
5
25
30
合计
25
35
60
(1)经计算,所调查的男员工绩效分数的平均数为26;女员工绩效分数的平均数为34,求这60人绩效分数的平均数.
(2)根据上表数据,依据小概率值的独立性检验,能否据此推断绩效分数达标情况与性别有关联?
(3)该厂为激励员工,规定每月绩效分数的第一名奖励1千元,其他名次无奖励.甲为该厂员工,他在工厂开工的第一个月赢得奖励的概率为,从第二个月开始,若上个月没有赢得奖励,则这个月赢得奖励的概率为;若上个月赢得奖励,则这个月仍赢得奖励的概率为,求甲在前两个月所得奖金总额(单位:千元)的分布列和数学期望.
附:
0.1
0.01
0.001
2.706
6.635
10.828
参考公式:,其中.
8.(2025·江西上饶·一模)2024年7月26日至8月11日在法国巴黎举行了夏季奥运会.为了普及奥运知识,大学举办了一次奥运知识竞赛,竞赛分为初赛与决赛,初赛通过后才能参加决赛.
(1)初赛从6道题中任选2题作答,2题均答对则进入决赛.已知这6道题中小王能答对其中4道题,求小王在已经答对一题的前提下,仍未进入决赛的概率;
(2)大学为鼓励大学生踊跃参赛并取得佳绩,决定对进入决赛的参赛大学生给予一定的奖励.奖励规则如下:对于进入决赛的每名大学生允许连续抽奖3次,中奖1次奖励120元,中奖2次奖励180元,中奖3次奖励360元,若3次均未中奖,则只奖励60元,假定每次中奖的概率均为,且每次是否中奖相互独立.
(Ⅰ)记一名进入决赛的大学生恰好中奖1次的概率为,求的极大值;
(Ⅱ)大学数学系共有9名大学生进入了决赛,若这9名大学生获得的总奖金的期望值不小于1120元,试求此时的取值范围.
9.(2025·湖北·二模)已知某商店出售商品A,据统计分析,发现顾客对商品A的需求量相对稳定,每周内对商品A的不同需求量(单位:个)与概率的数据如下:
对A的需求量
0
1
2
3
概率
若以商品A的库存作为供给量,为了改善经营,该商店决定每周末对商品A进行盘点存货:如果商品A都售出了,则在周末及时采购2个新的商品,只要商品A还有1个存货,就不采购新的商品.记为该商店第周开始时商品A的供给量,假设.
(1)求的分布列;
(2)记为第周开始时供给量的概率向量,随着的增大,若,则趋向一个定常态分布,记这个定常态分布为.
(i)求商品A的定常态分布;
(ii)从长远来看,求该商店改善经营后商品A需求大于供给的概率.
10.(24-25高三下·云南昆明·阶段练习)云南花卉产业作为云南全力打造世界一流“绿色食品牌”的重点产业之一、从起步发展至今仅四十多年的时间,取得了令人瞩目的成绩.目前云南已成为全球公认的三大最适宜鲜切花种植的区域之一,鲜切花种植面积和产量位居全球第一,全省花卉种植面积稳定在190万亩左右.近8年云南省花卉种植面积统计数据及散点图如图
(1)经计算得下表中数据,根据散点图,在模型①:与模型②:,(均为常数)中,选择一个更适合作为云南省花卉种植面积关于年份代码的回归方程类型,求出关于的回归方程;
1.3
165.0
204
17.5
42
3.5
6448.3
1901.5
其中.
(2)运输过程中,为保证鲜切花质量,需对其存活天数进行研究.一品种鲜切花存活天数为随机变量,且最多只能存活天,研究人员发现,存活天数为的样本在存活天数超过的样本里占,存活天数为1的样本在全体样本中占.
①求;
②用表示该品种鲜切花存活天数的数学期望.
附:.
一、解答题
1.(2024·新高考Ⅰ卷·高考真题)设m为正整数,数列是公差不为0的等差数列,若从中删去两项和后剩余的项可被平均分为组,且每组的4个数都能构成等差数列,则称数列是可分数列.
(1)写出所有的,,使数列是可分数列;
(2)当时,证明:数列是可分数列;
(3)从中任取两个数和,记数列是可分数列的概率为,证明:.
2.(2024·新课标Ⅱ卷·高考真题)某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
3.(2024·全国甲卷·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
4.(2023·新课标Ⅰ卷·高考真题)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.
5.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
6.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
7.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;
(2)实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
实验组的小白鼠体重的增加量从小到大排序为:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:
对照组
实验组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
附:
0.100
0.050
0.010
2.706
3.841
6.635
8.(2022·全国乙卷·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
9.(2022·全国甲卷·高考真题)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
10.(2022·新高考全国Ⅰ卷·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
11.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
12.(2021·新高考全国Ⅰ卷·高考真题)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
13.(2021·新高考全国Ⅱ卷·高考真题)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,.
(1)已知,求;
(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程:的一个最小正实根,求证:当时,,当时,;
(3)根据你的理解说明(2)问结论的实际含义.
6 / 15
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$