内容正文:
2026届高三数学三轮冲刺复习讲义
统计与概率:回归方程问题、独立性检验问题复习讲义
考点目录
回归方程问题
独立性检验问题
知识点解析
考点一 线性回归方程问题
知识点
1. 核心公式
· 样本中心点:
· 回归系数:
· 截距:
· 回归直线:
1. 性质:回归直线必过样本中心点;正相关,负相关
1. 题型:求回归方程、预测估值、判断相关性强弱
解题原理
用样本数据统计量拟合线性关系,依靠最小二乘法求出最优拟合直线,用直线近似刻画变量线性变化规律。
解题思路
1. 计算、,再算分子分母求和式
1. 代入公式求出,再求
1. 写出完整回归直线方程
1. 代入自变量数值,完成数值预测
考点二 独立性检验问题
知识点
1. 列联表:四格表,区分两组分类变量
1. 卡方公式:
·
为总样本数
1. 临界值:3.841、6.635、10.828
1. 结论:越大,两个变量关联性越强
解题原理
通过计算卡方统计量,和临界值比对,判断两类分类变量是否相互独立,即判断有无关联。
解题思路
1. 整理数据,填写完整列联表
1. 确定,代入公式计算
1. 对照临界值表比较大小
1. 下结论:是否有关、把握程度多少
真题速递
1.(2025·全国一卷·高考真题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
20
180
200
未患该疾病
780
20
800
合计
800
200
1000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附,
0.050
0.010
0.001
3.841
6.635
10.828
考点一 回归方程问题
【例题分析】
例1.(2026·陕西西安·模拟预测)某种农作物可以生长在滩涂和盐碱地,将海水稀释后对其进行灌溉.某实验基地为了研究海水浓度对亩产量的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.
海水浓度
3
4
5
6
7
亩产量
0.57
0.53
0.44
0.36
0.30
残差
0.02
0
绘制散点图发现,可以用一元线性回归模型拟合与的相关关系,用最小二乘法计算得关于的经验回归方程为.
(1)求,,的值;
(2)请计算该回归模型的决定系数(精确到0.01),并评价其拟合效果.(若,就认为拟合效果好;若,就认为拟合效果一般;若,就认为拟合效果差)
附:决定系数,其中.
例2.(2026·陕西咸阳·模拟预测)某健身俱乐部为研究会员每周锻炼时长与体重减少量的关系,随机抽取10名会员的数据如下表:
会员序号
1
2
3
4
5
6
7
8
9
10
总和
每周锻炼时长x/小时
3
4
2
5
6
4
5
3
4
4
40
体重减少量y/千克
1.0
1.5
1.0
2.0
2.5
1.8
2.0
1.0
1.6
2.0
16.4
经过计算得,,.
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用样本相关系数加以说明(结果精确到0.01);
(2)求经验回归方程(,的结果均精确到0.01);
(3)该俱乐部在推广了一项激励措施后,发现会员平均每周锻炼时长增加2个小时,实际观测到的平均体重减少量增加了0.8千克.请结合回归分析结果,判断该回归模型是否具有参考价值,并给出合理的解释.
参考公式及数据:样本相关系数,经验回归方程中斜率和截距的最小二乘估计公式分别为,.,.
例3.(2026·山东济南·三模)国内某摩托车企2025年3月—9月新车月销售量y(单位:百台)的数据如下表:
月份
3月
4月
5月
6月
7月
8月
9月
月份代号x
1
2
3
4
5
6
7
月销售量y
11
16
18
21
24
28
29
计算得.
(1)求y关于x的线性回归方程;
(2)现从这7个月的月销售量数据中随机抽取3个,记抽取的数据中不低于20(单位:百台)的数据个数为随机变量X,求X的分布列与数学期望.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,.
【变式训练】
变式1.(2026·江苏南通·三模)某科研团队研发新一代硫化物固态锂电池,测试了5块同批次电池的循环次数x(次)与剩余容量y(单位:),得到如下数据:
x(次)
100
200
300
400
500
y(Ah)
9.8
9.5
9.2
8.9
8.6
(1)求y关于x的线性回归方程,预测当循环次数为1000次时电池的剩余容量;并计算样本相关系数r,据此说明线性回归模型拟合x与y关系的合理性.
(2)该团队另有10块同批次电池,其中改性优化电池6块,普通电池4块;改性优化电池中有4块循环寿命超过1000次,普通电池循环寿命均未超过1000次,规定循环寿命超过1000次为达标.现从这10块电池中随机抽取3块进行破坏性安全测试,记抽取的3块中达标的电池数为,求的分布列和数学期望.
参考公式:回归直线的斜率和截距的最小二乘估计分别为
,,
相关系数
变式2.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
变式3.(2026·河南·模拟预测)为研究新能源汽车的销售量变化情况,现统计了某市2025年第二、第三季度每个月的销售量(单位:万辆)如下表所示.
月份
4月
5月
6月
7月
8月
9月
月份代号x
1
2
3
4
5
6
销售量y
1.5
2.3
2.8
3.2
3.7
4.5
(1)求这6个月销售量数据的平均数和80%分位数;
(2)已知该市销售量y与月份代号x具有很强的线性相关关系,求y关于x的经验回归方程,并预测2025年12月份的销售量.
附:经验回归方程的斜率与截距的最小二乘估计公式分别为,,,.
考点二 独立性检验问题
【例题分析】
例1.(2026·浙江金华·三模)2026年中央广播电视总台春节联欢晚会设立义乌分会场,向全球展现了“世界小商品之都”的商贸活力与新春年味.某机构为研究观众对义乌分会场节目的满意度是否与了解义乌小商品市场有关,从观看了义乌分会场节目的观众中随机抽取了200人进行问卷调查,得到如下列联表:
对节目基本满意
对节目特别满意
合计
不了解义乌小商品市场
60
40
100
了解义乌小商品市场
30
70
100
合计
90
110
200
(1)依据小概率值的独立性检验,分析观众对义乌分会场节目的满意度是否与了解义乌小商品市场有关;
(2)节目组设置了摸“义乌小商品盲盒”游戏环节,观众每次游戏有两种结果:
摸到“一锤定音”,概率为,此时观众获得100元奖金,游戏结束;
摸到“再接再厉”,概率为,此时观众获得10元奖金,并继续游戏,奖金累计计入总奖金;
若一名观众参与游戏最多可摸10次,10次均未摸到“一锤定音”,游戏也结束.求游戏结束时该观众获得的总奖金数X的均值.
附:,其中
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
例2.(2026·贵州毕节·三模)“阳光杯”中学生篮球联赛是毕节市威宁自治县极具本土特色的体育赛事,赛事深度融合威宁多民族文化与高原风情,是当地群众最喜爱的体育赛事之一.威宁县某中学为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,随机抽取该校男生和女生各80名作为样本.设事件“了解‘阳光杯’中学生篮球联赛”,“学生为女生”,已知,.
(1)完成下列列联表,并依据的独立性检验,能否认为该校学生对“阳光杯”中学生篮球联赛的了解情况与性别有关联?
了解
不了解
合计
男生
女生
合计
(2)现从该样本不了解“阳光杯”中学生篮球联赛的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取2人,设抽取的2人中男生的人数为X,求X的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
例3.(2026·重庆渝中·三模)2026 年 4 月 19 日, 第二届人形机器人半程马拉松在北京亦庄举行, 来自各地的机器人参赛队伍同场竞技,引发广泛关注.为研究 “机器人是否搭载智能避障系统” 与 “能否完成全程比赛” 之间是否存在关联,某科研团队对本次参赛的 500 台机器人进行统计,得到如下列联表 (单位: 台):
完成比赛
未完成比赛
搭载智能避障系统
180
70
未搭载智能避障系统
120
130
(1)根据小概率值 的独立性检验,能否认为 “机器人是否搭载智能避障系统” 与 “能否完成全程比赛” 有关?
(2)从该 500 台机器人中,采用按比例分层抽样的方法(以是否搭载智能避障系统分类),抽取一个容量为 10 的样本.再从这10台机器人中,不放回地随机抽取3台,设其中 “搭载智能避障系统” 的台数为.求的数学期望 .
附: ,其中 .
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式训练】
变式1.(2026·河北沧州·三模)2025年11月5日,第八届中国国际进口博览会在国家会展中心(上海)举办,某企业参展的产品有甲、乙两款机器人,为调查消费者喜爱程度与产品的类型是否有关,在展览期间设置投票箱,随机抽取了部分观众进行现场投票,得到如下列联表:
类型
是否喜爱
合计
喜爱
不喜爱
甲
2m
4m
6m
乙
9m
3m
12m
合计
11m
7m
18m
并根据小概率值的独立性检验,得出了“消费者喜爱程度与产品的类型有关”的结论.
附:.
0.01
0.005
0.001
6.635
7.879
10.828
(1)求正整数m的最小值.
(2)为感谢现场参与的观众,主办方设置了一个挑战机器人对抗赛活动.每人挑战局,每局比赛只有胜和负两种情况,无平局,若每局比赛参与者战胜机器人的概率为,胜者记3分,负者记1分.每局胜负不受其他因素的影响.
(ⅰ)若参与者甲与机器人共对抗4局,求其得分不少于10分的概率.
(ⅱ)记参与者的得分恰好比对抗的局数n多4分的概率为,若,求.
变式2.(2026·山东德州·模拟预测)秦腔是陕西最具代表性的戏曲艺术,2006年被列入第一批国家级非物质文化遗产名录.为研究是否喜爱秦腔与年龄之间的关系,并为传统文化保护提供数据支持,某文化调研队在西安市随机抽取了200名当地居民进行调查,得到如下列联表:
单位:人
秦腔
年龄
合计
40岁以下
40岁及以上
喜爱
45
45
90
不喜爱
75
35
110
合计
120
80
200
(1)年龄在40岁及以上的当地居民中,喜爱秦腔的概率为,求的估计值;
(2)根据小概率值的独立性检验,能否认为是否喜爱秦腔与年龄有关?
0.050
0.010
0.001
3.841
6.635
10.828
附:.
变式3.(2026·陕西榆林·模拟预测)飞机与高铁是人们远距离出行的两种方式,交通大学某班学生为了调查人们选择的远距离出行方式是否与年龄相关,随机抽取该市1000名市民进行调查,得到如下列联表:
低于40岁
不低于40岁
总计
选择飞机出行
100
选择高铁出行
300
总计
500
1000
(1)补全表中数据,依据小概率值的独立性检验,是否能够认为市民选择的远距离出行方式与年龄有关联?
(2)调查小组统计高铁站某处今天的客流量,从7:00开始,每小时作为一个时间段(为第1个时间段,为第2个时间段,……),得到如下数据:
时间段
1
2
3
4
5
客流量(千人)
1
1.5
2.5
3
3.5
若与线性相关,建立每个时间段客流量与时间段的经验回归方程,并预测的客流量.
附:,其中.
0.010
0.001
6.635
10.828
对于一组数据,,…,,其经验回归方程的斜率,.
2
学科网(北京)股份有限公司
$2026届高三数学三轮冲刺复习讲义
统计与概率:回归方程问题、独立性检验问题复习讲义
考点目录
回归方程问题
独立性检验问题
知识点解析
考点一 线性回归方程问题
知识点
1. 核心公式
· 样本中心点:
· 回归系数:
· 截距:
· 回归直线:
1. 性质:回归直线必过样本中心点;正相关,负相关
1. 题型:求回归方程、预测估值、判断相关性强弱
解题原理
用样本数据统计量拟合线性关系,依靠最小二乘法求出最优拟合直线,用直线近似刻画变量线性变化规律。
解题思路
1. 计算、,再算分子分母求和式
1. 代入公式求出,再求
1. 写出完整回归直线方程
1. 代入自变量数值,完成数值预测
考点二 独立性检验问题
知识点
1. 列联表:四格表,区分两组分类变量
1. 卡方公式:
·
为总样本数
1. 临界值:3.841、6.635、10.828
1. 结论:越大,两个变量关联性越强
解题原理
通过计算卡方统计量,和临界值比对,判断两类分类变量是否相互独立,即判断有无关联。
解题思路
1. 整理数据,填写完整列联表
1. 确定,代入公式计算
1. 对照临界值表比较大小
1. 下结论:是否有关、把握程度多少
真题速递
1.(2025·全国一卷·高考真题)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:
超声波检查结果组别
正常
不正常
合计
患该疾病
20
180
200
未患该疾病
780
20
800
合计
800
200
1000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值的独立性检验,分析超声波检查结果是否与患该疾病有关.
附,
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)
(2)有关
【分析】(1)根据古典概型的概率公式即可求出;
(2)根据独立性检验的基本思想,求出,然后与小概率值对应的临界值比较,即可判断.
【详解】(1)根据表格可知,检查结果不正常的人中有人患病,所以的估计值为;
(2)零假设为:超声波检查结果与患病无关,
根据表中数据可得,,
根据小概率值的独立性检验,我们推断不成立,即认为超声波检查结果与患该病有关,该推断犯错误的概率不超过.
考点一 回归方程问题
【例题分析】
例1.(2026·陕西西安·模拟预测)某种农作物可以生长在滩涂和盐碱地,将海水稀释后对其进行灌溉.某实验基地为了研究海水浓度对亩产量的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.
海水浓度
3
4
5
6
7
亩产量
0.57
0.53
0.44
0.36
0.30
残差
0.02
0
绘制散点图发现,可以用一元线性回归模型拟合与的相关关系,用最小二乘法计算得关于的经验回归方程为.
(1)求,,的值;
(2)请计算该回归模型的决定系数(精确到0.01),并评价其拟合效果.(若,就认为拟合效果好;若,就认为拟合效果一般;若,就认为拟合效果差)
附:决定系数,其中.
【答案】(1),,
(2)0.99,该模型拟合效果良好
【分析】(1)先求出,再代入求得,得回归方程,利用回归方程求得;
(2)根据公式计算出后比较可得.
【详解】(1),
,
将 代入可得,即.
所以经验回归方程为
因,则
又因,则
(2)
所以决定系数,故该模型拟合效果良好.
例2.(2026·陕西咸阳·模拟预测)某健身俱乐部为研究会员每周锻炼时长与体重减少量的关系,随机抽取10名会员的数据如下表:
会员序号
1
2
3
4
5
6
7
8
9
10
总和
每周锻炼时长x/小时
3
4
2
5
6
4
5
3
4
4
40
体重减少量y/千克
1.0
1.5
1.0
2.0
2.5
1.8
2.0
1.0
1.6
2.0
16.4
经过计算得,,.
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用样本相关系数加以说明(结果精确到0.01);
(2)求经验回归方程(,的结果均精确到0.01);
(3)该俱乐部在推广了一项激励措施后,发现会员平均每周锻炼时长增加2个小时,实际观测到的平均体重减少量增加了0.8千克.请结合回归分析结果,判断该回归模型是否具有参考价值,并给出合理的解释.
参考公式及数据:样本相关系数,经验回归方程中斜率和截距的最小二乘估计公式分别为,.,.
【答案】(1)y与x的线性相关程度很高,可用一元线性回归模型刻画
(2)
(3)答案见解析
【分析】(1) 利用相关系数公式直接代入数据求解即可;
(2) 利用公式,先求一次项系数,再利用经过样本中心点,可求出,从而可得回归直线方程;
(3)利用一次项系数可解释会员平均每周锻炼时长增加2个小时,预测平均体重减少量增加0.84千克,与实际效果相当,说明具有参考价值.
【详解】(1)解:由表可知,,
所以,
因为0.93非常接近1,
所以y与x的线性相关程度很高,可用一元线性回归模型刻画.
(2)由题意可知,
,
所以.
(3)由(2)可知,根据线性回归方程预测,会员平均每周锻炼时长增加2个小时,
预测平均体重减少量增加0.84千克,与实际增加值0.8千克较为接近,
所以实际结果与预测结果基本一致,说明该回归模型具有参考价值.
造成一定差异的原因可能是样本数据过少,或者造成体重减少的原因还受其他因素影响,
比如睡眠、饮食、锻炼强度以及效果等.
例3.(2026·山东济南·三模)国内某摩托车企2025年3月—9月新车月销售量y(单位:百台)的数据如下表:
月份
3月
4月
5月
6月
7月
8月
9月
月份代号x
1
2
3
4
5
6
7
月销售量y
11
16
18
21
24
28
29
计算得.
(1)求y关于x的线性回归方程;
(2)现从这7个月的月销售量数据中随机抽取3个,记抽取的数据中不低于20(单位:百台)的数据个数为随机变量X,求X的分布列与数学期望.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,.
【答案】(1)
(2)分布列见解析;
【分析】(1)根据所给数据,结合参考公式直接计算,即可求解;
(2)写出X的所有可能,求对应概率即可得出分布列,由期望公式计算期望即可.
【详解】(1),,,根据参考数据可得,
,
所以,故y关于x的线性回归方程为;
(2)数据中不低于20(百台)的月份:6月、7月、8月、9月,共4个;
低于20(百台)的有3个,随机变量X的可能取值为0,1,2,3,
;;
;;
故X的分布列为:
X
0
1
2
3
P
数学期望为.
【变式训练】
变式1.(2026·江苏南通·三模)某科研团队研发新一代硫化物固态锂电池,测试了5块同批次电池的循环次数x(次)与剩余容量y(单位:),得到如下数据:
x(次)
100
200
300
400
500
y(Ah)
9.8
9.5
9.2
8.9
8.6
(1)求y关于x的线性回归方程,预测当循环次数为1000次时电池的剩余容量;并计算样本相关系数r,据此说明线性回归模型拟合x与y关系的合理性.
(2)该团队另有10块同批次电池,其中改性优化电池6块,普通电池4块;改性优化电池中有4块循环寿命超过1000次,普通电池循环寿命均未超过1000次,规定循环寿命超过1000次为达标.现从这10块电池中随机抽取3块进行破坏性安全测试,记抽取的3块中达标的电池数为,求的分布列和数学期望.
参考公式:回归直线的斜率和截距的最小二乘估计分别为
,,
相关系数
【答案】(1)线性回归方程为:;当循环次数为1000次时电池的剩余容量为;相关系数,用线性回归模型拟合二者关系是完全合理的.
(2)分布列如下:
数学期望为.
【详解】(1)由题意得:
,,
,,所以,
则,所以线性回归方程为:,
将代入得:,即:当循环次数为1000次时电池的剩余容量为.
又因为,所以相关系数,
,表示完全负线性相关,说明循环次数与剩余容量之间存在极强的负线性关系,因此用线性回归模型拟合二者关系是完全合理的。
(2)由题意可知:10块同批次电池中,4块达标,6块未达标,抽取的3块中达标的电池数为,则可能取值为0,1,2,3.
,,,,
所以达标的电池数的分布列为:
数学期望.
变式2.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)更适合,
(2)不能
【分析】(1)根据图形,即可作出判断,再将非线性回归方程转化成线性回归方程,再结合条件,求出,即可求解;
(2)根据条件,求出的值,结合条件,即可求解.
【详解】(1)由图可以判断,更适合作为未佩戴头盔人数与天数的回归方程类型,
由,得到,因为,则,
则,所以,则.
(2)零假设:市民佩戴头盔与性别无关联.
根据列联表中的数据,经计算得到:
,
根据小概率值的独立性检验,我们没有理由认为不成立,即认为市民佩戴头盔与性别没有关联.
变式3.(2026·河南·模拟预测)为研究新能源汽车的销售量变化情况,现统计了某市2025年第二、第三季度每个月的销售量(单位:万辆)如下表所示.
月份
4月
5月
6月
7月
8月
9月
月份代号x
1
2
3
4
5
6
销售量y
1.5
2.3
2.8
3.2
3.7
4.5
(1)求这6个月销售量数据的平均数和80%分位数;
(2)已知该市销售量y与月份代号x具有很强的线性相关关系,求y关于x的经验回归方程,并预测2025年12月份的销售量.
附:经验回归方程的斜率与截距的最小二乘估计公式分别为,,,.
【答案】(1)平均数为3;80%分位数为3.7
(2),约为6.08万辆
【分析】(1)利用平均数和分位数的计算方法,根据给定销售量数据分别计算.
(2)先算出和,再用公式求得到回归方程,最后代入预测销售量.
【详解】(1)由题意可得,6个月销售量从小到大排列为: ,
所以平均数为.
因为,所以这6个月销售量数据的80%分位数为从小到大排列后的第5个数:3.7.
(2)由(1)可知:, ,
,
,
所以 ,当时,(万辆),
即预测2025年12月份的销售量约为6.08万辆.
考点二 独立性检验问题
【例题分析】
例1.(2026·浙江金华·三模)2026年中央广播电视总台春节联欢晚会设立义乌分会场,向全球展现了“世界小商品之都”的商贸活力与新春年味.某机构为研究观众对义乌分会场节目的满意度是否与了解义乌小商品市场有关,从观看了义乌分会场节目的观众中随机抽取了200人进行问卷调查,得到如下列联表:
对节目基本满意
对节目特别满意
合计
不了解义乌小商品市场
60
40
100
了解义乌小商品市场
30
70
100
合计
90
110
200
(1)依据小概率值的独立性检验,分析观众对义乌分会场节目的满意度是否与了解义乌小商品市场有关;
(2)节目组设置了摸“义乌小商品盲盒”游戏环节,观众每次游戏有两种结果:
摸到“一锤定音”,概率为,此时观众获得100元奖金,游戏结束;
摸到“再接再厉”,概率为,此时观众获得10元奖金,并继续游戏,奖金累计计入总奖金;
若一名观众参与游戏最多可摸10次,10次均未摸到“一锤定音”,游戏也结束.求游戏结束时该观众获得的总奖金数X的均值.
附:,其中
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关;
(2).
【分析】(1)根据给定的数表求出的观测值,再与临界值比对即可.
(2)法1:求出的可能值及对应的概率,再利用期望的定义列式,利用错位相减法求和即得;法2:求出获得的累计奖金期望的递推公式,再利用构造法求出通项公式即可.
【详解】(1)零假设:观众对节目的满意度与了解义乌小商品市场无关,
计算,
依据小概率值的独立性检验,推断零假设不成立,
认为观众对义乌分会场节目的满意度与了解义乌小商品市场有关,此推断犯错误的概率不超过0.001.
(2)方法1:奖金总数,
,其中,,
因此,
即,
,
两式相减得,
,
于是,
所以游戏结束时该观众获得的总奖金数X的均值为:.
方法2:设为剩余最多n次抽奖机会时,获得的累计奖金期望,
则,即,,
因此,而,
则,当n=10时,,
所以游戏结束时该观众获得的总奖金数X的均值为.
例2.(2026·贵州毕节·三模)“阳光杯”中学生篮球联赛是毕节市威宁自治县极具本土特色的体育赛事,赛事深度融合威宁多民族文化与高原风情,是当地群众最喜爱的体育赛事之一.威宁县某中学为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,随机抽取该校男生和女生各80名作为样本.设事件“了解‘阳光杯’中学生篮球联赛”,“学生为女生”,已知,.
(1)完成下列列联表,并依据的独立性检验,能否认为该校学生对“阳光杯”中学生篮球联赛的了解情况与性别有关联?
了解
不了解
合计
男生
女生
合计
(2)现从该样本不了解“阳光杯”中学生篮球联赛的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取2人,设抽取的2人中男生的人数为X,求X的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表如下:
了解
不了解
合计
男生
40
40
80
女生
20
60
80
合计
60
100
160
依据的独立性检验,认为该校学生对“阳光杯”赛事的了解情况与性别有关联.
(2)X的分布列为:
X
0
1
2
P
数学期望为.
【分析】(1)先根据条件概率求得人数完善列联表,再代入公式求出,将该值与临界值比较即可求解.
(2)先根据分层抽样确定抽取的男生人数和女生人数,再写出所有可能取值并计算相应的概率,列出分布列并根据数学期望公式可得出答案.
【详解】(1)由题意,,
可知“了解‘阳光杯’中学生篮球联赛”的女生有人,则不了解联赛的女生有60人
“了解‘阳光杯’中学生篮球联赛”的男生有 人,则不了解联赛的男生有40人.
所以
了解
不了解
合计
男生
40
40
80
女生
20
60
80
合计
60
100
160
零假设:该校学生对“阳光杯”赛事的了解情况与性别无关.
依题意,
则,
依据的独立性检验,推断不成立,所以认为该校学生对“阳光杯”赛事的了解情况与性别有关联.
(2)由(1)知,抽取的10名学生中,男生有4人,女生有6人.
可能的取值为0,1,2
则,,
X的分布列为
X
0
1
2
P
数学期望
例3.(2026·重庆渝中·三模)2026 年 4 月 19 日, 第二届人形机器人半程马拉松在北京亦庄举行, 来自各地的机器人参赛队伍同场竞技,引发广泛关注.为研究 “机器人是否搭载智能避障系统” 与 “能否完成全程比赛” 之间是否存在关联,某科研团队对本次参赛的 500 台机器人进行统计,得到如下列联表 (单位: 台):
完成比赛
未完成比赛
搭载智能避障系统
180
70
未搭载智能避障系统
120
130
(1)根据小概率值 的独立性检验,能否认为 “机器人是否搭载智能避障系统” 与 “能否完成全程比赛” 有关?
(2)从该 500 台机器人中,采用按比例分层抽样的方法(以是否搭载智能避障系统分类),抽取一个容量为 10 的样本.再从这10台机器人中,不放回地随机抽取3台,设其中 “搭载智能避障系统” 的台数为.求的数学期望 .
附: ,其中 .
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)“机器人是否搭载智能避障系统” 与 “能否完成全程比赛”有关.
(2),分布列为:
【分析】(1)先完善列联表,再计算,根据临界值表可得相应判断;
(2)根据超几何分布可求的分布列,再根据期望公式计算期望即可.
【详解】(1)完善列联表如下:
完成比赛
未完成比赛
合计
搭载智能避障系统
未搭载智能避障系统
合计
设:“机器人是否搭载智能避障系统” 与 “能否完成全程比赛” 无关,
则,
故根据小概率值 的独立性检验,
可以认为“机器人是否搭载智能避障系统” 与 “能否完成全程比赛”有关.
(2)根据分层抽样可得10台机器人中“搭载智能避障系统” 的台数为,
故可取,
又,,
,,
故的分布列为:
故.
【变式训练】
变式1.(2026·河北沧州·三模)2025年11月5日,第八届中国国际进口博览会在国家会展中心(上海)举办,某企业参展的产品有甲、乙两款机器人,为调查消费者喜爱程度与产品的类型是否有关,在展览期间设置投票箱,随机抽取了部分观众进行现场投票,得到如下列联表:
类型
是否喜爱
合计
喜爱
不喜爱
甲
2m
4m
6m
乙
9m
3m
12m
合计
11m
7m
18m
并根据小概率值的独立性检验,得出了“消费者喜爱程度与产品的类型有关”的结论.
附:.
0.01
0.005
0.001
6.635
7.879
10.828
(1)求正整数m的最小值.
(2)为感谢现场参与的观众,主办方设置了一个挑战机器人对抗赛活动.每人挑战局,每局比赛只有胜和负两种情况,无平局,若每局比赛参与者战胜机器人的概率为,胜者记3分,负者记1分.每局胜负不受其他因素的影响.
(ⅰ)若参与者甲与机器人共对抗4局,求其得分不少于10分的概率.
(ⅱ)记参与者的得分恰好比对抗的局数n多4分的概率为,若,求.
【答案】(1)
(2)(ⅰ);(ⅱ)
【分析】(1)根据公式计算结合临界表值进行解不等式即可得出结果;
(2)(ⅰ)将“得分不少于10分”转化为“胜利局数”利用二项分布的概率公式计算即可;(ⅱ)将“得分比局数多4分”转化为“胜利局数”,利用二项分布写出(),化简,用错位相减法求和,即可得出结果.
【详解】(1)由题意可知,,
已知时,,且得出有关的结论,故:
,解得:.
因为为正整数,故.
(2)(ⅰ)设4局中胜利局,则失败局,得分为.
得分不少于10分,即:,,
故:.
所以得分不少于10分的概率为.
(ⅱ)设局比赛中获胜局,则总得分为.
得分恰好比局数多4分,即:,解得:,
,()
()
所以,
设
则
两式相减得:
.
所以.
变式2.(2026·山东德州·模拟预测)秦腔是陕西最具代表性的戏曲艺术,2006年被列入第一批国家级非物质文化遗产名录.为研究是否喜爱秦腔与年龄之间的关系,并为传统文化保护提供数据支持,某文化调研队在西安市随机抽取了200名当地居民进行调查,得到如下列联表:
单位:人
秦腔
年龄
合计
40岁以下
40岁及以上
喜爱
45
45
90
不喜爱
75
35
110
合计
120
80
200
(1)年龄在40岁及以上的当地居民中,喜爱秦腔的概率为,求的估计值;
(2)根据小概率值的独立性检验,能否认为是否喜爱秦腔与年龄有关?
0.050
0.010
0.001
3.841
6.635
10.828
附:.
【答案】(1).
(2)可以认为是否喜爱秦腔与年龄有关.
【分析】(1)用样本中 40 岁及以上居民喜爱秦腔的频率,作为总体概率的估计值;
(2)通过列联表数据计算卡方统计量,与显著性水平对应的临界值比较,完成独立性检验,判断两个变量是否有关.
【详解】(1)用样本频率估计总体概率,因为年龄在40岁及以上的当地居民喜爱秦腔的频率为,
所以的估计值为.
(2)假设 :是否喜爱秦腔与年龄无关,
题意可知,
因为,所以假设不成立,
即在犯错误的概率不超过的条件下,可以认为是否喜爱秦腔与年龄有关.
变式3.(2026·陕西榆林·模拟预测)飞机与高铁是人们远距离出行的两种方式,交通大学某班学生为了调查人们选择的远距离出行方式是否与年龄相关,随机抽取该市1000名市民进行调查,得到如下列联表:
低于40岁
不低于40岁
总计
选择飞机出行
100
选择高铁出行
300
总计
500
1000
(1)补全表中数据,依据小概率值的独立性检验,是否能够认为市民选择的远距离出行方式与年龄有关联?
(2)调查小组统计高铁站某处今天的客流量,从7:00开始,每小时作为一个时间段(为第1个时间段,为第2个时间段,……),得到如下数据:
时间段
1
2
3
4
5
客流量(千人)
1
1.5
2.5
3
3.5
若与线性相关,建立每个时间段客流量与时间段的经验回归方程,并预测的客流量.
附:,其中.
0.010
0.001
6.635
10.828
对于一组数据,,…,,其经验回归方程的斜率,.
【答案】(1)表格见解析,与年龄有关联
(2),客流量约为4.25千人
【分析】(1)根据数据完成表格,求出的值即可判断;
(2)根据数据求出回归方程,再代入,即可得答案.
【详解】(1)列联表如下:
低于40岁
不低于40岁
总计
选择飞机出行
100
200
300
选择高铁出行
400
300
700
总计
500
500
1000
零假设为:市民选择的远距离出行方式与年龄没有关联.
由列联表中的数据,
得.
依据小概率值的独立性检验,我们推断不成立,
所以能够认为市民选择的远距离出行方式与年龄有关联.
(2),,
所以,
,
所以每个时间段客流量与时间段的经验回归方程为.
当时,,
所以预测12:00~13:00的客流量约为4.25千人.
2
学科网(北京)股份有限公司
$