内容正文:
2025-2026学年高二数学单元检测卷
第七章 统计案例·提升通关(参考答案)
第一部分(选择题 共58分)
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1
2
3
4
5
6
7
8
D
D
C
D
D
D
D
C
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9
10
11
BCD
ABC
ACD
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分。
12.24 13. 14.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤。
15.【答案】(1)分布列见解析,期望为 (2)无关
【分析】(1)由题意可知服从超几何分布,由超几何分布的概率公式求解即可;
(2)根据独立性检验的基本原理求解判断即可.
【详解】(1)(1)由题意得,只实验鼠中,有7只体征状况严重.
的可能取值有0,1,2,3,
, ,
, .
所以的分布列为
X
0
1
2
3
P
所以X的数学期望E(X)=0×+1×+2×+3×=.
(2)由题意得,根据所给数据,得到2×2列联表:
蛋白干预
非蛋白干预
合计
体征状况严重
2
5
7
体征状况不严重
6
3
9
合计
8
8
16
零假设:实验鼠体征状况与蛋白干预没有关系.
利用列联表中的数据得,,
根据小概率值的独立性检验,没有充分证据推断不成立,因此可认为成立,即认为实验鼠体征状况与蛋白干预无关.(13分)
16.【答案】(1)平均数为,分位数为;
(2)表格见解析,认为跳水运动员是否优秀与强化训练有关.
【分析】(1)根据题意求各组的频率,结合平均数和分位数的定义运算求解即可;
(2)完善列联表,求值,结合独立性检验思想分析判断.
【详解】(1)因为强化训练前的各组频率分别为,,,,,;
强化训练前的成绩的平均数,
强化训练后的各组频率分别为,,,,,
又因为前三组频率之和为,
前四组频率之和为,
可知分位数在内,设分位数为,
则,解得,
所以分位数约为;
(2)零假设为:跳水运动员是否优秀与强化训练无关,
补充完整的表格为
优秀人数
非优秀人数
合计
强化训练前
40
60
100
强化训练后
60
40
100
合计
100
100
200
则,
根据小概率值的独立性检验,我们推断不成立,
所以认为跳水运动员是否优秀与强化训练有关.(15分)
17.【答案】(1),次
(2)分布列见解析,期望为
【分析】(1)根据题中数据利用最小二乘法求出,进而可求回归直线方程,将代入回归方程即可得解;
(2)先写出随机变量的所有可能取值,再求出对应概率,即可得分布列,再根据期望公式求期望即可.
【详解】(1)
则,
所以,
所以关于的经验回归方程为;
当时,,
所以2025年顾客对该市航空公司投诉的次数为次;
(2)可取,,
,,
,,
,
所以分布列为
所以.
方法二:服从,(15分)
18.【答案】(1)
(2)(2)(i)证明见解析;(ii),答案见解析
【分析】(1)利用相关系数的公式进行计算即可;
(2)(i)根据题意即相关系数的公式进行计算即可证明;(ii)利用表格写出对应的与 得值,然后用“斯皮尔曼相关系数”的公式进行计算即可;只要能说出斯皮尔曼相关系数与一般的样本相关系数相比的优势即可
【详解】(1)由题意,这组学生数学成绩和知识竞赛成绩的样本相关系数为
(2)(i)证明:因为和都是1,2,,的一个排列,
所以,,
从而和的平均数都是.
因此,,
同理可得,
由于
,
所以;
(ii)由题目数据,可写出与的值如下:
同学编号
1
2
3
4
5
6
7
8
9
10
数学成绩排名
1
2
3
4
5
6
7
8
9
10
知识竞赛成绩排名
1
5
3
4
9
8
7
6
10
2
同学编号
11
12
13
14
15
16
17
18
19
20
数学成绩排名
11
12
13
14
15
16
17
18
19
20
知识竞赛成绩排名
12
14
13
11
16
15
17
18
19
20
所以,并且.
因此这组学生的数学成绩和知识竞赛成绩的斯皮尔曼相关系数是
答案①:斯皮尔曼相关系数对于异常值不太敏感,如果数据中有明显的异常值,那么用斯皮尔曼相关系数比用样本相关系数更能刻画某种线性关系;
答案②:斯皮尔曼相关系数刻画的是样本数据排名的样本相关系数,与具体的数值无关,只与排名有关.如果一组数据有异常值,但排名依然符合一定的线性关系,则可以采用斯皮尔曼相关系数刻画线性关系.(17分)
19.【答案】(1),与线性相关较强
(2)可以在犯错误的概率不超过0.025的前提下认为购买电动汽车与车主性别有关
(3)分布列见解析,
【分析】(1)由相关系数计算公式即可求解判断;
(2)通过卡方值的计算即可判断;
(3)通过抽样比确男性车主选取2人,女性车主选取5人,再确定的取值求得概率即可求解.
【详解】(1)相关系数为
故与线性相关较强
(2)零假设为:购买电动汽车与车主性别无关;
可以在犯错误的概率不超过0.025的前提下认为购买电动汽车与车主性别有关
(3)抽样比,男性车主选取2人,女性车主选取5人,则的可能取值为0,1,2,
故,
故的分布列为.
0
1
2
(17分)
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司1 / 16
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$………………○………………外………………○………………装………………○………………订………………○………………线………………○………………
………………○………………内………………○………………装………………○………………订………………○………………线………………○………………
此卷只装订不密封
………………○………………内………………○………………装………………○………………订………………○………………线………………○………………
………………○………………外………………○………………装………………○………………订………………○………………线………………○………………
… 学校:______________姓名:_____________班级:_______________考号:______________________
2025-2026学年高二数学单元检测卷
第七章 统计案例·提升通关
建议用时:120分钟,满分:120分
第一部分(选择题 共58分)
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
2.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”小波同学为了验证“日落云里走,雨在半夜后”,观察了地区的100天日落和夜晚天气,得到如下列联表(单位:天),并计算得到,下列小波对地区天气的判断不正确的是( )
日落云里走夜晚天气
下雨
未下雨
出现
25
5
未出现
25
45
参考公式:
临界值参照表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.夜晚下雨的概率约为
B.未出现“日落云里走”,夜晚下雨的概率约为
C.有99%的把握判断“日落云里走”是否出现与夜晚天气有关
D.出现“日落云里走”,有99%的把握判断夜晚会下雨
3.下列结论中错误的是( )
A.在回归模型中,决定系数越大,则回归拟合的效果越好
B.样本数据,,,的方差为8,则数据,,,的方差为2
C.若随机变量服从正态分布,且,则
D.具有线性相关关系的变量,,其经验回归方程为,若样本点中心为,则
4.下列命题是真命题的为( )
A.经验回归方程一定不过样本点
B.可以用样本相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量线性相关程度越弱
C.在回归分析中,决定系数R2=0.80的模型比决定系数R2=0.98的模型拟合的效果要好
D.残差平方和越小的模型,拟合的效果越好
5.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
6.某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
7.将收集到的6组数据对制作如图所示的散点图(点旁数据为该点坐标),由最小二乘法计算得回归直线方程:,相关系数为,相关指数为;残差分析确定点对应残差过大,把它去掉后,再用剩下的5组数据计算得回归直线方程:,相关系数为,相关指数为.则以下结论中,不正确的是( )
A. B.
C. D.
8.某学校数学学习兴趣小组利用信息技术手段探究两个数值变量之间的线性关系,随机抽取8个样本点,由于操作过程的疏忽,在用最小二乘法求经验回归方程时只输入了前6组数据,得到的线性回归方程为,其样本中心为.后来检查发现后,输入8组数据得到的新的线性回归方程为,新的样本中心为,已知,则以下结论中正确的个数是( )
①新的样本中心仍为;
②新的样本中心为;
③两个数值变量具有正相关关系;
④.
A.0 B.1 C.2 D.3
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.下列说法错误的是( )
A.对分类变量与的独立性检验的统计量来说,值越大,判断“与有关系”的把握越大
B.数据的第75百分位数为9
C.某物理量服从正态分布越大,该物理量在一次测量中在的概率越大
D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归直线方程为,若其中一个散点坐标为,则
10.已知,其中.下列说法正确的是( )
A.已知一组数据:,1,2,4,3,5,10,9,若为这组数据的第75百分位数,则的展开式中的系数为
B.数据(1,2,3,…,10)组成一个样本,其回归直线方程为,其中,去除一个异常点后,得到新的回归直线必过点
C.若随机变量,则函数为偶函数
D.在列联表中,若每一个数据均变为原来的3倍,则变为原来的9倍
11.计算机显示的数字图像是由一个个小像素点组合而成的.处理图像时,常会通过批量调整各像素点的亮度,间接调整图像的对比度、饱和度等物理量,让图像更加美观.特别地,当图像像素点规模为1行列时,设第列像素点的亮度为,则该图像对比度计算公式为,该计算结果的大小代表图像对比度的强弱.
已知某像素点规模为1行列的图像第列像素点的亮度,现对该图像进行调整,有2种调整方案:
①;②,则( ).
A.使用方案①调整,当,时,调整后的对比度比原对比度更强
B.使用方案②调整,当时,调整后的对比度是原对比度的
C.使用方案①调整,当时,
D.使用方案②调整,当,时,
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分。
12.某公司为了解用电量y(单位:千瓦时)与气温x(单位:摄氏度)之间的关系,随机统计了4天的用电量与当天气温,绘制了如下表格,由表中数据可得回归方程,则实数 .
x
10
13
18
y
62
38
34
m
13.定义.已知具有相关关系的两个变量x,y,有一组观测数据,其经验回归方程为,若,,则 .
14.一组数据组的散点图趋向于落在中间下凸且递增的某条曲线附近,现用模型拟合数据组,其中,设,变换后的线性回归方程为,则 , .
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤。
15.(13分)
地球上生命体内都存在生物钟,研究表明,生物钟紊乱会导致肥胖、糖尿病、高血压、高血脂等严重体征状况.控制睡眠或苏醒倾向的生物钟基因,简称,分为(导致早起倾向)和(导致晚睡倾向).某研究小组为研究光照对动物的影响,对实验鼠进行了光照诱导与蛋白干预实验.以下是16只实验鼠在光照诱导与蛋白干预实验中,出现突变的指标:
实验鼠编号
1
2
3
4
5
6
7
8
指标
实验鼠编号
9
10
11
12
13
14
15
16
指标
长期试验发现,若实验鼠指标超过,则认定其体征状况严重,
(1)从实验鼠中随机选取只,记为体征状况严重的只数,求的分布列和数学期望;
(2)若编号的实验鼠为蛋白干预实验组,编号的为非蛋白干预对照组,试依据小概率值的独立性检验,分析蛋白干预是否与实验鼠体征状况有关?
附:(其中).
16. (15分)
某青少年跳水队共有100人,在强化训练前、后,教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
(1)根据图中数据,估计强化训练前的成绩的平均数(同一组中的数据用该组区间的中点值作代表);并求强化训练后的成绩的60%分位数.
(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.
强化训练
是否优秀
合计
优秀
非优秀
强化训练前
强化训练后
合计
将上面的表格补充完整,依据小概率值的独立性检验,能否据此推断跳水运动员是否优秀与强化训练有关?
附:,.
0.05
0.010
0.005
0.001
3.841
6.635
7.879
10.828
17. (15分)
某市航空公司为了解每年航班正点率对每年顾客投诉次数(单位:次)的影响,对近8年(2017年~2024年)每年航班正点率和每年顾客投诉次数的数据作了初步处理,得到下面的一些统计量的值.
600
592
43837.2
93.8
(1)求关于的经验回归方程,若该市航空公司预计2025年航班正点率为,请估算2025年顾客对该市航空公司投诉的次数;
(2)根据数据统计,该市所有顾客选择乘坐该航空公司航班的概率为,现从该市所有顾客中随机抽取4人,记这4人中选择乘坐该航空公司航班的人数为,求的分布列和数学期望.
附:经验回归直线的斜率和截距的最小二乘法估计公式分别为:
18. (17分)
某兴趣学习小组为研究物理成绩与知识竞赛成绩之间的相关关系,通过对随机抽样出来的20组数据的物理成绩和知识竞赛成绩数据如下表:
学生编号
1
2
3
4
5
6
7
8
9
10
物理成绩
100
99
96
93
90
88
85
83
80
77
知识竞赛成绩
290
160
220
200
65
70
90
100
60
270
学生编号
11
12
13
14
15
16
17
18
19
20
物理成绩
75
74
72
70
68
66
60
50
39
35
知识竞赛成绩
45
35
40
50
25
30
20
15
10
5
一些统计量的值:
75
90
6464
149450
21650
(1)求这组学生的物理成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设为正整数,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记.证明:;
(ii)用(i)的公式求这组学生的物理成绩和知识竞赛成绩的“斯皮尔曼相关系数”,并简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
【附参考公式及参考数据:对于一组成对数据,其相关系数】
19.(17分)
为了解某一地区纯电动汽车销售情况,某机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
购买非电动车
购买电动车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
能否在犯错误的概率不超过0.025的前提下认为购买电动汽车与性别有关?
(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为,求的分布列和期望.
①参考数据:;
②参考公式:(i)线性回归方程:,其中.
(ii)相关系数:,若,则可判断与线性相关较强.
(iii),其中.
附表:
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
试题 第3页(共4页) 试题 第4页(共4页)
试题 第1页(共4页) 试题 第2页(共4页)
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
2025-2026学年高二数学单元检测卷
第七章 统计案例·提升通关
建议用时:120分钟,满分:120分
第一部分(选择题 共58分)
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
【答案】D
【分析】首先根据回归直线必过样本点中心,代入方程求,即可求不清楚的数据.
【详解】回归直线必过样本点中心,其中,
所以,
所以不清楚的数值为.
故选:D
2.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”小波同学为了验证“日落云里走,雨在半夜后”,观察了地区的100天日落和夜晚天气,得到如下列联表(单位:天),并计算得到,下列小波对地区天气的判断不正确的是( )
日落云里走夜晚天气
下雨
未下雨
出现
25
5
未出现
25
45
参考公式:
临界值参照表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.夜晚下雨的概率约为
B.未出现“日落云里走”,夜晚下雨的概率约为
C.有99%的把握判断“日落云里走”是否出现与夜晚天气有关
D.出现“日落云里走”,有99%的把握判断夜晚会下雨
【答案】D
【分析】利用频率估算概率,结合观测值对照附表,对选项进行判断即可.
【详解】选项A:根据列联表可知:100天中有50天下雨,50天未下雨,
因此夜晚下雨的概率约为,故选项A正确;
选项B:未出现“日落云里走”,夜晚下雨的概率约为,故选项B正确;
选项C:因为 ,所以据小概率值的独立性检验,
可以认为“日落云里走”是否出现与夜晚天气有关,故选项C正确;
选项D:依据小概率值的独立性检验,可判断“日落云里走,雨在半夜后”的说法犯错误的概率小于0.01,但不代表一定会下雨,故选项D错误.
故选:D
3.下列结论中错误的是( )
A.在回归模型中,决定系数越大,则回归拟合的效果越好
B.样本数据,,,的方差为8,则数据,,,的方差为2
C.若随机变量服从正态分布,且,则
D.具有线性相关关系的变量,,其经验回归方程为,若样本点中心为,则
【答案】C
【分析】根据决定系数的意义判断A选项;根据方差的性质判断B选项;利用正态曲线可判断C选项;利用经验回归方程过样本中心点计算D选项.
【详解】对于A选项,决定系数越大,回归模型的拟合效果越好,故A正确;
对于B选项,样本数据,,,的方差为8,
则数据,,,的方差为,故B正确;
对于C选项,随机变量服从正态分布,均值,
正态曲线的对称轴为,
,,
由对称性知,,,故C错误;
对于D选项,经验回归方程过样本中心点,将代入中得,
,解得,故D正确.
故选:C
4.下列命题是真命题的为( )
A.经验回归方程一定不过样本点
B.可以用样本相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量线性相关程度越弱
C.在回归分析中,决定系数R2=0.80的模型比决定系数R2=0.98的模型拟合的效果要好
D.残差平方和越小的模型,拟合的效果越好
【答案】D
【分析】根据经验回归方程不一定经过所有样本点但可能经过部分样本点判断A;根据相关系数、决定系数R2、残差的意义可判断BCD.
【详解】对于A,经验回归方程不一定经过所有样本点但可能经过部分样本点,则说明A是假命题;
对于B,由样本相关系数的意义,当越接近0时,表示变量y与x之间的线性相关程度越弱,所以B是假命题;
对于C,用决定系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,
所以C是假命题;
对于D,由残差的统计学意义知,D是真命题.
故选:D
5.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】D
【分析】由散点图的特征,结合相关系数的定义即可得到答案.
【详解】由散点图的趋势可知,,,,
又图一的散点图比图三的散点图更为集中,则,所以,
又图二的散点图比图四的散点图更为集中,则,所以,
所以.
故选:D.
6.某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
【答案】D
【分析】根据散点图的变化规律,寻求合适的特征函数.
【详解】由图可知,随着温度的增加,发芽率的增长速度越来越慢,符合对数型函数的特征.
故选:D.
7.将收集到的6组数据对制作如图所示的散点图(点旁数据为该点坐标),由最小二乘法计算得回归直线方程:,相关系数为,相关指数为;残差分析确定点对应残差过大,把它去掉后,再用剩下的5组数据计算得回归直线方程:,相关系数为,相关指数为.则以下结论中,不正确的是( )
A. B.
C. D.
【答案】D
【分析】利用回归方程的性质,利用相关系数和相关指数分析判断即可.
【详解】从散点图可以看出,两个变量是正相关,故A正确;
从散点图可以看出,回归直线的斜率是正数,且的斜率大于的斜率,故 B和C正确;
从散点图可以看出,去掉“离群点”后,相关性更强,拟合的效果更好,
值越大,模型的拟合效果越好,所以,故D错误;
故选:D.
8.某学校数学学习兴趣小组利用信息技术手段探究两个数值变量之间的线性关系,随机抽取8个样本点,由于操作过程的疏忽,在用最小二乘法求经验回归方程时只输入了前6组数据,得到的线性回归方程为,其样本中心为.后来检查发现后,输入8组数据得到的新的线性回归方程为,新的样本中心为,已知,则以下结论中正确的个数是( )
①新的样本中心仍为;
②新的样本中心为;
③两个数值变量具有正相关关系;
④.
A.0 B.1 C.2 D.3
【答案】C
【分析】由平均数的求法,根据样本中心的定义,利用回归直线方程的斜率,结合样本估计总体及最小乘法原理,逐项检验,可得答案.
【详解】对于①②,由题意可得,,则新的样本中为,故①错误,②正确;
对于③,将代入回归直线,可得,解得,故③正确;
对于④,根据样本估计总体及最小乘法原理,利用组数据所得经验回归程是与样本点“距离”平方和最小的直线方程,故④错误.
故选:C.
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.下列说法错误的是( )
A.对分类变量与的独立性检验的统计量来说,值越大,判断“与有关系”的把握越大
B.数据的第75百分位数为9
C.某物理量服从正态分布越大,该物理量在一次测量中在的概率越大
D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归直线方程为,若其中一个散点坐标为,则
【答案】BCD
【分析】由的概念可判断A;根据百分位数计算公式判断B;利用正态曲线的性质判断C;利用散点图的性质判断D.
【详解】对于A,由的概念可知,值越大,说明与有关系的把握越大,A正确,
对于B,给定数据按由小到大排列为:,由,得数据的第75百分位数为,B错误;
对于C,越大,对应的正态曲线越“矮胖”,随机变量的分布越分散,
因此该物理量在一次测量中在的概率越小,C错误;
对于D,散点不一定在回归直线上,将该点代入直线方程,方程不一定成立,D错误;
故选:BCD
10.已知,其中.下列说法正确的是( )
A.已知一组数据:,1,2,4,3,5,10,9,若为这组数据的第75百分位数,则的展开式中的系数为
B.数据(1,2,3,…,10)组成一个样本,其回归直线方程为,其中,去除一个异常点后,得到新的回归直线必过点
C.若随机变量,则函数为偶函数
D.在列联表中,若每一个数据均变为原来的3倍,则变为原来的9倍
【答案】ABC
【分析】先求出值,再写出的展开式中通项,求出的系数,即可判断A;根据回归直线方程必过样本的中心点,求出,再求出去除异常点后的及,即可判断B;由随机变量,分析出其图象关于对称,找到关于的对称区间,根据正态曲线的对称性得到,即可判断C;根据的计算公式计算即可判断D.
【详解】对于A,将原数据按照从小到大的顺序排序为,
因为上四分位数就是第75百分位数,因为,所以,
因为的二项展开式的通项为,
令,解得,所以的展开式中的系数为,
故A正确;
对于B,因为回归直线方程为过样本的中心点,
所以,
所以去除一个异常点后,,,
所以新的回归直线必过点,故B正确;
对于C,因为随机变量,所以其图象关于对称,
所以关于对称轴的对称点为,即,
关于对称轴的对称点为,即,
根据正态曲线的对称性可知
因为,所以,
所以,所以函数为偶函数,故C正确;
对于D,在列联表中,若每一个数据均变为原来的3倍,则
,
所以变为原来的3倍,故D错误.
故选:ABC
11.计算机显示的数字图像是由一个个小像素点组合而成的.处理图像时,常会通过批量调整各像素点的亮度,间接调整图像的对比度、饱和度等物理量,让图像更加美观.特别地,当图像像素点规模为1行列时,设第列像素点的亮度为,则该图像对比度计算公式为,该计算结果的大小代表图像对比度的强弱.
已知某像素点规模为1行列的图像第列像素点的亮度,现对该图像进行调整,有2种调整方案:
①;②,则( ).
A.使用方案①调整,当,时,调整后的对比度比原对比度更强
B.使用方案②调整,当时,调整后的对比度是原对比度的
C.使用方案①调整,当时,
D.使用方案②调整,当,时,
【答案】ACD
【分析】根据图象对比度公式,以及对数运算公式,结合选项,即可判断.
【详解】使用方案①调整:当,时,又则,
,,
又,故,所以调整后的对比度比原对比度更强,A正确;
,,
当,即且,又,可得,C正确;
使用方案②调整:当时,
对比度公式为非线性变换,
所以调整后的对比度不一定是原对比度的,
例如:时,
,,
此时,即
B错误;
,而,则,故,
又,则,,
所以,
所以,
设,,
则,
所以函数在上单调递减,
所以,即若,则,
又,
所以
所以,
所以,
又,,所以,D正确.
故答案为:ACD.
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分。
12.某公司为了解用电量y(单位:千瓦时)与气温x(单位:摄氏度)之间的关系,随机统计了4天的用电量与当天气温,绘制了如下表格,由表中数据可得回归方程,则实数 .
x
10
13
18
y
62
38
34
m
【答案】24
【分析】求出样本中心点的坐标,将样本中心点的坐标代入回归直线方程,可得出实数的值.
【详解】由题意,,
,
所以样本中心点为,
将样本中心点的坐标代入回归直线方程可得,解得.
故答案为:24.
13.定义.已知具有相关关系的两个变量x,y,有一组观测数据,其经验回归方程为,若,,则 .
【答案】
【分析】根据回归直线性质计算求解.
【详解】令,
所以,
由,解得.
故答案为:
14.一组数据组的散点图趋向于落在中间下凸且递增的某条曲线附近,现用模型拟合数据组,其中,设,变换后的线性回归方程为,则 , .
【答案】
【分析】两边同时取对数,求得,结合,求得,得到的值,再由,求得,结合,即可求解.
【详解】由,两边同时取对数,可得,
因为变换后的线性回归方程为,可得,
即,所以,
又因为,且,
所以,
因为,可得,所以.
故答案为:;.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤。
15.地球上生命体内都存在生物钟,研究表明,生物钟紊乱会导致肥胖、糖尿病、高血压、高血脂等严重体征状况.控制睡眠或苏醒倾向的生物钟基因,简称,分为(导致早起倾向)和(导致晚睡倾向).某研究小组为研究光照对动物的影响,对实验鼠进行了光照诱导与蛋白干预实验.以下是16只实验鼠在光照诱导与蛋白干预实验中,出现突变的指标:
实验鼠编号
1
2
3
4
5
6
7
8
指标
实验鼠编号
9
10
11
12
13
14
15
16
指标
长期试验发现,若实验鼠指标超过,则认定其体征状况严重,
(1)从实验鼠中随机选取只,记为体征状况严重的只数,求的分布列和数学期望;
(2)若编号的实验鼠为蛋白干预实验组,编号的为非蛋白干预对照组,试依据小概率值的独立性检验,分析蛋白干预是否与实验鼠体征状况有关?
附:(其中).
【答案】(1)分布列见解析,期望为 (2)无关
【分析】(1)由题意可知服从超几何分布,由超几何分布的概率公式求解即可;
(2)根据独立性检验的基本原理求解判断即可.
【详解】(1)(1)由题意得,只实验鼠中,有7只体征状况严重.
的可能取值有0,1,2,3,
, ,
, .
所以的分布列为
X
0
1
2
3
P
所以X的数学期望E(X)=0×+1×+2×+3×=.
(2)由题意得,根据所给数据,得到2×2列联表:
蛋白干预
非蛋白干预
合计
体征状况严重
2
5
7
体征状况不严重
6
3
9
合计
8
8
16
零假设:实验鼠体征状况与蛋白干预没有关系.
利用列联表中的数据得,,
根据小概率值的独立性检验,没有充分证据推断不成立,因此可认为成立,即认为实验鼠体征状况与蛋白干预无关.(13分)
16.某青少年跳水队共有100人,在强化训练前、后,教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
(1)根据图中数据,估计强化训练前的成绩的平均数(同一组中的数据用该组区间的中点值作代表);并求强化训练后的成绩的60%分位数.
(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.
强化训练
是否优秀
合计
优秀
非优秀
强化训练前
强化训练后
合计
将上面的表格补充完整,依据小概率值的独立性检验,能否据此推断跳水运动员是否优秀与强化训练有关?
附:,.
0.05
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【答案】(1)平均数为,分位数为;
(2)表格见解析,认为跳水运动员是否优秀与强化训练有关.
【分析】(1)根据题意求各组的频率,结合平均数和分位数的定义运算求解即可;
(2)完善列联表,求值,结合独立性检验思想分析判断.
【详解】(1)因为强化训练前的各组频率分别为,,,,,;
强化训练前的成绩的平均数,
强化训练后的各组频率分别为,,,,,
又因为前三组频率之和为,
前四组频率之和为,
可知分位数在内,设分位数为,
则,解得,
所以分位数约为;
(2)零假设为:跳水运动员是否优秀与强化训练无关,
补充完整的表格为
优秀人数
非优秀人数
合计
强化训练前
40
60
100
强化训练后
60
40
100
合计
100
100
200
则,
根据小概率值的独立性检验,我们推断不成立,
所以认为跳水运动员是否优秀与强化训练有关.(15分)
17.某市航空公司为了解每年航班正点率对每年顾客投诉次数(单位:次)的影响,对近8年(2017年~2024年)每年航班正点率和每年顾客投诉次数的数据作了初步处理,得到下面的一些统计量的值.
600
592
43837.2
93.8
(1)求关于的经验回归方程,若该市航空公司预计2025年航班正点率为,请估算2025年顾客对该市航空公司投诉的次数;
(2)根据数据统计,该市所有顾客选择乘坐该航空公司航班的概率为,现从该市所有顾客中随机抽取4人,记这4人中选择乘坐该航空公司航班的人数为,求的分布列和数学期望.
附:经验回归直线的斜率和截距的最小二乘法估计公式分别为:
【答案】(1),次
(2)分布列见解析,期望为
【分析】(1)根据题中数据利用最小二乘法求出,进而可求回归直线方程,将代入回归方程即可得解;
(2)先写出随机变量的所有可能取值,再求出对应概率,即可得分布列,再根据期望公式求期望即可.
【详解】(1)
则,
所以,
所以关于的经验回归方程为;
当时,,
所以2025年顾客对该市航空公司投诉的次数为次;
(2)可取,,
,,
,,
,
所以分布列为
所以.
方法二:服从,(15分)
18.某兴趣学习小组为研究物理成绩与知识竞赛成绩之间的相关关系,通过对随机抽样出来的20组数据的物理成绩和知识竞赛成绩数据如下表:
学生编号
1
2
3
4
5
6
7
8
9
10
物理成绩
100
99
96
93
90
88
85
83
80
77
知识竞赛成绩
290
160
220
200
65
70
90
100
60
270
学生编号
11
12
13
14
15
16
17
18
19
20
物理成绩
75
74
72
70
68
66
60
50
39
35
知识竞赛成绩
45
35
40
50
25
30
20
15
10
5
一些统计量的值:
75
90
6464
149450
21650
(1)求这组学生的物理成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设为正整数,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记.证明:;
(ii)用(i)的公式求这组学生的物理成绩和知识竞赛成绩的“斯皮尔曼相关系数”,并简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
【附参考公式及参考数据:对于一组成对数据,其相关系数】
【答案】(1)
(2)(2)(i)证明见解析;(ii),答案见解析
【分析】(1)利用相关系数的公式进行计算即可;
(2)(i)根据题意即相关系数的公式进行计算即可证明;(ii)利用表格写出对应的与 得值,然后用“斯皮尔曼相关系数”的公式进行计算即可;只要能说出斯皮尔曼相关系数与一般的样本相关系数相比的优势即可
【详解】(1)由题意,这组学生数学成绩和知识竞赛成绩的样本相关系数为
(2)(i)证明:因为和都是1,2,,的一个排列,
所以,,
从而和的平均数都是.
因此,,
同理可得,
由于
,
所以;
(ii)由题目数据,可写出与的值如下:
同学编号
1
2
3
4
5
6
7
8
9
10
数学成绩排名
1
2
3
4
5
6
7
8
9
10
知识竞赛成绩排名
1
5
3
4
9
8
7
6
10
2
同学编号
11
12
13
14
15
16
17
18
19
20
数学成绩排名
11
12
13
14
15
16
17
18
19
20
知识竞赛成绩排名
12
14
13
11
16
15
17
18
19
20
所以,并且.
因此这组学生的数学成绩和知识竞赛成绩的斯皮尔曼相关系数是
答案①:斯皮尔曼相关系数对于异常值不太敏感,如果数据中有明显的异常值,那么用斯皮尔曼相关系数比用样本相关系数更能刻画某种线性关系;
答案②:斯皮尔曼相关系数刻画的是样本数据排名的样本相关系数,与具体的数值无关,只与排名有关.如果一组数据有异常值,但排名依然符合一定的线性关系,则可以采用斯皮尔曼相关系数刻画线性关系.(17分)
19.为了解某一地区纯电动汽车销售情况,某机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
购买非电动车
购买电动车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
能否在犯错误的概率不超过0.025的前提下认为购买电动汽车与性别有关?
(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为,求的分布列和期望.
①参考数据:;
②参考公式:(i)线性回归方程:,其中.
(ii)相关系数:,若,则可判断与线性相关较强.
(iii),其中.
附表:
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1),与线性相关较强
(2)可以在犯错误的概率不超过0.025的前提下认为购买电动汽车与车主性别有关
(3)分布列见解析,
【分析】(1)由相关系数计算公式即可求解判断;
(2)通过卡方值的计算即可判断;
(3)通过抽样比确男性车主选取2人,女性车主选取5人,再确定的取值求得概率即可求解.
【详解】(1)相关系数为
故与线性相关较强
(2)零假设为:购买电动汽车与车主性别无关;
可以在犯错误的概率不超过0.025的前提下认为购买电动汽车与车主性别有关
(3)抽样比,男性车主选取2人,女性车主选取5人,则的可能取值为0,1,2,
故,
故的分布列为.
0
1
2
(17分)
学科网(北京)股份有限公司1 / 16
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
2025-2026学年高二数学单元检测卷
第七章 统计案例·提升通关
建议用时:120分钟,满分:120分
第一部分(选择题 共58分)
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
2.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”小波同学为了验证“日落云里走,雨在半夜后”,观察了地区的100天日落和夜晚天气,得到如下列联表(单位:天),并计算得到,下列小波对地区天气的判断不正确的是( )
日落云里走夜晚天气
下雨
未下雨
出现
25
5
未出现
25
45
参考公式:
临界值参照表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.夜晚下雨的概率约为
B.未出现“日落云里走”,夜晚下雨的概率约为
C.有99%的把握判断“日落云里走”是否出现与夜晚天气有关
D.出现“日落云里走”,有99%的把握判断夜晚会下雨
3.下列结论中错误的是( )
A.在回归模型中,决定系数越大,则回归拟合的效果越好
B.样本数据,,,的方差为8,则数据,,,的方差为2
C.若随机变量服从正态分布,且,则
D.具有线性相关关系的变量,,其经验回归方程为,若样本点中心为,则
4.下列命题是真命题的为( )
A.经验回归方程一定不过样本点
B.可以用样本相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量线性相关程度越弱
C.在回归分析中,决定系数R2=0.80的模型比决定系数R2=0.98的模型拟合的效果要好
D.残差平方和越小的模型,拟合的效果越好
5.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
6.某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
7.将收集到的6组数据对制作如图所示的散点图(点旁数据为该点坐标),由最小二乘法计算得回归直线方程:,相关系数为,相关指数为;残差分析确定点对应残差过大,把它去掉后,再用剩下的5组数据计算得回归直线方程:,相关系数为,相关指数为.则以下结论中,不正确的是( )
A. B.
C. D.
8.某学校数学学习兴趣小组利用信息技术手段探究两个数值变量之间的线性关系,随机抽取8个样本点,由于操作过程的疏忽,在用最小二乘法求经验回归方程时只输入了前6组数据,得到的线性回归方程为,其样本中心为.后来检查发现后,输入8组数据得到的新的线性回归方程为,新的样本中心为,已知,则以下结论中正确的个数是( )
①新的样本中心仍为;
②新的样本中心为;
③两个数值变量具有正相关关系;
④.
A.0 B.1 C.2 D.3
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.下列说法错误的是( )
A.对分类变量与的独立性检验的统计量来说,值越大,判断“与有关系”的把握越大
B.数据的第75百分位数为9
C.某物理量服从正态分布越大,该物理量在一次测量中在的概率越大
D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归直线方程为,若其中一个散点坐标为,则
10.已知,其中.下列说法正确的是( )
A.已知一组数据:,1,2,4,3,5,10,9,若为这组数据的第75百分位数,则的展开式中的系数为
B.数据(1,2,3,…,10)组成一个样本,其回归直线方程为,其中,去除一个异常点后,得到新的回归直线必过点
C.若随机变量,则函数为偶函数
D.在列联表中,若每一个数据均变为原来的3倍,则变为原来的9倍
11.计算机显示的数字图像是由一个个小像素点组合而成的.处理图像时,常会通过批量调整各像素点的亮度,间接调整图像的对比度、饱和度等物理量,让图像更加美观.特别地,当图像像素点规模为1行列时,设第列像素点的亮度为,则该图像对比度计算公式为,该计算结果的大小代表图像对比度的强弱.
已知某像素点规模为1行列的图像第列像素点的亮度,现对该图像进行调整,有2种调整方案:
①;②,则( ).
A.使用方案①调整,当,时,调整后的对比度比原对比度更强
B.使用方案②调整,当时,调整后的对比度是原对比度的
C.使用方案①调整,当时,
D.使用方案②调整,当,时,
第二部分(非选择题 共92分)
3、 填空题:本题共3小题,每小题5分,共15分。
12.某公司为了解用电量y(单位:千瓦时)与气温x(单位:摄氏度)之间的关系,随机统计了4天的用电量与当天气温,绘制了如下表格,由表中数据可得回归方程,则实数 .
x
10
13
18
y
62
38
34
m
13.定义.已知具有相关关系的两个变量x,y,有一组观测数据,其经验回归方程为,若,,则 .
14.一组数据组的散点图趋向于落在中间下凸且递增的某条曲线附近,现用模型拟合数据组,其中,设,变换后的线性回归方程为,则 , .
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤。
15.(13分)
地球上生命体内都存在生物钟,研究表明,生物钟紊乱会导致肥胖、糖尿病、高血压、高血脂等严重体征状况.控制睡眠或苏醒倾向的生物钟基因,简称,分为(导致早起倾向)和(导致晚睡倾向).某研究小组为研究光照对动物的影响,对实验鼠进行了光照诱导与蛋白干预实验.以下是16只实验鼠在光照诱导与蛋白干预实验中,出现突变的指标:
实验鼠编号
1
2
3
4
5
6
7
8
指标
实验鼠编号
9
10
11
12
13
14
15
16
指标
长期试验发现,若实验鼠指标超过,则认定其体征状况严重,
(1)从实验鼠中随机选取只,记为体征状况严重的只数,求的分布列和数学期望;
(2)若编号的实验鼠为蛋白干预实验组,编号的为非蛋白干预对照组,试依据小概率值的独立性检验,分析蛋白干预是否与实验鼠体征状况有关?
附:(其中).
16. (15分)
某青少年跳水队共有100人,在强化训练前、后,教练组对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
(1)根据图中数据,估计强化训练前的成绩的平均数(同一组中的数据用该组区间的中点值作代表);并求强化训练后的成绩的60%分位数.
(2)规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.
强化训练
是否优秀
合计
优秀
非优秀
强化训练前
强化训练后
合计
将上面的表格补充完整,依据小概率值的独立性检验,能否据此推断跳水运动员是否优秀与强化训练有关?
附:,.
0.05
0.010
0.005
0.001
3.841
6.635
7.879
10.828
17. (15分)
某市航空公司为了解每年航班正点率对每年顾客投诉次数(单位:次)的影响,对近8年(2017年~2024年)每年航班正点率和每年顾客投诉次数的数据作了初步处理,得到下面的一些统计量的值.
600
592
43837.2
93.8
(1)求关于的经验回归方程,若该市航空公司预计2025年航班正点率为,请估算2025年顾客对该市航空公司投诉的次数;
(2)根据数据统计,该市所有顾客选择乘坐该航空公司航班的概率为,现从该市所有顾客中随机抽取4人,记这4人中选择乘坐该航空公司航班的人数为,求的分布列和数学期望.
附:经验回归直线的斜率和截距的最小二乘法估计公式分别为:
18. (17分)
某兴趣学习小组为研究物理成绩与知识竞赛成绩之间的相关关系,通过对随机抽样出来的20组数据的物理成绩和知识竞赛成绩数据如下表:
学生编号
1
2
3
4
5
6
7
8
9
10
物理成绩
100
99
96
93
90
88
85
83
80
77
知识竞赛成绩
290
160
220
200
65
70
90
100
60
270
学生编号
11
12
13
14
15
16
17
18
19
20
物理成绩
75
74
72
70
68
66
60
50
39
35
知识竞赛成绩
45
35
40
50
25
30
20
15
10
5
一些统计量的值:
75
90
6464
149450
21650
(1)求这组学生的物理成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设为正整数,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记.证明:;
(ii)用(i)的公式求这组学生的物理成绩和知识竞赛成绩的“斯皮尔曼相关系数”,并简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
【附参考公式及参考数据:对于一组成对数据,其相关系数】
19.(17分)
为了解某一地区纯电动汽车销售情况,某机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
购买非电动车
购买电动车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
能否在犯错误的概率不超过0.025的前提下认为购买电动汽车与性别有关?
(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为,求的分布列和期望.
①参考数据:;
②参考公式:(i)线性回归方程:,其中.
(ii)相关系数:,若,则可判断与线性相关较强.
(iii),其中.
附表:
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
1 / 9
学科网(北京)股份有限公
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$