内容正文:
2025-2026学年高二数学单元检测卷
第4章 统计(参考答案)
第一部分(选择题 共58分)
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1
2
3
4
5
6
7
8
C
C
C
A
C
B
C
C
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9
10
11
AB
ABC
BD
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分。
12. 13. 14. / 是
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤。
15.(13分)
(1)散点图如图所示.
……4分
(2),,,
,,,
所以即为所求的经验回归方程.
....................13分
16.(15分)
(1)样品中,新型国产机床的次品频率为,
利用样本估计总体,得新型国产机床的次品率约为.……6分
(2)零假设为:产品的质量与使用机床的类型无关.
由列联表可得,,
依据的独立性检验,推断不成立,
即认为产品的质量与使用机床的类型有关.
.....................15分
17.(15分)
(1)零假设:对机器人表演节目的喜欢与性别无关.
根据列联表中的数据得,
依据的独立性检验,可以推断不成立,即对机器人表演节目的喜欢与性别有关联,此推断错误的概率不大于0.001.……7分
(2)方法一:依据题意,
方法二:由条件概率公式得.
..................15分
18.(17分)
(1)由题可得:,
,
样本相关系数;……8分
(2)噪声残留量y的取值为67,57,50,42,34,
所以,
根据题意可得,
所以y关于x的经验回归方程为,
要使图象中的噪声残留量不高于10个/像素,则,
即,所以该AI模型至少需要迭代8轮才可以完成降噪.
.....................17分
19.(17分)
(1)因为,
所以;……4分
(2)由题意可知,,
,
所以,,
所以;……9分
(3)由题意可得
试销单价(百元)
1
2
3
4
5
6
产品销量(件)
47
44
44
37
35
27
49
45
41
37
33
29
是否有效采集数据
否
是
否
是
否
否
随机变量的可能取值为,
,
所以分布列为:
0
1
2
数学期望为.
.....................17分
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司1 / 16
学科网(北京)股份有限公司
$
2025-2026学年高二数学单元检测卷
第4章 统计
建议用时:120分钟,满分:150分
第一部分(选择题 共58分)
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.(25-26高二下·浙江绍兴·期中)在下列两个量之间的关系中,属于相关关系的是( )
A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高
C.一块农田的小麦产量与施肥量 D.正n边形的边数与内角度数之和
【答案】C
【详解】A、D是函数关系;B是不相关关系,也不是函数关系;
C是相关关系,一般来说,农田的施肥量越大,小麦产量一般会越多.
2.(25-26高二上·全国·单元测试)为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,得到的结论是有99%的把握认为性别与喜欢乡村音乐有关系,则的值可以为( )
A.2.853 B.3.841 C.6.758 D.6.451
【答案】C
【分析】由题意,对比选项即可得解.
【详解】有的把握认为性别与喜欢乡村音乐有关系,则.
故选:C.
3.(25-26高二下·天津滨海新区·期中)对两组数据进行统计后得到如图所示的散点图,若图1与图2的相关系数分别为,则下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1的数据正相关,图2的数据负相关
C.图1的相关系数小于图2的相关系数
D.图1的相关系数的绝对值小于图2的相关系数的绝对值
【答案】C
【详解】两个图的散点都大致分布在直线附近,因此两组数据都具有线性相关关系,故A正确;
图1中,整体随增大而增大,是正相关,即;图2中,整体随增大而减小,是负相关,即,故B正确;
因为,,正数一定大于负数,因此,故C不正确;
相关系数的绝对值越接近1,线性相关性越强,散点越贴近直线. 图2的散点比图1更贴近直线,因此,故D正确.
4.(25-26高二下·河南郑州·期中)已知两个线性相关变量与的统计数据如下表:其经验回归方程为,则( )
3
4
5
6
7
2.4
4
4.6
5.2
A.2.8 B.3 C.3.2 D.3.4
【答案】A
【详解】由表格知,,经验回归方程经过点,
所以,解得.
5.(2026高三·全国·专题练习)为了了解疾病是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:则认为疾病与性别有关的把握约为( )
患疾病
不患疾病
总计
男
20
5
25
女
10
15
25
总计
30
20
50
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
【答案】C
【分析】根据所给的列联表数据计算,将其与临界值表进行比较,即可得到答案.
【详解】由公式得,
故有的把握认为疾病与性别有关,
故选:C
6.(25-26高二下·浙江温州·月考)随着人工智能技术的快速发展,AI图像识别在工业质检、安防监控等领域得到广泛应用.某科技公司为提升自主研发的AI图像识别模型的识别准确率,研发了一种基于国产算力优化的特征提取算法.为检验该算法的实际效果,研究人员随机选取了200个同批次的工业零件检测样本,随机分为两组,每组100个样本:第一组使用新优化算法进行识别,第二组使用传统算法进行识别,记录两组样本的识别成功与失败情况,得到如下列联表:
识别成功
识别失败
合计
新优化算法
85
15
100
传统算法
70
30
100
合计
155
45
200
附:统计量临界值表
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中,.
则下列说法正确的是( )
A.有99%的把握认为新优化算法对提升识别成功率有效
B.有95%的把握认为新优化算法对提升识别成功率有效
C.若将列联表中每个单元格的数据都扩大为原来的2倍,统计量的值保持不变
D.新优化算法的样本识别成功率比传统算法高15个百分点,因此新算法在所有工业检测场景中都优于传统算法
【答案】B
【分析】根据表中数据,求出,分析比较,可判断A、B的正误;根据的公式,将数据扩大2倍,可得新的,分析可判断C的正误;根据实际场景,分析可判断D的正误.
【详解】由题意,,
所以有95%的把握认为新优化算法对提升识别成功率有效,故A错误,B正确;
若将列联表中每个单元格的数据都扩大为原来的2倍,
则,
所以统计量的值扩大2倍,故C错误;
样本的成功率高15个百分点,不能直接推广到所有工业检测场景中,属于过度推断,故D错误.
7(25-26高三上·山东青岛·期末)某种肉鸡出栏时平均重量可达3.5千克,在没有人工干预的情况下自然繁殖,其出栏时的平均重量会一代不如一代,最后跟普通肉鸡差别不大.某实验室为了得到这种肉鸡自然繁殖后前一代与后一代的平均重量间的关系,将此种肉鸡视为第1代且又繁殖了10代.最后得到前一代平均重量(千克)与后一代平均重量(千克)之间的线性回归方程.已知第2代至第10代的平均重量之和为20千克,则第11代的平均重量为( )
A.2.4千克 B.2.1千克 C.1.8千克 D.1.5千克
【答案】C
【分析】根据题意计算出的表达式,代入直线方程即可求得第11代的平均重量.
【详解】设第1代至第11代的平均重量分别为,易知;
又,
前一代平均重量,后一代平均重量,
将代入回归方程可得,
解得.
故选:C
8.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有( )
附:,其中.
A.人 B.人 C.人 D.人
【答案】C
【分析】设被调查的男性有人,则女性有人,列出列联表,根据独立性检验的基本思想可得出关于的不等式,结合可得出的值,即可得出被调查的男性中不喜爱钓鱼的人数至少为.
【详解】设被调查的男性有人,则女性有人,根据题意,可得列联表如下:
钓鱼
性别
男性
女性
总计
喜爱钓鱼
不喜爱钓鱼
总计
则,
本次调查得出“有的把握认为是否喜爱钓鱼与性别有关”的结论,
可得,解得,
又因为列联表中相关人数需为整数,则,
所以,被调查的男性中不喜爱钓鱼的至少有人.
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.(25-26高二下·山东德州·期中)下列选项正确的是( )
A.若回归方程为,则当变量增加1个单位时,增加3个单位
B.设具有相关关系的两个变量x、y的相关系数为r,越接近于1,说明两个变量之间的线性相关性越强
C.利用进行独立性检验时,的值越大,说明有更大的把握认为两个分类变量相关性越弱
D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归方程为,若其中一个散点坐标为,则
【答案】AB
【详解】对于选项A:因为回归方程为,
所以当变量增加1个单位时,增加3个单位,故A正确;
对于选项B:越接近于1,说明两个变量之间的线性相关性越强,故B正确;
对于选项C:的值越大,说明有更大的把握认为两个分类变量相关,故C错误;
对于选项D:回归直线不一定经过样本点,无法求参数的值,故D错误.
10.(25-26高二下·云南昆明·期中)对于变量,,经过随机抽样获得成对数据,且40,利用最小二乘法得到关于的线性回归方程为,且与的相关系数,则下列结论错误的是( )
A.越大,与的线性相关性越弱
B.若,则
C.若,则
D.若样本点都在回归直线上,则
【答案】ABC
【详解】由于可得,则,
对于,由于,故的值越大,与的线性相关性越强,故A错误;
对于C,当时,把代入得,则,故C错误;
对于D,若样本点,)都在回归直线上,且,则,D正确;
对于B,当时,无法确定的值,B错误.
11.(25-26高二下·辽宁沈阳·期中)下列命题中,真命题的是( )
A.一个样本的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,方差变小
B.数据组成一个样本,其回归直线方程为,其中,去除一个异常点后,得到新的回归直线必过点
C.若随机变量服从正态分布,,则
D.数据27,12,14,30,15,17,19,23的第70百分位数是23;
【答案】BD
【分析】选项A:利用平均数公式计算新样本平均数,再利用方差公式分析方差变化;选项B:结合回归直线必过样本中心点,先计算原样本的中心点,再去除异常点后计算新的样本中心点,验证是否为给定的点;选项C:结合正态分布关于均值对称,利用对称性求出和,再计算;选项D:将数据排序,再根据百分位数的计算规则确定位置,进而找到对应数值.
【详解】选项A,设原样本有个数据,原平均数,总和为;
添加数据后,新总和为,新平均数,平均数不变.
当原方差为0时,每个数据为3,由新增数据也为3,
可知新方差;
当原方差不为0时,原方差,
新方差,方差变小,错误.
选项B,原回归直线必过原样本中心点,代入,
得原.
原10个点总,总;去掉异常点后,
新样本中心点:,,即新中心点为,
回归直线必过样本中心点,正确.
选项C,,正态曲线对称轴为,,
则,由对称性得,
因此:
,错误.
选项D,将数据从小到大排序:,共个数据,
计算,不是整数,根据百分位数计算规则,
向上取整得第个数据为第70百分位数,第6个数据,正确.
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分。
12.(25-26高二下·辽宁铁岭·期中)若一组点通过最小二乘估计得到的回归直线方程为,且,则______.
【答案】
【详解】.
回归直线方程一定经过样本中心点,
,即,.
又,.
13.(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
【答案】
【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【详解】因为抽取个学生,女生人数是男生人数的,
所以抽取个男生,个女生,为了便于计算,我们令,
设男生人数为,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,由,解得,
由题知应为6的整数倍,
而根据小概率值的独立性检验,判断中学生追星与性别有关,
则男生至少有30人,
故答案为:30.
14.(25-26高二上·全国·单元测试)米接力短跑作为田径运动的重要项目,展现了一个国家短跑运动的团体最高水平.每支队伍都有自己的一个或几个明星队员,现有一支米接力短跑队,张三是其队员之一,经统计该队伍在参加的所有比赛中,张三是否上场时该队伍是否取得第一名的情况如下表.若已知张三上场,则该队伍取得第一名的概率约为______.若有的把握认为该队伍是否取得第一名与张三是否上场有关,则认为张三是这支队伍的明星队员,则依据表中数据可判断张三______(填“是”或“不是”)这支队伍的明星队员.
张三上场情况
队伍取得第一名的情况
取得第一名
未取得第一名
总计
上场
未上场
总计
【答案】 / 是
【分析】完善列联表,结合条件概率公式可求得所求事件的概率;计算出的观测值,结合独立性检验可得结论,
【详解】根据题意,可得列联表如下(列完列联表后注意检查数据是否正确):
张三上场情况
队伍取得第一名的情况
取得第一名
未取得第一名
总计
上场
未上场
总计
设“张三上场”为事件,“该队伍取得第一名”为事件,
由表中数据,得,,则,
即已知张三上场,该队伍取得第一名的概率约为,
由表中数据,得,
故有的把握认为该队伍是否取得第一名与张三是否上场有关,
则认为张三是这支队伍的明星队员.
故答案为:;是.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤。
15.(13分)(25-26高二下·全国·课后作业)已知变量有如下对应数据.
1
2
3
4
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于的经验回归方程.
【答案】(1)答案见解析
(2)
【分析】(1)由题中数据作出散点图即可;
(2)用最小二乘法可求得经验回归方程.
【详解】(1)散点图如图所示.
……4分
(2),,,
,,,
所以即为所求的经验回归方程.
....................13分
16.(16分)(25-26高二下·湖南长沙·期中)为响应国家自主研发创新的号召,国内某工厂开发了一种新型机床产品,为评估新型机床的生产能力,现从新型国产机床和原有的进口机床所生产的产品中各抽取了250件,对两台机床的产品进行检验,得到如下列联表:
机床类型
产品质量
合计
良品
次品
新型国产机床
175
75
250
原有进口机床
150
100
250
合计
325
175
500
(1)以频率估计概率,估计新型国产机床的次品率;
(2)根据小概率值的独立性检验,能否判断产品的质量与使用机床的类型有关.
附:,其中.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)
(2)认为产品的质量与使用机床的类型有关
【分析】(1)用次品除以总数,即可求出次品率;
(2)计算出的观测值,结合临界值表可得出结论.
【详解】(1)样品中,新型国产机床的次品频率为,
利用样本估计总体,得新型国产机床的次品率约为.……6分
(2)零假设为:产品的质量与使用机床的类型无关.
由列联表可得,,
依据的独立性检验,推断不成立,
即认为产品的质量与使用机床的类型有关.
.....................15分
17.(15分)(25-26高二下·浙江·期中)在春节联欢晚会上进行了机器人团体舞蹈表演,某机构随机抽取了100名观众进行问卷调查,得到了如下数据:
喜欢
不喜欢
男性
40
10
女性
20
30
(1)依据的独立性检验,试分析对机器人表演节目的喜欢是否与性别有关联?
(2)从这100名样本观众中任选1名,设事件“选到的观众是男性”,事件“选到的观众喜欢机器人团体舞蹈表演节目”,求的大小.
附:,.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)与性别有关联;
(2).
【分析】(1)提出零假设,并求出,与表中数据对比即可下结论;
(2)根据古典概率或条件概率的计算公式求解即可.
【详解】(1)零假设:对机器人表演节目的喜欢与性别无关.
根据列联表中的数据得,
依据的独立性检验,可以推断不成立,即对机器人表演节目的喜欢与性别有关联,此推断错误的概率不大于0.001.……7分
(2)方法一:依据题意,
方法二:由条件概率公式得.
..................15分
18.(17分)(25-26高二下·河北沧州·期中)新型模型是近年来针对数据降噪任务研发的算法工具,通过创新神经网络结构,优化传统模型难以处理的高噪声数据.实验人员用含噪声的图像数据对一种新型降噪模型进行实验,对使用该模型后,图像中的噪声残留量y(单位:个/像素)进行检测,统计得到下表:
第x轮迭代
1
2
3
4
5
噪声残留量y(个/像素)
67
57
50
42
34
并计算得:.
(1)计算变量x(迭代轮数)和变量y(噪声残留量)的样本相关系数r(r的值精确到0.001);
(2)若图像中的噪声残留量不高于10个/像素,则说明数据降噪完成.用最小二乘法求y关于x的经验回归方程,并预测该模型至少需要迭代多少轮才可以完成降噪?
参考数据及公式:样本数据的相关系数,其回归直线的斜率和截距的最小二乘估计值分别为:,,.
【答案】(1)
(2),8
【详解】(1)由题可得:,
,
样本相关系数;……8分
(2)噪声残留量y的取值为67,57,50,42,34,
所以,
根据题意可得,
所以y关于x的经验回归方程为,
要使图象中的噪声残留量不高于10个/像素,则,
即,所以该AI模型至少需要迭代8轮才可以完成降噪.
.....................17分
19.(17分)(25-26高二下·辽宁沈阳·期中)为了对某批新产品进行合理定价,将该产品按事先拟定的价格进行试销后得到一组销售数据,如下表所示:
试销单价(百元)
1
2
3
4
5
6
产品销量(件)
47
44
37
35
27
(1)求的值;
(2)已知变量具有线性相关关系,求产品销量(件)关于试销单价(百元)的回归直线方程(计算结果精确到整数位);
(3)用表示与对应的产品销量的估计值.当销售数据的残差的绝对值 时,则将销售数据称为一个“有效采集数据”.现从这6组销售数据中任取2组,求“有效采集数据”个数的分布列和期望.
附:参考公式
参考数据:.
【答案】(1)
(2)
(3)
0
1
2
【分析】(1)根据计算求解;
(2)根据最小二乘法计算公式计算求解;
(3)列出随机变量可能取值,计算对应概率可得分布列,进而可计算数学期望.
【详解】(1)因为,
所以;……4分
(2)由题意可知,,
,
所以,,
所以;……9分
(3)由题意可得
试销单价(百元)
1
2
3
4
5
6
产品销量(件)
47
44
44
37
35
27
49
45
41
37
33
29
是否有效采集数据
否
是
否
是
否
否
随机变量的可能取值为,
,
所以分布列为:
0
1
2
数学期望为.
.....................17分
学科网(北京)股份有限公司1 / 16
学科网(北京)股份有限公司
$
2025-2026学年高二数学单元检测卷
第4章 统计
建议用时:120分钟,满分:150分
第一部分(选择题 共58分)
一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的。
1.(25-26高二下·浙江绍兴·期中)在下列两个量之间的关系中,属于相关关系的是( )
A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高
C.一块农田的小麦产量与施肥量 D.正n边形的边数与内角度数之和
2.(25-26高二上·全国·单元测试)为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,得到的结论是有99%的把握认为性别与喜欢乡村音乐有关系,则的值可以为( )
A.2.853 B.3.841 C.6.758 D.6.451
3.(25-26高二下·天津滨海新区·期中)对两组数据进行统计后得到如图所示的散点图,若图1与图2的相关系数分别为,则下列结论不正确的是( )
A.图1、图2两组数据都具有线性相关关系
B.图1的数据正相关,图2的数据负相关
C.图1的相关系数小于图2的相关系数
D.图1的相关系数的绝对值小于图2的相关系数的绝对值
4.(25-26高二下·河南郑州·期中)已知两个线性相关变量与的统计数据如下表:其经验回归方程为,则( )
3
4
5
6
7
2.4
4
4.6
5.2
A.2.8 B.3 C.3.2 D.3.4
5.(2026高三·全国·专题练习)为了了解疾病是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:则认为疾病与性别有关的把握约为( )
患疾病
不患疾病
总计
男
20
5
25
女
10
15
25
总计
30
20
50
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
6.(25-26高二下·浙江温州·月考)随着人工智能技术的快速发展,AI图像识别在工业质检、安防监控等领域得到广泛应用.某科技公司为提升自主研发的AI图像识别模型的识别准确率,研发了一种基于国产算力优化的特征提取算法.为检验该算法的实际效果,研究人员随机选取了200个同批次的工业零件检测样本,随机分为两组,每组100个样本:第一组使用新优化算法进行识别,第二组使用传统算法进行识别,记录两组样本的识别成功与失败情况,得到如下列联表:
识别成功
识别失败
合计
新优化算法
85
15
100
传统算法
70
30
100
合计
155
45
200
附:统计量临界值表
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中,.
则下列说法正确的是( )
A.有99%的把握认为新优化算法对提升识别成功率有效
B.有95%的把握认为新优化算法对提升识别成功率有效
C.若将列联表中每个单元格的数据都扩大为原来的2倍,统计量的值保持不变
D.新优化算法的样本识别成功率比传统算法高15个百分点,因此新算法在所有工业检测场景中都优于传统算法
7(25-26高三上·山东青岛·期末)某种肉鸡出栏时平均重量可达3.5千克,在没有人工干预的情况下自然繁殖,其出栏时的平均重量会一代不如一代,最后跟普通肉鸡差别不大.某实验室为了得到这种肉鸡自然繁殖后前一代与后一代的平均重量间的关系,将此种肉鸡视为第1代且又繁殖了10代.最后得到前一代平均重量(千克)与后一代平均重量(千克)之间的线性回归方程.已知第2代至第10代的平均重量之和为20千克,则第11代的平均重量为( )
A.2.4千克 B.2.1千克 C.1.8千克 D.1.5千克
8.(25-26高二下·河北沧州·期中)为了解喜爱钓鱼是否与性别有关,某同学随机在人群中抽取了若干人进行调查,抽取男性人数与女性人数相同,男性喜爱钓鱼的人数占男性人数的,女性喜爱钓鱼的人数占女性人数的,若有的把握认为是否喜爱钓鱼与性别有关,则被调查的男性中不喜爱钓鱼的至少有( )
附:,其中.
A.人 B.人 C.人 D.人
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.(25-26高二下·山东德州·期中)下列选项正确的是( )
A.若回归方程为,则当变量增加1个单位时,增加3个单位
B.设具有相关关系的两个变量x、y的相关系数为r,越接近于1,说明两个变量之间的线性相关性越强
C.利用进行独立性检验时,的值越大,说明有更大的把握认为两个分类变量相关性越弱
D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归方程为,若其中一个散点坐标为,则
10.(25-26高二下·云南昆明·期中)对于变量,,经过随机抽样获得成对数据,且40,利用最小二乘法得到关于的线性回归方程为,且与的相关系数,则下列结论错误的是( )
A.越大,与的线性相关性越弱
B.若,则
C.若,则
D.若样本点都在回归直线上,则
11.(25-26高二下·辽宁沈阳·期中)下列命题中,真命题的是( )
A.一个样本的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,方差变小
B.数据组成一个样本,其回归直线方程为,其中,去除一个异常点后,得到新的回归直线必过点
C.若随机变量服从正态分布,,则
D.数据27,12,14,30,15,17,19,23的第70百分位数是23;
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分。
12.(25-26高二下·辽宁铁岭·期中)若一组点通过最小二乘估计得到的回归直线方程为,且,则______.
13.(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
14.(25-26高二上·全国·单元测试)米接力短跑作为田径运动的重要项目,展现了一个国家短跑运动的团体最高水平.每支队伍都有自己的一个或几个明星队员,现有一支米接力短跑队,张三是其队员之一,经统计该队伍在参加的所有比赛中,张三是否上场时该队伍是否取得第一名的情况如下表.若已知张三上场,则该队伍取得第一名的概率约为______.若有的把握认为该队伍是否取得第一名与张三是否上场有关,则认为张三是这支队伍的明星队员,则依据表中数据可判断张三______(填“是”或“不是”)这支队伍的明星队员.
张三上场情况
队伍取得第一名的情况
取得第一名
未取得第一名
总计
上场
未上场
总计
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤。
15.(13分)(25-26高二下·全国·课后作业)已知变量有如下对应数据.
1
2
3
4
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于的经验回归方程.
16.(16分)(25-26高二下·湖南长沙·期中)为响应国家自主研发创新的号召,国内某工厂开发了一种新型机床产品,为评估新型机床的生产能力,现从新型国产机床和原有的进口机床所生产的产品中各抽取了250件,对两台机床的产品进行检验,得到如下列联表:
机床类型
产品质量
合计
良品
次品
新型国产机床
175
75
250
原有进口机床
150
100
250
合计
325
175
500
(1)以频率估计概率,估计新型国产机床的次品率;
(2)根据小概率值的独立性检验,能否判断产品的质量与使用机床的类型有关.
附:,其中.
0.05
0.01
0.001
3.841
6.635
10.828
17.(15分)(25-26高二下·浙江·期中)在春节联欢晚会上进行了机器人团体舞蹈表演,某机构随机抽取了100名观众进行问卷调查,得到了如下数据:
喜欢
不喜欢
男性
40
10
女性
20
30
(1)依据的独立性检验,试分析对机器人表演节目的喜欢是否与性别有关联?
(2)从这100名样本观众中任选1名,设事件“选到的观众是男性”,事件“选到的观众喜欢机器人团体舞蹈表演节目”,求的大小.
附:,.
0.050
0.010
0.001
3.841
6.635
10.828
18.(17分)(25-26高二下·河北沧州·期中)新型模型是近年来针对数据降噪任务研发的算法工具,通过创新神经网络结构,优化传统模型难以处理的高噪声数据.实验人员用含噪声的图像数据对一种新型降噪模型进行实验,对使用该模型后,图像中的噪声残留量y(单位:个/像素)进行检测,统计得到下表:
第x轮迭代
1
2
3
4
5
噪声残留量y(个/像素)
67
57
50
42
34
并计算得:.
(1)计算变量x(迭代轮数)和变量y(噪声残留量)的样本相关系数r(r的值精确到0.001);
(2)若图像中的噪声残留量不高于10个/像素,则说明数据降噪完成.用最小二乘法求y关于x的经验回归方程,并预测该模型至少需要迭代多少轮才可以完成降噪?
参考数据及公式:样本数据的相关系数,其回归直线的斜率和截距的最小二乘估计值分别为:,,.
19.(17分)(25-26高二下·辽宁沈阳·期中)为了对某批新产品进行合理定价,将该产品按事先拟定的价格进行试销后得到一组销售数据,如下表所示:
试销单价(百元)
1
2
3
4
5
6
产品销量(件)
47
44
37
35
27
(1)求的值;
(2)已知变量具有线性相关关系,求产品销量(件)关于试销单价(百元)的回归直线方程(计算结果精确到整数位);
(3)用表示与对应的产品销量的估计值.当销售数据的残差的绝对值 时,则将销售数据称为一个“有效采集数据”.现从这6组销售数据中任取2组,求“有效采集数据”个数的分布列和期望.
附:参考公式
参考数据:.
1 / 9
学科网(北京)股份有限公
学科网(北京)股份有限公司
$