8.1 成对数据的统计相关性(5大题型)(分层作业)-【大单元教学】高二数学同步备课系列(人教A版2019选择性必修第三册)
2025-03-07
|
2份
|
37页
|
212人阅读
|
3人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.1 成对数据的统计相关性 |
| 类型 | 作业-同步练 |
| 知识点 | 统计,统计案例 |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2025-2026 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 5.29 MB |
| 发布时间 | 2025-03-07 |
| 更新时间 | 2025-03-07 |
| 作者 | 冠一高中数学精品打造 |
| 品牌系列 | 上好课·大单元教学 |
| 审核时间 | 2025-03-07 |
| 下载链接 | https://m.zxxk.com/soft/50856543.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
第八章 成对数据的统计分析
8.1 成对数据的统计相关性(5大题型)分层作业
目录
基础过关练 2
题型一:相关关系的理解 2
题型二:散点图与相关性 2
题型三:散点图及其应用 4
题型四:线性相关性的检验 5
题型五:判断线性相关的强弱 6
拓展培优练 8
题型一:相关关系的理解
1.下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长a与其面积S
B.匀速直线行驶的汽车的位移s与行驶时间t
C.杂交水稻植株的高度h与土壤湿润度r
D.某班的学生人数n与该班某次数学考试的平均分x
2.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
3.下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
题型二:散点图与相关性
4.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
5.对变量,有观测数据,得散点图1;对变量,有观测数据,得散点图2. 表示变量,之间的样本相关系数,表示变量,之间的样本相关系数,则( )
A. B.
C. D.
6.对两个变量的三组数据进行统计,得到以下散点图,关于两个变量相关系数的比较,正确的是( )
A. B. C. D.
题型三:散点图及其应用
7.下表是水稻产量与施肥量的一组观测数据(单位:千克/亩).
施肥量
15
20
25
30
35
40
45
水稻产量
320
330
360
410
460
470
480
绘制散点图,并观察随着施肥量的增加,水稻产量会一直增加吗?
8.两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的区别.
表1
A
26
18
13
10
4
-1
B
20
24
34
38
50
64
表2
C
0
5
10
15
20
25
30
35
D
541.67
602.66
672.09
704.99
806.71
908.59
975.42
1 034.75
9.在以下4幅散点图中,判断哪些图中的y和x之间存在相关关系?其中哪些正相关,哪些负相关?哪些图所对应的成对样本数据呈现出线性相关关系?哪些图所对应的成对样本数据呈现出非线性相关关系.
题型四:线性相关性的检验
10.观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
11.已知变量与的回归直线方程为,变量与负相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与负相关,与正相关 D.与正相关,与负相关
12.已知变量和满足关系,变量y与正相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与正相关,与负相关 D.与负相关,与正相关
题型五:判断线性相关的强弱
13.下图是我国2014-2020年生活垃圾无害化处理量(单位:亿吨)的折线图.
由折线图看出,可用线性回归模型拟合与的关系,请求出相关系数,并用相关系数的大小说明与相关性的强弱.
参考数据:,,.
14.为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
1.(2025·高三·湖北·期中)已知变量x和变量y的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,重新得到的回归直线方程斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为( )
A. B. C. D.
2.(24-25高一·全国·课后作业)相关数据显示,截至2022年12月,全国地级以上城市PM2.5平均浓度同比下降.下表是某地区2024-2025年PM2.5年均浓度(单位:微克/立方米)2022年PM2.5年均浓度(单位:微克/立方米)的数据:
年份
2015
2016
2017
2018
2019
2020
2021
2022
年份代码
1
2
3
4
5
6
7
8
年均浓度
97
95
86.7
79
62
53
42
31
下面四个函数模型中最适宜作为年均浓度和年份代码的函数类型是( )
A. B. C. D.
3.(2025·浙江·一模)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对,进行线性回归分析.若在此图中加上点后,再次对,进行线性回归分析,则下列说法正确的是( )
A.,不具有线性相关性 B.决定系数变大
C.相关系数变小 D.残差平方和变小
4.(2025·湖北荆州·三模)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得如图所示的残差图.模型误差( )
A.满足一元线性回归模型的所有假设
B.不满足一元线性回归模型的的假设
C.不满足一元线性回归模型的假设
D.不满足一元线性回归模型的和的假设
5.(2025·高二·河南驻马店·期末)下列说法正确的是( )
A.某同学定点投篮每次命中的概率均为,每命中一次得2分,若记10次投篮得分为X,则随机变量X服从二项分布,简记.
B.某工厂生产了一批产品50件,其中质量达到“A级”的有20件,则从该批产品中随机抽取10件,记录抽到的产品中为“非A级”的个数为Y,则随机变量Y的数学期望为.
C.若随机变量的成对数据的线性相关系数,则认为随机变量X与Y是确定的函数关系,不是线性相关关系.
D.若随机变量,其分布密度函数为,则.
6.(2025·四川遂宁·三模)下图是遂宁市2022年4月至2023年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数,则下列结论正确的是( )
A.月温差(月最高气温﹣月最低气温)的最大值出现在8月
B.每月最低气温与最高气温有较强的线性相关性,且二者为线性负相关
C.每月最高气温与最低气温的平均值在4-8月逐月增加
D.9﹣12月的月温差相对于5﹣8月,波动性更小
7.(2025·高二·吉林白城·阶段练习)某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:根据表中的数据可得回归直线方程,,以下说法正确的是( )
广告支出费用
2.2
2.6
4.0
5.3
5.9
销售量
3.8
5.4
7.0
11.6
122
A.销售量的多少有96%是由广告支出费用引起的
B.销售量的多少有4%是由广告支出费用引起的
C.第三个样本点对应的残差,回归模型的拟合效果一般
D.第三个样本点对应的残差,回归模型的拟合效果较好
8.(2025·高三·北京·阶段练习)在研究急刹车的停车距离问题时,通常假定停车距离等于反应距离(,单位:m)与制动距离(,单位:m)之和.如图为某实验所测得的数据,其中“KPH”表示刹车时汽车的初速度(单位:km/h).根据实验数据可以推测,下面四组函数中最适合描述,与的函数关系的是( )
A., B.,
C., D.,
9.(多选题)(2025·高三·浙江绍兴·期末)下列说法正确的是( )
A.事件与事件相互独立,且,,则
B.样本数据2,2,3,4,6,8,9,10,12,12的上四分位数为11
C.某分层抽样有层,第层样本数为,其平均数和方差分别为和,第层样本数为,其平均数和方差分别为和,则总方差为
D.已知一系列样本点的经验回归方程为,若样本点与点的残差相等,则
10.(多选题)(2025·高二·贵州·期末)下列说法正确的是( )
A.对于单峰的频率分布直方图,单峰不对称且在右边“拖尾”,则平均数大于中位数
B.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好
C.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则,的值分别是4和0.3
D.某人在10次答题中,答对题数为,,则答对7题的概率最大.
11.(多选题)(2025·高二·内蒙古赤峰·期中)已知由样本数据组成的一个样本,得到回归直线方程为,且,剔除一个偏离直线较大的异常点后,得到新的回归直线经过点.则下列说法正确的是( )
A.相关变量 x,y具有正相关关系
B.剔除该异常点后,样本相关系数的绝对值变大
C.剔除该异常点后的回归直线经过点
D.剔除该异常点后,回归直线的斜率是
12.(2025·高二·广东广州·期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了2017—2022年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把2017—2022年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系(为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为 .为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数 .
(参考公式:决定系数,参考数据:);
13.(2025·高二·江苏扬州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的200个地块,从这些地块中简单随机抽样的方法抽取20个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,构造向量,,其中,,并计算得,,,,,由选择性必修二教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数 .
14.(2025·高二·全国·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .
(精确到0.01,参考公式和数据:,,,)
15.(2025·广西柳州·一模)某购物平台为了吸引更多的顾客在线购物,推出了和两个套餐服务,并在购物平台上推出了优惠券活动,顾客可自由选择和两个套餐之一,下图是该购物平台7天销售优惠券的情况(单位:千张)的折线图:
(1)由折线图可看出,可用回归模型拟合与的关系,请用相关系数加以说明;
(2)假设每位顾客选择套餐的概率为,选择套餐的概率为,其中包含一张优惠券,套餐包含两张优惠券,截止某一时刻,该平台恰好销售了张优惠券,设其概率为,求;
(3)记(2)中所得概率的值构成数列,求数列的最值.
参考数据:,,,
参考公式:相关系数
16.(2025·高三·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取20名学生的错题订正整理情况得分和对应的考试成绩作为样本,得到样本数据,其中和分别表示第个样本错题订正整理情况得分和对应的考试成绩,计算得.
(1)求样本的相关系数(精确到0.01),并推断考试成绩和错题订正整理情况得分的相关程度;
(2)已知20个样本中有8个样本的考试成绩低于样本平均数.利用频率估计概率,从该地区所有高中学生中随机抽取4个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于的个数为X,求随机变量X的分布列.
附:相关系数.
1 / 14
学科网(北京)股份有限公司
$$
第八章 成对数据的统计分析
8.1 成对数据的统计相关性(5大题型)分层作业
目录
基础过关练 2
题型一:相关关系的理解 2
题型二:散点图与相关性 3
题型三:散点图及其应用 5
题型四:线性相关性的检验 7
题型五:判断线性相关的强弱 8
拓展培优练 10
题型一:相关关系的理解
1.下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长a与其面积S
B.匀速直线行驶的汽车的位移s与行驶时间t
C.杂交水稻植株的高度h与土壤湿润度r
D.某班的学生人数n与该班某次数学考试的平均分x
【答案】C
【解析】对于A选项,因为,边长a与面积S是确定的函数关系,故A错误;
对于B选项,设匀速直线行驶的汽车的速度为,,所以位移s与行驶时间t是确定的函数关系,故B错误;
对于C选项,杂交水稻植株的高度h与土壤湿润度r具有相关关系,通常情况下,土壤湿润度r会一定程度上影响杂交水稻植株的高度h值的,故C正确;
对于D选项,因为班级某次数学考试的平均分x等于班级总分除以学生人数n,所以当班级总分确定的情况下,某班的学生人数n与该班某次数学考试的平均分x是一种确定关系,故D正确;
故选:C.
2.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【答案】C
【解析】画出弹簧伸长长度x和相应所受外力F的散点图,
可以判断这两变量相关,且为正相关,故①②错误,③正确.
故选:C
3.下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
【答案】C
【解析】C中的两个变量之间是确定的函数关系,A,B,D中的两个变量之间的关系都是相关关系.
故选:C
题型二:散点图与相关性
4.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【解析】由图知:(1)(3)变量呈正相关,且(1)的相关性比(3)要强,则,
(2)(4)变量呈负相关,且(2)的相关性比(4)要强,则,
所以.
故选:A
5.对变量,有观测数据,得散点图1;对变量,有观测数据,得散点图2. 表示变量,之间的样本相关系数,表示变量,之间的样本相关系数,则( )
A. B.
C. D.
【答案】A
【解析】从图像中看出随增大而减少(图像下降),随增大而减少(图像下降),则与呈负相关关系, 与呈负相关关系,即,故C,D不正确;
另外对比两图,容易看出与相关性更强,故越接近,
所以得,A正确,B错误.
故选:A.
6.对两个变量的三组数据进行统计,得到以下散点图,关于两个变量相关系数的比较,正确的是( )
A. B. C. D.
【答案】C
【解析】由散点图可知第1个图表示的正相关,
故;
第2,3图表示的负相关,且第2个图中的点比第3个图中的点分布更为集中,
故,且,故,
综合可得,即,
故选:C
题型三:散点图及其应用
7.下表是水稻产量与施肥量的一组观测数据(单位:千克/亩).
施肥量
15
20
25
30
35
40
45
水稻产量
320
330
360
410
460
470
480
绘制散点图,并观察随着施肥量的增加,水稻产量会一直增加吗?
【解析】散点图如图所示:
施肥量由小到大时,水稻产量由小到大,但水稻产量不会一直随施肥量的增加而增加.
8.两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的区别.
表1
A
26
18
13
10
4
-1
B
20
24
34
38
50
64
表2
C
0
5
10
15
20
25
30
35
D
541.67
602.66
672.09
704.99
806.71
908.59
975.42
1 034.75
【解析】散点图分别如图(1)和图(2).
从图中可以看出两图中的点各自分布在一条曲线附近,因此两对变量都具有相关关系.
图(1)中,当A的值由小变大时,B的值却是由大变小,故A和B成负相关;
图(2)中,当C的值由小变大时,D的值也是由小变大,故C和D成正相关.
9.在以下4幅散点图中,判断哪些图中的y和x之间存在相关关系?其中哪些正相关,哪些负相关?哪些图所对应的成对样本数据呈现出线性相关关系?哪些图所对应的成对样本数据呈现出非线性相关关系.
【解析】(1)由(1)的散点图可以看到,两个变量确定的散点没有落在了一条直线或者曲线附近,是杂乱无章的,所以可以判定两个变量之间不存在相关关系;
(2)由(2)的散点图可以看到,两个变量确定的散点几乎落在了一条直线附近,所以可以判定两个变量之间存在相关关系,图像呈现左下右上趋势,说明两个变量呈正线性相关关系;
(3)由(3)的散点图可以看到,两个变量确定的散点几乎落在了一条直线附近,所以可以判定两个变量之间存在线性相关关系,图像呈现左上右下趋势,说明两个变量呈负线性相关关系;
(4)由(4)的散点图可以看到,两个变量确定的散点几乎落在了一条曲线附近,所以可以判定两个变量之间存在相关关系,而且是非线性相关关系;
综上,图(2)(3)(4)中的y和x之间存在相关关系;其中图(2)(4)中的y和x之间呈现正相关关系;图(2)(3)中的y和x之间呈现线性相关关系;其中图(4)中的y和x之间呈现非线性相关关系;
题型四:线性相关性的检验
10.观察下列散点图,其中两个变量的相关关系判断正确的是( )
A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关
C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关
【答案】A
【解析】根据给定的散点图,可得a中的数据分布在左下方到右上方的区域里,为正相关,
b中的数据分布在左上方到右下方的区域里,为负相关,
c中的数据各点分布不成带状,相关性不明确,不相关.
故选:A.
11.已知变量与的回归直线方程为,变量与负相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与负相关,与正相关 D.与正相关,与负相关
【答案】D
【解析】根据回归方程可知变量与正相关,又变量与负相关,
由正相关、负相关的定义可知,与负相关.
故选:D
12.已知变量和满足关系,变量y与正相关,则( )
A.与负相关,与负相关 B.与正相关,与正相关
C.与正相关,与负相关 D.与负相关,与正相关
【答案】A
【解析】因为变量和满足关系,变量y与正相关,
由正相关、负相关的定义可知与负相关,与负相关.
故选:A
题型五:判断线性相关的强弱
13.下图是我国2014-2020年生活垃圾无害化处理量(单位:亿吨)的折线图.
由折线图看出,可用线性回归模型拟合与的关系,请求出相关系数,并用相关系数的大小说明与相关性的强弱.
参考数据:,,.
【解析】由折线图中数据和参考数据得,
,
,,
所以,
所以与的线性相关程度比较高.
14.为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
【解析】(1)由样本数据得的相关系数为
.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;
(2)由于,,
故的区间范围为,
由样本数据可以看出抽取的第13个零件的尺寸在以外,
因此需对当天的生产过程进行检查.
1.(2025·高三·湖北·期中)已知变量x和变量y的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,重新得到的回归直线方程斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为( )
A. B. C. D.
【答案】B
【解析】∵,∴增加两个样本点后的平均数为;
∵,∴,
∴增加两个样本点后y的平均数为,
∴,解得,
∴新的经验回归方程为,则当时,,
∴样本点的残差为
故选:B.
2.(24-25高一·全国·课后作业)相关数据显示,截至2022年12月,全国地级以上城市PM2.5平均浓度同比下降.下表是某地区2024-2025年PM2.5年均浓度(单位:微克/立方米)2022年PM2.5年均浓度(单位:微克/立方米)的数据:
年份
2015
2016
2017
2018
2019
2020
2021
2022
年份代码
1
2
3
4
5
6
7
8
年均浓度
97
95
86.7
79
62
53
42
31
下面四个函数模型中最适宜作为年均浓度和年份代码的函数类型是( )
A. B. C. D.
【答案】B
【解析】
根据表中数据可绘制散点图,结合选项可知最符合的函数类型为开口向下的二次函数.
故选:B.
3.(2025·浙江·一模)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对,进行线性回归分析.若在此图中加上点后,再次对,进行线性回归分析,则下列说法正确的是( )
A.,不具有线性相关性 B.决定系数变大
C.相关系数变小 D.残差平方和变小
【答案】C
【解析】对于A,加入点后,变量与预报变量相关性变弱,
但不能说,不具有线性相关性,所以A不正确
对于B,决定系数越接近于1,拟合效果越好,所以加上点后,决定系数变小,故B不正确;
对于C,从图中可以看出点较其他点,偏离直线远,所以加上点后,回归效果变差.
所以相关系数的绝对值越趋于0,故C正确;
对于D,残差平方和变大,拟合效果越差,所以加上点后,残差平方和变大,故D不正确;
故选:C.
4.(2025·湖北荆州·三模)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得如图所示的残差图.模型误差( )
A.满足一元线性回归模型的所有假设
B.不满足一元线性回归模型的的假设
C.不满足一元线性回归模型的假设
D.不满足一元线性回归模型的和的假设
【答案】D
【解析】用一元线性回归模型得到经验回归模型,
根据对应的残差图,残差的均值不可能成立,且残差图中的点分布在一条拋物线形状的弯曲带状区域上,
说明残差与坐标轴变量有二次关系,不满足一元线性回归模型,
故选:D.
5.(2025·高二·河南驻马店·期末)下列说法正确的是( )
A.某同学定点投篮每次命中的概率均为,每命中一次得2分,若记10次投篮得分为X,则随机变量X服从二项分布,简记.
B.某工厂生产了一批产品50件,其中质量达到“A级”的有20件,则从该批产品中随机抽取10件,记录抽到的产品中为“非A级”的个数为Y,则随机变量Y的数学期望为.
C.若随机变量的成对数据的线性相关系数,则认为随机变量X与Y是确定的函数关系,不是线性相关关系.
D.若随机变量,其分布密度函数为,则.
【答案】D
【解析】对于A,由题意,记10次投篮命中的次数为,则,
随机变量命中次数服从二项分布,而随机变量投篮得分X不服从二项分布,故A错误;
对于B,由题意随机变量服从超几何分布,则,故B错误;
对于C,若随机变量的成对数据的线性相关系数,
则认为随机变量X与Y是确定的函数关系,且是线性相关关系,故C错误;
对于D,因为随机变量,其分布密度函数为,
所以,则,故D正确.
故选:D.
6.(2025·四川遂宁·三模)下图是遂宁市2022年4月至2023年3月每月最低气温与最高气温(℃)的折线统计图:已知每月最低气温与最高气温的线性相关系数,则下列结论正确的是( )
A.月温差(月最高气温﹣月最低气温)的最大值出现在8月
B.每月最低气温与最高气温有较强的线性相关性,且二者为线性负相关
C.每月最高气温与最低气温的平均值在4-8月逐月增加
D.9﹣12月的月温差相对于5﹣8月,波动性更小
【答案】C
【解析】对选项A:月温差(月最高气温﹣月最低气温)的最大值出现在10月,错误;
对选项B:每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关,错误;
对选项C:每月最高气温与最低气温的平均值在4-8月分别为,逐月增加,正确;
对选项D:9﹣12月的月温差为;5﹣8月的月温差为,9﹣12月的月温差的波动性更大,错误;
故选:C.
7.(2025·高二·吉林白城·阶段练习)某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:根据表中的数据可得回归直线方程,,以下说法正确的是( )
广告支出费用
2.2
2.6
4.0
5.3
5.9
销售量
3.8
5.4
7.0
11.6
122
A.销售量的多少有96%是由广告支出费用引起的
B.销售量的多少有4%是由广告支出费用引起的
C.第三个样本点对应的残差,回归模型的拟合效果一般
D.第三个样本点对应的残差,回归模型的拟合效果较好
【答案】A
【解析】因为表示解释变量对于预报变量的贡献率,,所以销售量的多少有96%由广告支出费用引起的,故A正确,B错误;
当时,第三个样本点对应的残差为,又,
故拟合效果较好,故CD错误.
故选:A.
8.(2025·高三·北京·阶段练习)在研究急刹车的停车距离问题时,通常假定停车距离等于反应距离(,单位:m)与制动距离(,单位:m)之和.如图为某实验所测得的数据,其中“KPH”表示刹车时汽车的初速度(单位:km/h).根据实验数据可以推测,下面四组函数中最适合描述,与的函数关系的是( )
A., B.,
C., D.,
【答案】B
【解析】设,.
由图象知,过点,,,,,,,,,,,,,,.
作出散点图,如图1.
由图1可得,与呈现线性关系,可选择用.
过点,,,,,,,,,,,,,,.
作出散点图,如图2.
由图2可得,与呈现非线性关系,比较之下,可选择用.
故选:B.
9.(多选题)(2025·高三·浙江绍兴·期末)下列说法正确的是( )
A.事件与事件相互独立,且,,则
B.样本数据2,2,3,4,6,8,9,10,12,12的上四分位数为11
C.某分层抽样有层,第层样本数为,其平均数和方差分别为和,第层样本数为,其平均数和方差分别为和,则总方差为
D.已知一系列样本点的经验回归方程为,若样本点与点的残差相等,则
【答案】ACD
【解析】选项A:因为事件与事件相互独立,且,,
所以,,说法正确;
选项B:样本数据共10个,从小到大排列为2,2,3,4,6,8,9,10,12,12,
因为,所以该组数据的上四分位数为从小到大排列的第8个数,即10,说法错误;
选项C:两层的样本总数为,总平均数为,
总方差为,说法正确;
选项D:因为经验回归方程为,若样本点与点的残差相等,
则,解得,说法正确;
故选:ACD
10.(多选题)(2025·高二·贵州·期末)下列说法正确的是( )
A.对于单峰的频率分布直方图,单峰不对称且在右边“拖尾”,则平均数大于中位数
B.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好
C.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则,的值分别是4和0.3
D.某人在10次答题中,答对题数为,,则答对7题的概率最大.
【答案】ABD
【解析】A. 对于单峰的频率分布直方图,单峰不对称且在右边“拖尾”,则平均数大于中位数,故A正确;
B. 在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故B正确;,
C.由,设,则,即,
所以,,即,故C错误;
D.由题意可知,,
设答对道题的概率最大,所以
,解得:,
得,所以答对7题的概率最大,故D正确.
故选:ABD
11.(多选题)(2025·高二·内蒙古赤峰·期中)已知由样本数据组成的一个样本,得到回归直线方程为,且,剔除一个偏离直线较大的异常点后,得到新的回归直线经过点.则下列说法正确的是( )
A.相关变量 x,y具有正相关关系
B.剔除该异常点后,样本相关系数的绝对值变大
C.剔除该异常点后的回归直线经过点
D.剔除该异常点后,回归直线的斜率是
【答案】BCD
【解析】对于A,由回归直线方程的斜率为,可知相关变量 x,y具有负相关关系,故A错误;
对于B,剔除一个偏离直线较大的异常点后,成对样本数据相关程度更强,故样本相关系数的绝对值变大,B正确;
对于C,因为原回归直线方程为,且,则,
剔除异常点后,得到新的回归直线经过点,则得到新的,
,故剔除该异常点后的回归直线方程经过点,C正确;
对于D,新的回归直线过点,列出方程,解得,
则新的回归方程为,故D正确;
故选:BCD
12.(2025·高二·广东广州·期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了2017—2022年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把2017—2022年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系(为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为 .为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数 .
(参考公式:决定系数,参考数据:);
【答案】
【解析】由,将两边同时取对数可得,
令,由最小二乘法得经验回归方程为,
所以,
又
,
所以.
故答案为:;.
13.(2025·高二·江苏扬州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的200个地块,从这些地块中简单随机抽样的方法抽取20个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,构造向量,,其中,,并计算得,,,,,由选择性必修二教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数 .
【答案】
【解析】由题干数据,,可得,
根据夹角公式的定义,,而,
根据
,
于是.
故答案为:
14.(2025·高二·全国·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .
(精确到0.01,参考公式和数据:,,,)
【答案】0.99
【解析】由题意,知,
,
.
所以.
所以y与x的相关系数近似为0.99.
故答案为:0.99.
15.(2025·广西柳州·一模)某购物平台为了吸引更多的顾客在线购物,推出了和两个套餐服务,并在购物平台上推出了优惠券活动,顾客可自由选择和两个套餐之一,下图是该购物平台7天销售优惠券的情况(单位:千张)的折线图:
(1)由折线图可看出,可用回归模型拟合与的关系,请用相关系数加以说明;
(2)假设每位顾客选择套餐的概率为,选择套餐的概率为,其中包含一张优惠券,套餐包含两张优惠券,截止某一时刻,该平台恰好销售了张优惠券,设其概率为,求;
(3)记(2)中所得概率的值构成数列,求数列的最值.
参考数据:,,,
参考公式:相关系数
【解析】(1)由折线图中数据和附注中参考数据得,,,
,
所以相关系数,
因为与的相关系数近似为0.9632,说明与的相关程度相当高,从而可以用线性回归模型拟合与的关系.
(2)依题意得,,其中,,
则,
所以是以首项为,公比为的等比数列,
故成立,
则有,
所以,又,
则.
(3)当为偶数时,,单调递减,最大值为,,
当为奇数时,,单调递增,最小值为,,
所以数列的最大值为,最小值为.
16.(2025·高三·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取20名学生的错题订正整理情况得分和对应的考试成绩作为样本,得到样本数据,其中和分别表示第个样本错题订正整理情况得分和对应的考试成绩,计算得.
(1)求样本的相关系数(精确到0.01),并推断考试成绩和错题订正整理情况得分的相关程度;
(2)已知20个样本中有8个样本的考试成绩低于样本平均数.利用频率估计概率,从该地区所有高中学生中随机抽取4个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于的个数为X,求随机变量X的分布列.
附:相关系数.
【解析】(1),
接近考试成绩和错题订正整理情况得分高度相关.
(2)考试成绩低于样本平均数的概率记为,
则
x
0
1
2
3
4
p
2 / 23
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。