第12讲 成对数据的相关分析 讲义(知识清单+4题型讲解举三反三+强化训练)【满分全攻略备考系列】-2025-2026学年高二下学期数学沪教版选择性必修第二册
2026-04-29
|
2份
|
61页
|
193人阅读
|
4人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 8.1 成对数据的相关分析 |
| 类型 | 教案-讲义 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 3.37 MB |
| 发布时间 | 2026-04-29 |
| 更新时间 | 2026-04-29 |
| 作者 | 宋老师数学图文制作室 |
| 品牌系列 | - |
| 审核时间 | 2026-04-29 |
| 下载链接 | https://m.zxxk.com/soft/57619885.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
第12讲 成对数据的相关分析
知识清单
知识点01:变量间的相关关系
知识点02:相关系数
知识点03:相关系数r的性质
题型讲解
(举三反三)
题型1:根据散点图判断是否线性相关
题型2:相关系数的意义及辨析
题型3:相关系数的计算
题型4:判断正、负相关
强化训练
一、填空题(12)
二、单选题(4)
三、解答题(5)
知识点01 变量间的相关关系
1、变量之间的相关关系
两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系.当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系.
2、线性相关和非线性相关:
两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系.
3、两个变量相关关系与函数关系的区别和联系
(1)相同点:两者均是两个变量之间的关系.
(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
知识点02 相关系数
两组数据和的线性相关系数是度量两个变量与之间线性相关程度的统计量,其计算公式为其中,,,它们分别是这两组数据的算术平均数
知识点03 相关系数r的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
题型1:三角函数的周期性
【例1-1】(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
【答案】B
【详解】图①,数据点呈正线性相关,且相关性很强,所以接近1;
图②,数据点呈负线性相关,且相关性很强,所以接近;
图③,数据点呈正线性相关,且相关性比图①弱,所以;
图④,数据点呈负线性相关,且相关性比图②弱,所以;
所以.
【例1-2】(24-25高三·上海·随堂练习)如题图所示,有组数据的散点图,去掉________组数据后,剩下的4组数据的相关程度可能最高.
【答案】
【分析】根据线性相关的意义,结合图形分析即得解.
【详解】、、、四点分布在一条直线附近且贴近某一直线,点离得远.
去掉点剩下的4组数据的线性相关性最大,所以应该去掉.
故答案为:
【例1-3】(24-25高三·上海·课堂例题)某公司近年来科研费用(单位:万元)与公司所获的利润(单位:万元)之间有如下的统计数据:
2
3
4
5
18
27
32
35
(1)请画出上表数据的散点图;
(2)观察散点图,判断与是否具有线性相关关系.
【答案】(1)作图见解析
(2)与有线性相关关系
【分析】(1)结合题中所给数据,作出散点图即可;
(2)根据散点图可以判断有没相关性.
【详解】(1)散点图如下:
(2)由图知,所有数据点接近直线排列,因此认为与具有线性相关关系.
【变式1-1】观察下列散点图,则①正相关,②负相关,③不相关,图中的甲、乙、丙三个散点图按顺序相对应的是( ).
A.①②③ B.②①③ C.①③② D.③①②
【答案】C
【分析】根据散点图以及相关性定义判断.
【详解】对于图①,显然是正的线性相关,对于图②,不相关,对于图③,负的线性相关;
故选:C.
【变式1-2】(24-25高三·上海·课堂例题)某市居民2015~2019年家庭年平均收入(单位:万元)与年平均支出(单位:万元)的统计资料如下表所示:
年份
2015
2016
2017
2018
2019
收入
11.5
12.1
13
13.3
15
支出
6.8
8.8
9.8
10
12
根据统计资料,家庭年平均收入与年平均支出有__________相关关系(选填“正”或“负”).
【答案】正
【分析】描出散点图从图上直观看直线的斜率,即可判断.
【详解】由题可得散点图,
从图上直观看出直线的斜率为正,则为正线性相关.
故答案为:正
【变式1-3】(24-25高三·上海·课堂例题)某厂的生产原料耗费(单位:百万元)与销售额(单位:百万元)之间有如下的对应关系:
2
4
6
8
30
40
50
70
画出的散点图并判断它们是否相关.
【答案】作图见解析,可以推断生产原料耗费与销售额这两个变量正线性相关,且相关程度很高
【分析】根据表中数据在直角坐标系中描点即可,由散点图可看出,图中的数据点接近直线排列,故可以判断有没相关性.
【详解】画出的散点图如图所示.
可以推断生产原料耗费与销售额这两个变量正线性相关,且相关程度很高.
题型2:相关系数的意义及辨析
【例2-1】(24-25高二下·上海·期末)下列关于统计概率知识的判断,则下列结论正确的是( )
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1;
③若事件,满足,则事件与事件相互独立;
④某医院住院的位新冠患者的潜伏天数分别为,则该样本数据的第百分位数为.
A.只有一个正确 B.只有两个正确
C.只有一个错误 D.四个题是错误的
【答案】B
【分析】利用方差的运算性质得①正确,利用相关系数的性质得②错误,利用条件概率公式和相互独立事件的判断方法可得③错误,利用百分位数的求法可得④错误,即可求解.
【详解】对于命题①,因为样本数据,,…,的方差为4,则数据,,…,的方差为,
标准差为,所以命题①正确,
对于命题②,相关关系越强,相关系数越接近于1,所以命题②错误,
对于命题③,因为,得到,
则事件与事件相互独立,所以命题③正确,
对于命题④,将数据从小排到大得到,
又,所以该样本数据的第百分位数为,故命题④错误,
故选:B.
【例2-2】(24-25高二下·上海·期中)下列有关线性回归分析的四个命题:① 线性回归直线必过样本数据的中心点;② 回归直线就是散点图中经过样本数据点最多的那条直线;③当相关性系数 时,两个变量正相关;④如果两个变量的相关性越强,则相关性系数就越接近于 1.其中真命题的个数为( ).
A.1 个 B.2 个 C.3 个 D.4 个
【答案】B
【分析】根据线性回归直线的性质可判断选项A,B;根据相关系数的性质可判断C,D,进而可得正确选项.
【详解】对于①,线性回归直线一定过样本数据点的中心,故①正确;
对于②,回归直线在散点图中可能不经过任何一个样本数据点,故②错误;
对于③,当相关系数时,两个变量正相关,故③正确;
对于④,如果两个变量的相关性越强,则相关性系数就越接近于或,故④错误.
故真命题的个数为2.
故选:B.
【例2-3】(25-26高三下·上海虹口·月考)分别对、、三组成对数据做相关性分析,计算出其对应的相关系数分别为、,,则、、三组相关性的强弱从弱到强排序依次为________.
【答案】
【详解】已知三组相关系数的绝对值为:,,,
,
、、三组相关性的强弱从弱到强排序依次为.
【变式2-1】(24-25高三下·上海·月考)某试验田种植一批水稻,对其进行种植实验.在右表中记录了5组水稻的“播种面积”与“总产量”的相关数据并预测序号6的实验数据,若发现实验序号5的实验数据有误需剔除,则下列说法正确的是( ).
实验序号
1
2
3
4
5
6
播种面积
(单位:千公顷)
60.9
71.8
72.9
73.6
75.8
80.0
总产量
(单位:万吨)
37.8
37.4
38.9
40.1
37.3
未知
A.实验样本的相关系数将变小. B.实验样本的相关系数将不变.
C.实验序号6的预测结果将变大. D.实验序号6的预测结果将变小.
【答案】C
【分析】根据相关性的性质即可求解AB,根据回归方程的斜率变化,即可求解CD.
【详解】根据表中数据可知:1-4号的数据中,播种面积逐渐增发,总产量整体呈现上升趋势,呈现正相关,但5号数据,播种面积在增大,但产量低,偏离了正相关趋势,当剔除5号数据后,相关性会变强,故AB错误,
由于5号数据削弱了正相关性,导致回归直线的斜率变小,因此剔除后,回归直线的斜率会变大,所以对于试验6号,预测的结果将变大,故C正确,D错误.
故选:C
【变式2-2】下面是不同成对数据的散点图,从左到右对应的样本相关系数是,,,,其中最大的是( )
A. B. C. D.
【答案】A
【分析】根据散点图的特征,结合相关系数的定义即可判断.
【详解】由散点图的趋势可知且接近1,,与绝对值较小,
所以最大.
故选:A.
【变式2-3】(24-25高三上·上海·期中)在研究线性回归模型时, 样本数据(,,,,)所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则_____________.
【答案】
【分析】根据线性相关系数的定义直接得解.
【详解】由已知样本数据(,,,,)所对应的点均在直线上,
则,
又,
所以满足负相关,
即,
故答案为:.
题型3:相关系数的计算
【例3-1】(24-25高三·上海·课堂例题)如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
【答案】A
【分析】根据表格中的数据,结合相关系数的公式,求得的值,即可得到答案.
【详解】根据表格中的数据,得,,,,
,,,
则,
所以两个变量与的相关程度较高.
故选:A
【例3-2】(24-25高三·上海·随堂练习)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如下表:
x
30
35
40
45
50
y
18
14
10
8
5
计算该流量包的定价x与购买人数y的相关系数________.(结果保留3位小数)
【答案】
【分析】根据相关系数的公式计算结果;
【详解】根据表格中的数据,
可得,.
可列表如下:
i
1
2
3
4
5
-10
-5
0
5
10
7
3
-1
-3
-6
-70
-15
0
-15
-60
则,
,
因此相关系数
.
故答案为:.
【例3-3】(25-26高三上·上海·单元测试)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
【答案】(1)(万元)
(2)
(3)采用分层抽样,理由见解析
【分析】(1)利用样本平均数的计算公式求解即可,(2)利用样本平均数的计算公式求解即可.(3)结合题意根据调查总体的分布特征选择分层抽样进行调查即可.
【详解】(1)该地被调查村的村户年平均收入的估计值为(万元);
(2)样本的相关系数为
;
(3)采用分层抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地更准确的验收估计.
【变式3-1】(2024高二下·上海·专题练习)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数______.
6
8
10
12
6
5
3
2
【答案】
【分析】利用相关系数公式就可以求出结果.
【详解】解:根据表中数据计算可知,,
所以变量,之间的相关系数.
故答案为:.
【变式3-2】(24-25高三·上海·随堂练习)春节期间,由于高速免费,车流量逐步增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表所示:
车流量x(万辆)
12
12.5
13
13.5
14
空气质量指数y
74
76
78
77
80
(1)在下列网格纸中绘制出散点图;
(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示这种关系,并计算车流量与空气质量指数的相关系数.
【答案】(1)画图见解析
(2)画图见解析,
【分析】(1)根据表里数据标点即可;
(2)根据公式计算相关系数;
【详解】(1)
(2)可以看成线性关系,如图所示,
计算得:,
;
,
;
则.
【变式3-3】(24-25高三上·上海·随堂练习)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如表:
x(年龄/岁)
26
27
39
41
49
53
56
58
60
61
y(脂肪含量/%)
14.5
17.8
21.2
25.9
26.3
29.6
31.4
33.5
35.2
34.6
根据上表的数据得到如下的散点图.
根据上表中的样本数据及其散点图,计算样本相关系数(精确到),并刻画它们的相关程度.
(参考数据:,,,)
【答案】0.98,可以推断人体脂肪含量和年龄的相关程度很强.
【分析】根据表中数据求出,然后由相关系数公式计算,根据计算结果可下结论.
【详解】根据题表中的样本数据及其散点图知,
;
.
所以.
由此,可以推断人体脂肪含量和年龄的相关程度很强.
题型4:判断正、负相关
【例4-1】(25-26高二下·上海·月考)通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是( ).
A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【答案】B
【详解】改变变量的单位,线性相关系数不变,C、D错;
去除A点后,线性相关程度变高,
因为是负相关,所以线性相关系数变小,故A错误、B正确.
【例4-2】(25-26高三下·上海·月考)下图是某城市在2025年元月至十月的最低气温(单位:℃)和最高气温(单位:℃)的散点图.定义各月的温差为该月的最高气温减去最低气温.若最低气温和最高气温的线性相关系数为,最低气温和温差的线性相关系数为,则下列说法正确的是( )
A.,且 B.,且
C.,且 D.,且
【答案】D
【分析】根据线性相关系数的性质与线性相关程度判断即可.
【详解】由散点图可得,随着最低气温的升高,最高气温也升高,所以最低气温和最高气温成正相关,故.
因温差最高气温最低气温,由图知,随着最低气温不断升高,最高气温升高幅度相对较小,
故温差逐渐减小,即最低气温和温差成负相关,故.
由散点图可以看出,最低气温与最高气温的线性相关程度较强,最低气温与温差的线性相关程度较弱,
根据线性相关系数的性质,值越接近1,随机变量之间的线性相关程度越强;值越接近0,随机变量之间的线性相关程度越弱.由上分析,可得.
【例4-3】(24-25高二下·上海奉贤·期末)已知变量与负相关,且由观测数据得到样本的平均数,,则由观测数据得到的回归方程可能是( )
A. B. C. D.
【答案】B
【分析】利用负相关及回归直线经过样本中心点,逐项判断.
【详解】对于AC,回归直线、的斜率分别为0.4,2,都为正,变量与正相关,AC不是;
对于B,回归直线斜率,变量与负相关,
当时,,B可能是;
对于D,回归直线斜率,变量与负相关,
当时,,D不是.
故选:B
【变式4-1】(25-26高三上·上海杨浦·期末)对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【答案】D
【分析】根据散点图的分布的趋势和集中程度可得正确的选项.
【详解】对于图1,散点总体斜向上分布,故变量与呈现正相关,故排除B;
对于图2,散点总体斜向上分布,故变量与呈现负相关,故排除C;
图1中散点图分布较为集中,图2中的散点图分布较为分散,故,
故选:D.
【变式4-2】(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
【答案】C
【分析】根据线性相关系数越接近1,表示两个变量之间的相关性越强,线性相关系数的正负表示两个变量之间呈正相关关系或负相关关系.
【详解】因为线性相关系数,,
所以变量x与y之间呈正相关关系,变量u与v之间呈负相关关系.
因为|r|越接近1,两个变量的线性相关程度越高,所以x与y之间的相关性弱于u与v之间的相关性.
故选:C.
【变式4-3】(24-25高二上·上海·随堂练习)某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有表格所示的数据.
x/h
24
15
23
19
16
11
20
16
17
13
y/分
92
79
97
89
64
47
83
68
71
59
(1)画出散点图;
(2)判断数学学习的时间与数学平均成绩的关系.
【答案】(1)作图见解析
(2)数学平均成绩与数学学习时间呈现正相关关系.
【分析】(1)直接根据表中数据在坐标系中描点;
(2)从点的分布趋势是左下到右上即可判断是正相关关系.
【详解】(1)根据表中的数据画出散点图如图所示:
(2)从散点图看,数学平均成绩与数学学习时间呈现正相关关系.
一、单选题
1.(24-25高三上·上海·课后作业)已知变量X与Y相对应的一组数据为,,,,,变量U与V相对应的一组数据为,,,,.表示变量X与Y之间的线性相关系数,表示变量U与V之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
【答案】C
【分析】根据正负相关与相关系数的关系分析判断即可.
【详解】由变量X与Y相对应的一组数据,可得变量X与Y之间正相关,∴;
由变量U与V相对应的一组数据,可知变量U与V之间负相关,∴;
综上所述:与的大小关系是.
故选:C.
2.(2024高二下·上海·专题练习)如图给出了某种豆类生长枝数y(枝)与时间t(月)的散点图,那么此种豆类生长枝数与时间的关系用下列函数模型近似刻画最好的是( )
A. B. C. D.
【答案】D
【分析】根据散点图确定正确答案.
【详解】从所给的散点图可以看出图象大约过和,
把这两个点代入所给的四个解析式发现只有最合适,
另外,根据图象可知,图象呈指数增长的形式,也可在最合适.
故选:D.
3.(24-25高三下·上海浦东新·月考)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
【答案】C
【分析】根据散点图,可判断A选项,加入点后,回归效果变差,从而可判断B,C,D选项.
【详解】对于A,加入点后,变量与预报变量相关性变弱,但不能说不具有线性相关性,故A错误;
对于B,C,D,由于点远离其他点,故加上点后,回归效果会变差,
所以相应的样本相关系数的绝对值会变小,
根据题中散点图,显然,所以会变小,故C正确,B,D错误.
故选:C.
4.以下说法正确的个数为( )
①两个随机变量的线性相关越强,则相关系数的绝对值越接近0;
②设是随机变量,则;
③设随机变量,若,则;
④设随机变量,则
A.0个 B.1个 C.2个 D.3个
【答案】A
【分析】由相关系数的概念判断①,由相关变量的均值和方差的关系判断②,由正态分布的概率计算判断③,由两点分布方差的计算和均值不等式判断④.
【详解】两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,故①错误;
若是随机变量,则,故②错误;
,故③错误;
设随机变量,则,当且仅当,时等号成立,故④错误;
故选:A.
二、填空题
5.(24-25高三·上海·随堂练习)下列各组数据中,可以进行相关分析的是________.(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系;
⑤角度和它的余弦值;
⑥正n边形的边数和内角和.
【答案】②③
【分析】利用相关关系的概念进行判断.
【详解】由题意可知:①④⑤⑥是函数关系,是两个变量之间的关系是一种确定性关系,
比如⑤⑥可以写出它们的函数关系式,分别为,,
而②③中的两个变量之间有一定关系,但不是确定关系,所以它们具有相关关系.
故答案为:②③.
6.近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份
1
2
3
4
5
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则______(填,,,)
【答案】
【分析】根据散点图可知两个量呈负相关,且去掉数据后相关性变强,结合相关系数的概念判断即可.
【详解】根据散点图可知,羊只数量与草地植被指数呈负相关,则相关系数,,
当去掉第一年数据后,数据的线性相关性变强,所以,所以.
故答案为:
7.(24-25高三·上海·课堂例题)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩散点图对应如图:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为__________.
【答案】1
【分析】由散点图知两变量间是相关关系,不是函数关系;利用概率的知识进行预测,得到的结论有一定的随机性.
【详解】对于①,根据散点图知,各点分布在一条直线附近,两变量间是线性相关关系,①正确;
对于②,根据散点图知,两变量不是确定的一次函数关系,②错误;
对于③,利用概率的知识进行预测,得到的结论有一定的随机性,③错误,
所以正确的个数为1.
故答案为:1
8.(24-25高三·上海·随堂练习)对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为________.
【答案】
【分析】根据散点图直接观察比较即可.
【详解】由散点图可知图(1)与图(3)中的两个变量是正相关,故,.
图(2)与图(4)中的两个变量是负相关,故,.
又图(1)与图(2)中的样本点集中在一条直线附近,所以其相关系数的绝对值越接近1.
故答案为:.
9.(24-25高三·上海·课堂例题)如图所示,有5组数据的散点图,去掉__________组数据后,剩下的4组数据的线性相关系数最大.
【答案】D
【分析】根据线性相关的意义,结合图形分析即得解.
【详解】因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.
即去掉D点剩下的4组数据的线性相关性最大,所以应该去掉D.
故答案为:D.
10.(24-25高三·上海·课堂例题)关于相关系数,下列说法中正确的有__________(填序号).
①越大,相关程度越大;
②越小,相关程度越大;
③越大,相关程度越小,越小,相关程度越大;
④且越接近于1,相关程度越大,越接近0,相关程度越小.
【答案】④
【分析】根据给定条件,利用相关系数的意义依次判断即可.
【详解】且越接近于1,相关程度越大,越接近0,相关程度越小,①②③错误,④正确.
故答案为:④
11.对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、、、、从小到大排列,应为______.
【答案】
【分析】根据散点图直接求解即可.
【详解】由散点图可知,
所以.
故答案为:.
12.下列命题中错误的是__.
①将一组数据中的每个数都加上或减去同一个常数后,均值与方差都不变;
②在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
③在吸烟与患肺病这两个分类变量的计算中,若由独立性检验知,在犯错误率不超过0.01的前提下,认为吸烟与患肺病有关系.若某人吸烟,则他有的可能性患肺病.
【答案】①②③
【分析】根据均值和方差的性质,相关系数的特点,独立性检验的相关知识,对每个选项进行逐一分析,即可判断和选择.
【详解】对于①,将一组数据中的每个数都加上或减去同一个常数后,均值改变,方差不变,所以①错误;
对于②,在散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为,所以②错误;
对于③,由独立性检验得,有的把握认为吸烟与患肺病有关系时,是指有的可能性使推断出现错误,所以③错误.
综上,错误的命题序号是①②③.
故答案为:①②③.
13.已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数__________.(计算结果精确到0.01)
6
8
10
12
6
5
3
2
【答案】
【分析】根据相关系数公式求解即可.
【详解】根据表中数据计算可知
,
,
变量之间的相关系数,
故答案为: .
14.(24-25高三·上海·课堂例题)下列关系中是相关关系的是__________(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
【答案】②③
【分析】根据相关关系是一种不确定的关系,是两个变量之间确实存在的关系,由此判断即可.
【详解】对于①,曲线上的点与该点的坐标之间的关系是一一对应关系,不是相关关系,是确定性关系;
对于②,苹果的产量与气候之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于③,森林中的同一种树木,其断面直径与高度之间确实存在一定的关系,虽然变量的值不确定,但它们仍按某种规律在一定的范围内变化,属于相关关系;
对于④,学生与他(她)的学号之间的关系是一种确定的对应关系,是映射,不是相关关系.
故答案为:②③
15.(24-25高三·上海·随堂练习)给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数|r|就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是________.(填写正确序号)
【答案】②③④
【分析】借助回归直线性质可得①;借助相关系数定义可得②;借助方差的性质可得③;借助回归直线方程性质可得④.
【详解】对①,回归直线恒过样本点的中心,但不一定过一个样本点,故①错误;
对②,根据相关系数的意义,可得两个变量相关性越强,则相关系数|r|就越接近1,故②正确;
对③,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,故③正确;
对④,根据回归系数的含义,可得在回归直线方程中,
当解释变量x增加一个单位时,预报变量平均减少0.5个单位,故④正确.
故答案为:②③④.
16.在陈塘关,哪吒发现高中学生的仙术成绩(类似数学成绩设为)、法定操控成绩(类似物理成绩设为)、灵符绘制成绩(类似化学成绩设为)两两成正相关关系.哪吒随机抽取了55名仙童,仙术成绩和法定操控成绩的样本线性相关系数为,法定操控成绩和灵符绘制成绩的样本线性相关系数为,求仙术成绩和灵符绘制成绩的样本线性相关系数的最大值为________.
【答案】
【分析】利用相关系数公式可看作为维向量的夹角公式,从而把相关系数问题转化为向量夹角问题,即可求解.
【详解】设,,,
记,,,
由相关系数公式知,
设与夹角为,与夹角为,
因为仙术成绩和法定操控成绩的样本线性相关系数为,法定操控成绩和灵符绘制成绩的样本线性相关系数为,
所以,,由这两个夹角都是锐角,所以,
所以与夹角为或,
则与夹角余弦的最大值为,
故答案为:.
三、解答题
17.《国家学生体质健康标准(2014年修订)》中,体能监测包含身高、体重、肺活量、50米跑、坐位体前屈、引体向上(女:仰卧起坐)、立定跳远、1000米跑(女:800米跑),据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的数据.
(1)这些数据中的任意两组是否都可以作为成对数据进行相关分析?
(2)依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最低?如何通过统计方法检验你的判断?
【答案】(1)都可以
(2)肺活量和50米跑相关程度最高,身高和肺活量相关程度最低(答案不唯一)
【分析】(1)根据相关关系的定义判断即可;
(2)根据经验找到合理的案例,结合统计学知识分析即可.
【详解】(1)都可以,因为每项指标都可以按照相应的单项指标评分表进行测量和计分,
且任意两项指标之间存在一定的关系,但又没有确切到可由其中的一个精确地决定另一个的程度,
所以任意两组数据均可以作为成对数据进行相关分析,只是有些数据相关性较弱..
(2)依据经验可知肺活量和米跑相关程度最高,身高和肺活量相关程度最低,(答案不唯一),
通过测量出米成绩与肺活量的数据,作出散点图,即可判断.
通过测量出身高与肺活量的数据,作出散点图,即可判断.
18.(24-25高三·上海·课堂例题)某大学生在国家提供的税收、担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数(单位:万元)与时间(单位:年)的数据,列表如下:
1
2
3
4
5
2.4
2.7
4.1
6.4
7.9
依据表中给出的数据,是否可用线性回归模型拟合与的关系,请计算相关系数并加以说明(计算结果精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)
【答案】,理由见解析
【分析】依次计算,,,和,代入相关系数计算公式,计算即得相关系数的值,与比较得出结论.
【详解】由题可知:,,
,
,
则,
即与的线性相关程度很高,可用线性线性回归模型拟合.
19.(24-25高三·上海·随堂练习)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:
学生编号
1
2
3
4
5
6
7
8
数学成绩
60
65
70
75
80
85
90
95
物理成绩
72
77
80
84
88
90
93
95
(1)某个同学的数学成绩与物理成绩是否可以看作成对数据?是否可以进行相关分析?
(2)如果这组数据是成对数据,请画出散点图;
(3)根据以上数据,判断下列结论:
①可以判断数学成绩与物理成绩具有线性关系;
②可以判断数学成绩与物理成绩是一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的序号为_____.
【答案】(1)是成对数据,能进行相关分析
(2)画图见解析
(3)①
【分析】(1)根据表格数据,数学、物理成绩呈现某种正相关,故可看作成对数据,能进行相关分析;
(2)根据数据绘制具体的散点图,并由散点图可以得到具体分析的结果;
(3)借助数形结合进行分析,从而得到具体答案.
【详解】(1)根据表格数据,数学、物理成绩呈现某种正相关关系,故可看作成对数据,能进行相关分析;
(2)
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大;
(3)由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性关系,但不能判断数学成绩与物理成绩是一次函数关系,故①正确,②错误;
若甲同学的数学成绩为80分,乙同学数学成绩为60分,相关关系不是函数关系,故甲同学的物理成绩不一定比乙同学的物理成绩高,故③错误,
因此正确的序号为①.
20.(24-25高三·上海·课堂例题)假设关于某种设备的使用年限(单位:年)与所支出的维修费用(单位:万元)有如下统计资料:
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
已知,,,.
(1)求、;
(2)对、进行线性相关性检验.(保留2位小数)
【答案】(1)4,5;
(2),与之间具有线性相关关系.
【分析】(1)根据表格数据直接求解即可.
(2)根据题意,结合参考数据和相关系数的计算公式,求出,即可判断与之间是否具有线性相关关系.
【详解】(1)依题意,,.
(2)又,
,,
所以.
所以有把握认为与之间具有很强的正线性相关关系.
21.下表是某国家由18支足球队参加的职业联赛(比赛采用双循环制,得分计算方法为:每场赛事胜方得3分,负方得0分,平局双方各得1分)的各队积分和射门次数,求这18支球队的积分与射门次数的相关系数.
足球队
A
B
C
D
E
F
G
H
I
积分
51
64
62
53
47
43
44
42
46
射门次数
418
509
485
425
452
425
393
350
375
足球队
J
K
L
M
N
O
P
Q
R
积分
43
50
35
40
40
32
41
26
32
射门次数
428
415
363
372
377
271
395
306
357
【答案】
【分析】根据相关系数公式计算可得结果.
【详解】,
,
,
,
,
.
22.(25-26高三上·上海·单元测试)为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
【答案】(1),可以认为
(2)需对当天的生产过程进行检查
【分析】(1)利用公式计算出相关系数,再根据,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小进行判断;
(2)计算出,,进一步得出的区间范围,观察样本数据看零件的尺寸在以外就需要对当天的生产过程进行检查.
【详解】(1)由样本数据得的相关系数为
.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;
(2)由于,,
故的区间范围为,
由样本数据可以看出抽取的第13个零件的尺寸在以外,
因此需对当天的生产过程进行检查.
1
学科网(北京)股份有限公司
$
第12讲 成对数据的相关分析
知识清单
知识点01:变量间的相关关系
知识点02:相关系数
知识点03:相关系数r的性质
题型讲解
(举三反三)
题型1:根据散点图判断是否线性相关
题型2:相关系数的意义及辨析
题型3:相关系数的计算
题型4:判断正、负相关
强化训练
一、填空题(12)
二、单选题(4)
三、解答题(5)
知识点01 变量间的相关关系
1、变量之间的相关关系
两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系.当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系.相关关系是一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数学成绩好坏与物理成绩的关系等都是相关关系.
2、线性相关和非线性相关:
两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近,则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系.
3、两个变量相关关系与函数关系的区别和联系
(1)相同点:两者均是两个变量之间的关系.
(2)不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
知识点02 相关系数
两组数据和的线性相关系数是度量两个变量与之间线性相关程度的统计量,其计算公式为其中,,,它们分别是这两组数据的算术平均数
知识点03 相关系数r的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
题型1:三角函数的周期性
【例1-1】(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
【例1-2】(24-25高三·上海·随堂练习)如题图所示,有组数据的散点图,去掉________组数据后,剩下的4组数据的相关程度可能最高.
【例1-3】(24-25高三·上海·课堂例题)某公司近年来科研费用(单位:万元)与公司所获的利润(单位:万元)之间有如下的统计数据:
2
3
4
5
18
27
32
35
(1)请画出上表数据的散点图;
(2)观察散点图,判断与是否具有线性相关关系.
【变式1-1】观察下列散点图,则①正相关,②负相关,③不相关,图中的甲、乙、丙三个散点图按顺序相对应的是( ).
A.①②③ B.②①③ C.①③② D.③①②
【变式1-2】(24-25高三·上海·课堂例题)某市居民2015~2019年家庭年平均收入(单位:万元)与年平均支出(单位:万元)的统计资料如下表所示:
年份
2015
2016
2017
2018
2019
收入
11.5
12.1
13
13.3
15
支出
6.8
8.8
9.8
10
12
根据统计资料,家庭年平均收入与年平均支出有__________相关关系(选填“正”或“负”).
【变式1-3】(24-25高三·上海·课堂例题)某厂的生产原料耗费(单位:百万元)与销售额(单位:百万元)之间有如下的对应关系:
2
4
6
8
30
40
50
70
画出的散点图并判断它们是否相关.
题型2:相关系数的意义及辨析
【例2-1】(24-25高二下·上海·期末)下列关于统计概率知识的判断,则下列结论正确的是( )
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1;
③若事件,满足,则事件与事件相互独立;
④某医院住院的位新冠患者的潜伏天数分别为,则该样本数据的第百分位数为.
A.只有一个正确 B.只有两个正确
C.只有一个错误 D.四个题是错误的
【例2-2】(24-25高二下·上海·期中)下列有关线性回归分析的四个命题:① 线性回归直线必过样本数据的中心点;② 回归直线就是散点图中经过样本数据点最多的那条直线;③当相关性系数 时,两个变量正相关;④如果两个变量的相关性越强,则相关性系数就越接近于 1.其中真命题的个数为( ).
A.1 个 B.2 个 C.3 个 D.4 个
【例2-3】(25-26高三下·上海虹口·月考)分别对、、三组成对数据做相关性分析,计算出其对应的相关系数分别为、,,则、、三组相关性的强弱从弱到强排序依次为________.
【变式2-1】(24-25高三下·上海·月考)某试验田种植一批水稻,对其进行种植实验.在右表中记录了5组水稻的“播种面积”与“总产量”的相关数据并预测序号6的实验数据,若发现实验序号5的实验数据有误需剔除,则下列说法正确的是( ).
实验序号
1
2
3
4
5
6
播种面积
(单位:千公顷)
60.9
71.8
72.9
73.6
75.8
80.0
总产量
(单位:万吨)
37.8
37.4
38.9
40.1
37.3
未知
A.实验样本的相关系数将变小. B.实验样本的相关系数将不变.
C.实验序号6的预测结果将变大. D.实验序号6的预测结果将变小.
【变式2-2】下面是不同成对数据的散点图,从左到右对应的样本相关系数是,,,,其中最大的是( )
A. B. C. D.
【变式2-3】(24-25高三上·上海·期中)在研究线性回归模型时, 样本数据(,,,,)所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则_____________.
题型3:相关系数的计算
【例3-1】(24-25高三·上海·课堂例题)如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
【例3-2】(24-25高三·上海·随堂练习)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大,某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如下表:
x
30
35
40
45
50
y
18
14
10
8
5
计算该流量包的定价x与购买人数y的相关系数________.(结果保留3位小数)
【例3-3】(25-26高三上·上海·单元测试)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投1的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
【变式3-1】(2024高二下·上海·专题练习)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数______.
6
8
10
12
6
5
3
2
【变式3-2】(24-25高三·上海·随堂练习)春节期间,由于高速免费,车流量逐步增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表所示:
车流量x(万辆)
12
12.5
13
13.5
14
空气质量指数y
74
76
78
77
80
(1)在下列网格纸中绘制出散点图;
(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示这种关系,并计算车流量与空气质量指数的相关系数.
【变式3-3】(24-25高三上·上海·随堂练习)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的样本数据,如表:
x(年龄/岁)
26
27
39
41
49
53
56
58
60
61
y(脂肪含量/%)
14.5
17.8
21.2
25.9
26.3
29.6
31.4
33.5
35.2
34.6
根据上表的数据得到如下的散点图.
根据上表中的样本数据及其散点图,计算样本相关系数(精确到),并刻画它们的相关程度.
(参考数据:,,,)
题型4:判断正、负相关
【例4-1】(25-26高二下·上海·月考)通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是( ).
A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【例4-2】(25-26高三下·上海·月考)下图是某城市在2025年元月至十月的最低气温(单位:℃)和最高气温(单位:℃)的散点图.定义各月的温差为该月的最高气温减去最低气温.若最低气温和最高气温的线性相关系数为,最低气温和温差的线性相关系数为,则下列说法正确的是( )
A.,且 B.,且
C.,且 D.,且
【例4-3】(24-25高二下·上海奉贤·期末)已知变量与负相关,且由观测数据得到样本的平均数,,则由观测数据得到的回归方程可能是( )
A. B. C. D.
【变式4-1】(25-26高三上·上海杨浦·期末)对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【变式4-2】(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
【变式4-3】(24-25高二上·上海·随堂练习)某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有表格所示的数据.
x/h
24
15
23
19
16
11
20
16
17
13
y/分
92
79
97
89
64
47
83
68
71
59
(1)画出散点图;
(2)判断数学学习的时间与数学平均成绩的关系.
一、单选题
1.(24-25高三上·上海·课后作业)已知变量X与Y相对应的一组数据为,,,,,变量U与V相对应的一组数据为,,,,.表示变量X与Y之间的线性相关系数,表示变量U与V之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
2.(2024高二下·上海·专题练习)如图给出了某种豆类生长枝数y(枝)与时间t(月)的散点图,那么此种豆类生长枝数与时间的关系用下列函数模型近似刻画最好的是( )
A. B. C. D.
3.(24-25高三下·上海浦东新·月考)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对进行线性回归分析.若在此图中加上点后,再次对进行线性回归分析,则下列说法正确的是( )
A.不具有线性相关性 B.相关系数变大
C.相关系数变小 D.相关系数不变
4.以下说法正确的个数为( )
①两个随机变量的线性相关越强,则相关系数的绝对值越接近0;
②设是随机变量,则;
③设随机变量,若,则;
④设随机变量,则
A.0个 B.1个 C.2个 D.3个
二、填空题
5.(24-25高三·上海·随堂练习)下列各组数据中,可以进行相关分析的是________.(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系;
⑤角度和它的余弦值;
⑥正n边形的边数和内角和.
6.近五年来某草原羊只数量与草地植被指数两变量间的关系如表所示,绘制相应的散点图,如图所示:
年份
1
2
3
4
5
羊只数量/万只
1.4
0.9
0.75
0.6
0.3
草地植被指数
1.1
4.3
15.6
31.3
49.7
若利用这五组数据得到的两变量间的相关系数为,去掉第一年数据后得到的相关系数为,则______(填,,,)
7.(24-25高三·上海·课堂例题)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩散点图对应如图:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为__________.
8.(24-25高三·上海·随堂练习)对四组不同的数据进行统计,获得如题图所示的散点图,则样本相关系数从小到大依次为________.
9.(24-25高三·上海·课堂例题)如图所示,有5组数据的散点图,去掉__________组数据后,剩下的4组数据的线性相关系数最大.
10.(24-25高三·上海·课堂例题)关于相关系数,下列说法中正确的有__________(填序号).
①越大,相关程度越大;
②越小,相关程度越大;
③越大,相关程度越小,越小,相关程度越大;
④且越接近于1,相关程度越大,越接近0,相关程度越小.
11.对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、、、、从小到大排列,应为______.
12.下列命题中错误的是__.
①将一组数据中的每个数都加上或减去同一个常数后,均值与方差都不变;
②在一组样本数据(不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
③在吸烟与患肺病这两个分类变量的计算中,若由独立性检验知,在犯错误率不超过0.01的前提下,认为吸烟与患肺病有关系.若某人吸烟,则他有的可能性患肺病.
13.已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数__________.(计算结果精确到0.01)
6
8
10
12
6
5
3
2
14.(24-25高三·上海·课堂例题)下列关系中是相关关系的是__________(填序号)
①曲线上的点与该点的坐标之间的关系;
②苹果的产量与气候之间的关系;
③森林中同一种树木,其断面直径与高度之间的关系;
④学生与其学号之间的关系.
15.(24-25高三·上海·随堂练习)给出下列说法:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数|r|就越接近1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程中,当解释变量x增加一个单位时,预报变量平均减少0.5个单位.
其中说法正确的是________.(填写正确序号)
16.在陈塘关,哪吒发现高中学生的仙术成绩(类似数学成绩设为)、法定操控成绩(类似物理成绩设为)、灵符绘制成绩(类似化学成绩设为)两两成正相关关系.哪吒随机抽取了55名仙童,仙术成绩和法定操控成绩的样本线性相关系数为,法定操控成绩和灵符绘制成绩的样本线性相关系数为,求仙术成绩和灵符绘制成绩的样本线性相关系数的最大值为________.
三、解答题
17.《国家学生体质健康标准(2014年修订)》中,体能监测包含身高、体重、肺活量、50米跑、坐位体前屈、引体向上(女:仰卧起坐)、立定跳远、1000米跑(女:800米跑),据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的数据.
(1)这些数据中的任意两组是否都可以作为成对数据进行相关分析?
(2)依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最低?如何通过统计方法检验你的判断?
18.(24-25高三·上海·课堂例题)某大学生在国家提供的税收、担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数(单位:万元)与时间(单位:年)的数据,列表如下:
1
2
3
4
5
2.4
2.7
4.1
6.4
7.9
依据表中给出的数据,是否可用线性回归模型拟合与的关系,请计算相关系数并加以说明(计算结果精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)
19.(24-25高三·上海·随堂练习)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:
学生编号
1
2
3
4
5
6
7
8
数学成绩
60
65
70
75
80
85
90
95
物理成绩
72
77
80
84
88
90
93
95
(1)某个同学的数学成绩与物理成绩是否可以看作成对数据?是否可以进行相关分析?
(2)如果这组数据是成对数据,请画出散点图;
(3)根据以上数据,判断下列结论:
①可以判断数学成绩与物理成绩具有线性关系;
②可以判断数学成绩与物理成绩是一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的序号为_____.
20.(24-25高三·上海·课堂例题)假设关于某种设备的使用年限(单位:年)与所支出的维修费用(单位:万元)有如下统计资料:
2
3
4
5
6
2.2
3.8
5.5
6.5
7.0
已知,,,.
(1)求、;
(2)对、进行线性相关性检验.(保留2位小数)
21.下表是某国家由18支足球队参加的职业联赛(比赛采用双循环制,得分计算方法为:每场赛事胜方得3分,负方得0分,平局双方各得1分)的各队积分和射门次数,求这18支球队的积分与射门次数的相关系数.
足球队
A
B
C
D
E
F
G
H
I
积分
51
64
62
53
47
43
44
42
46
射门次数
418
509
485
425
452
425
393
350
375
足球队
J
K
L
M
N
O
P
Q
R
积分
43
50
35
40
40
32
41
26
32
射门次数
428
415
363
372
377
271
395
306
357
22.(25-26高三上·上海·单元测试)为了监控某种医疗物资的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
抽取次数
1
2
3
4
5
6
7
8
医疗物资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,,其中为抽取的第个医疗物资的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检医疗物资中,如果出现了尺寸在之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
1
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。