内容正文:
专题4.1 成对数据的统计相关性
教学目标
1.结合实例,理解成对数据与相关关系的概念,能区分函数关系与相关关系。
2.会画散点图,能通过散点图直观判断两个变量的正相关、负相关、线性相关趋势。
3.了解样本相关系数r的统计含义、取值范围([-1,1])及性质,掌握其计算公式,能利用公式计算简单数据的相关系数。
4.能根据相关系数r的绝对值大小,定量判断线性相关的强弱(|r|越接近1,线性相关性越强;|r|接近 0,线性相关性越弱)。
教学重难点
1.重点:
(1)用散点图直观识别两个变量的线性相关关系(正相关、负相关、强弱趋势)。
(2)样本相关系数 r的统计含义、计算公式及性质。
(3)利用相关系数 r 定量判断线性相关的强弱。
2.难点:
(1) 相关系数 r 的统计意义与几何意义的理解(为何 r 能刻画线性相关程度,r 与向量夹角的关系)。
(2)相关系数公式的推导与灵活运用(公式结构复杂,易混淆;数据中心化处理的理解)。
(3)区分 “线性相关” 与 “非线性相关”:散点图有趋势但 | r | 不大时,能判断为非线性相关。
(4)实际问题的相关性分析:结合背景解释相关关系,避免将相关性误判为因果关系。
知识点01 散点图
1.散点图:建立直角坐标系,每对数据(Hi,Wi)都可在直角坐标系中用一个点Pi(i=1,2,…,12)表示。这些点称为散点,由坐标系及散点形成的数据图叫作散点图。
2.相关关系:
如果两个变量之间的关系近似地表现为一条直线,则称它们有线性相关关系,简称为相关关系;
3.线性关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.
【即学即练】
(25-26高二下·全国·课堂例题)10对中国父子的身高(英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
试根据上述资料:
(1)画出散点图;
(2)变量和之间是否具有线性关系?
(3)人们常说,父亲高,儿子肯定不矮,你赞成这种说法吗?
【答案】(1)作图见解析
(2)有线性相关关系
(3)不赞成
【知识点】根据散点图判断是否线性相关、判断正、负相关、相关系数的意义及辨析、绘制散点图
【分析】(1)以父亲身高为轴,儿子身高为轴建立直角坐标系,作图即可.
(2)根据散点图观察即可得到结论.
(3)根据相关关系与绝对的因果关系辨析即可.
【详解】(1)散点图如下:
(2)观察散点图中点的分布可以看出,这些点在一条直线的附近分布,所以变量和之间具有线性关系.
(3)不赞成这种说法,因为父亲身高与儿子身高是相关关系而非绝对的因果关系,儿子身高还受营养、环境等其他因素影响.
知识点02 相关系数
1.相关系数的定义:
一般地,对 n 个成对观测数据 (x1,y1),(x2,y2),…,(xn,yn),我们用 {xi} 表示数据x1,x2,…,xn,用 {yi} 表示数据 y1,y2,…,yn。
其中:均值:
标准差:
协方差:,称
为 {xi} 和 {yi} 的相关系数。
2.相关系数的性质
(1)取值范围与相关性类型:rxy的取值范围是 [−1,1]:
当 0<rxy<1 时,称 {xi} 和 {yi} 正相关;
当 −1<rxy<0 时,称 {xi} 和 {yi} 负相关;
当 rxy=0 时,称 {xi} 和 {yi} 不相关。
(2)线性相关程度的判断:∣rxy∣ 越接近于 1,变量 x,y 的线性相关程度越高,此时数据点(x1,y1),(x2,y2),…,(xn,yn) 越集中在一条直线附近。
(3)线性相关程度的判断:∣rxy∣越接近于 0,变量 x,y 的线性相关程度越低。
(4)对称性:rxy 具有对称性,即 rxy=ryx。
(5)线性相关的局限性rxy :仅仅是变量 x 与 y 之间线性相关程度的一个度量。rxy=0 只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系。
【即学即练】(25-26高二下·全国·课堂例题)一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高与右手长度进行测量得到如下数据(单位:cm):
身高
168
170
171
172
174
176
178
178
180
181
右手长度
19.0
20.0
21.0
21.5
21.0
22.0
23.0
24.0
22.5
23.0
(1)判断两者有无线性相关关系;
(2)如果具有线性相关关系,判断相关性的强弱.
【答案】(1)它们线性相关
(2)两者有很强的线性相关关系
【知识点】相关系数的计算、判断两个变量是否有相关关系、相关系数的意义及辨析、根据散点图判断是否线性相关
【分析】(1)由表格中的数据作散点图,根据线性拟合,可得答案;
(2)求出相关系数,可得答案.
【详解】(1)散点图如图所示:
可见,身高与右手长度之间的总体趋势为一条直线,即它们线性相关.
(2)根据以上数据可由计算器计算得,
,,.
.
故两者有很强的线性相关关系.
知识点03 多组数据的相关性
考虑将其分成几个不同两组数据分别进行相关性分析。
【即学即练】(2023高二·全国·专题练习)某男孩的年龄与身高的统计数据如下.
年龄/岁
1
2
3
4
5
6
身高/cm
78
87
98
108
115
120
画出散点图,并判断它们是否有相关关系?如果有相关关系,是正相关还是负相关?
【答案】答案见解析
【知识点】绘制散点图、判断正、负相关
【分析】根据题目提供的数据,绘制了男孩年龄与身高的散点图;并根据散点图分析.
【详解】散点图是分析变量相关关系的重要工具.作出散点图如图:
由图可见,具有线性相关关系,且是正相关.
知识点04 相关系数与向量夹角
1. 成对数据的向量表示
(1)将成对观测数据 (x1,y1),(x2,y2),…,(xn,yn) 转化为 n 维向量形式:
· 原始数据向量:X=(x1,x2,…,xn),Y=(y1,y2,…,yn)
·
中心化数据向量(减去均值):a=(x1−,x2−,…,xn−),b=(y1−,y2−,…,yn−)。
(2)向量夹角公式:
2.结论:(1)样本相关系数 r 等于中心化数据向量夹角的余弦值。
(2)两向量夹角的取值范围为[0,π],其余弦值的取值范围为[−1,1]。
(3)当夹角属于[0, )时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低。
当夹角属于(,π]时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高。
当夹角为时,余弦值为0,这说明两组数据不相关。
【即学即练】(2025·上海·模拟预测)已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为_____.
(附:相关系数
【答案】
【知识点】相关系数的计算
【分析】利用相关系数公式可看成两个维向量的夹角公式,从而把相关系数问题转化为向量夹角问题,即可求解.
【详解】设,
则有,
由相关系数公式得,
设与夹角为与夹角为,
由的样本相关系数为,的样本相关系数为,所以,
由这两个夹角均为锐角且,所以与夹角的可能性是,
则与夹角余弦值的最大值为,此时与样本相关系数最大,
即,
所以的样本线性相关系数的最大值为.
故答案为:.
题型01 相关关系与函数关系的概念及辨析
【典例1】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【答案】(1)函数关系
(2)相关关系
(3)相关关系
(4)函数关系
(5)相关关系
(6)相关关系
【知识点】相关关系与函数关系的概念及辨析
【详解】(1)因为,所以圆的面积与半径之间的关系为函数关系;
(2)因为体重除了与身高有关系,还和性别、遗传等因素有关系,
所以16岁学生的体重与身高之间的关系为相关关系;
(3)因为销售量除了与销售价格有关系,还和是否打广告等方面有关系,
所以商品销售量与销售价格之间的关系为相关关系;
(4)设匀速运动的物体的速度为,
所以运动的路程与时间之间的关系为,
因此匀速运动的物体,其运动的路程与时间之间的关系为函数关系;
(5)因为学习成绩除了与平均学习时间有关系外,还与学习方法等因素有关系,
所以平均学习时间与学习成绩之间的关系为相关关系;
(6)因为科技创新能力除了与人才培养近亲繁殖率有关系,还有教育等因素有关系,
所以科技创新能力与人才培养近亲繁殖率之间的关系为相关关系.
【变式1-1】(25-26高二上·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
【答案】D
【知识点】判断两个变量是否有相关关系、函数关系的判断
【分析】利用两变量相关关系的意义判断即可.
【详解】列表解析
选项
是否是相关关系
原因
A
是
果树亩产量与光照时间有关,是相关关系.
B
是
降雪量的大小对交通事故发生率有影响,是相关关系.
C
是
粮食亩产量与每亩田施肥量有关,是相关关系.
D
否
圆的面积S和半径r是函数关系.
故选:D.
【变式1-2】(25-26高二下·全国·课后作业)下面变量之间是相关关系的是( )
A.出租车费与行驶的里程
B.正方形面积与边长
C.人的身高与体重
D.铁的体积与质量
【答案】C
【知识点】相关关系与函数关系的概念及辨析
【分析】根据相关关系的概念逐项判断即可.
【详解】由相关关系可知C选项是相关关系,ABD选项都是函数关系.
故选:C.
【变式1-3】(25-26高二下·全国·课堂例题)下列两个变量之间,是相关关系的有( )
①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积.
A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦
【答案】C
【知识点】相关关系与函数关系的概念及辨析、判断两个变量是否有相关关系
【分析】根据相关关系的概念判断即可.
【详解】①③④⑦是函数关系;②没有关系;⑤⑥是相关关系.
故选:C
题型02 判断两个变量是否有相关关系
【典例2】(2025高二·全国·专题练习)在下列各图中,两个变量具有相关关系的是( ).
A.①② B.①③ C.② D.②③
【答案】D
【知识点】判断两个变量是否有相关关系
【分析】根据函数关系和相关关系的概念,结合图象作出判断.
【详解】对于①,所有的点都在曲线上,具有函数关系;
对于②,所有的散点分布在一条直线附近,具有相关关系:
对于③,所有的散点分布在一条曲线附近,具有相关关系;
对于④,所有的散点杂乱无章,不具有相关关系,
故选:D.
【变式2-1】(多选)(24-25高二下·全国·课后作业)下列关系中,是相关关系的为( )
A.学生的学习态度与学习成绩之间的关系
B.教师的教学水平与学生的学习成绩之间的关系
C.学生的身高与学生的学习成绩之间的关系
D.家庭的经济条件与学生的学习成绩之间的关系
【答案】AB
【知识点】判断两个变量是否有相关关系
【分析】由两个变量的相关关系的定义进行判断.
【详解】A中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关系;
B中教师的教学水平与学生的学习成绩之间的关系是相关关系;C,D都不具备相关关系.
故选:AB
【变式2-2】(多选)(25-26高二下·全国·课堂例题)(多选)在下列各变量之间的关系中,属于相关关系的是( )
A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和
C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩
【答案】AC
【知识点】相关关系与函数关系的概念及辨析、判断两个变量是否有相关关系
【分析】根据相关关系与函数关系的概念,可得答案.
【详解】汽车的重量越大,百公里耗油量会越多.一般来说,农田的施肥量越大,小麦产量一般会越多.
可得A、C是相关关系.B是函数关系.D中家庭的经济条件与学生的学习成绩之间不是相关关系,也不是函数关系.
故选:AC.
【变式2-3】(多选)(24-25高二下·全国·课后作业)有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③森林中同一种树木,其断面直径与高度之间的关系;④角的度数与它的正弦值.其中,具有相关关系的是( )
A.① B.② C.③ D.④
【答案】AC
【知识点】判断两个变量是否有相关关系
【分析】根据相关关系的概念判断.
【详解】①③具有相关关系,②④具有确定的关系,即函数关系.
故选:AC
题型03 判断正、负相关关系
【典例3】(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
【答案】B
【知识点】相关系数的意义及辨析、判断正、负相关
【详解】图①,数据点呈正线性相关,且相关性很强,所以接近1;
图②,数据点呈负线性相关,且相关性很强,所以接近;
图③,数据点呈正线性相关,且相关性比图①弱,所以;
图④,数据点呈负线性相关,且相关性比图②弱,所以;
所以.
【变式3-1】(25-26高二下·全国·课后作业)两个变量负相关时,散点图的特征是( )
A.点散布在从左下角到右上角的区域内
B.点散布在某带形区域内
C.点散布在某圆形区域内
D.点散布在从左上角到右下角的区域内
【答案】D
【知识点】相关关系与函数关系的概念及辨析
【分析】根据两个变量负相关时,散点图的特征进行判断即可.
【详解】有负相关关系的各点整体呈递减趋势,因此点应该散布在从左上角到右下角的区域内.
故选:D
【变式3-2】(2026·上海闵行·二模)以下是由变量与所绘制的散点图,则它们的线性相关程度较高且正相关的是( )
A. B.
C. D.
【答案】D
【知识点】判断正、负相关、根据散点图判断是否线性相关
【详解】对于A:散点杂乱无章,无规律可言,看不出两个变量有什么相关性;故A错误;
对于B:两个变量不具有线性相关性,故B错误;
对于C:两个变量之间的关系为负相关关系;故C错误;
对于D:两个变量之间的关系为正相关关系,且散点图中的点分布在一条直线附近,线性相关程度较高;故D正确.
【变式3-3】(多选)(2026·辽宁抚顺·一模)年我国粮食产量(单位:万吨)如图所示,下列结论正确的是( )
A.年我国粮食产量逐年增加
B.年我国粮食产量的中位数为万吨
C.年我国粮食产量的极差为万吨
D.年我国粮食产量与年份负相关
【答案】AB
【知识点】判断正、负相关、计算几个数据的极差、方差、标准差、计算几个数的中位数、根据条形统计图解决实际问题
【分析】利用条形图结合中位数、极差以及相关性逐项判断即可.
【详解】对于A选项,年我国粮食产量逐年增加,A正确.
对于B选项,年我国粮食产量的中位数为万吨,B正确.
对于C选项,年我国粮食产量的极差为万吨,C错误.
对于D选项,年我国粮食产量与年份正相关,D错误.
题型04 绘制散点图及其应用
【典例4】(24-25高二下·全国·课后作业)有人收集了10年中某城市居民年收入(即此城市所有居民在一年内的收入的总和)与某种商品的销售额的有关数据:(单位:亿元)
第年
1
2
3
4
5
6
7
8
9
10
年收入
32.2
31.1
32.9
35.8
37.1
38.0
39.0
43.0
44.6
46.0
销售额
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
(1)画出散点图,你能从散点图中发现居民年收入与该种商品销售额之间的近似关系吗?
(2)如果它们之间近似呈线性关系,请画出一条直线来近似表示这种关系.
【答案】(1)散点图见解析,线性相关关系
(2)图象见解析
【知识点】绘制散点图、根据散点图判断是否线性相关
【分析】(1)根据表里数据标点即可;
(2)根据散点图即可画出一条直线.
【详解】(1)散点图如图所示:
从散点图中可以看出年收入与销售额之间的总体趋势成一条直线,也就是说它们之间是线性相关关系.
(2)所画直线如图所示.
【变式4-1】(24-25高二·全国·课堂例题)某种木材体积与树木的树龄之间有如下的对应关系:
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
若该种木材每单位体积的价值是元,作出木材的价值与树龄之间关系的散点图.
【答案】图象见解析
【知识点】绘制散点图
【分析】根据题设得到木材的价值与树龄之间的关系,利用这个关系作出图象即可求解.
【详解】木材的价值与树龄之间的关系如表所示:
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
价值
2400
2720
3200
4800
4400
4960
5600
以轴表示树木的树龄,轴表示树木的价值,可得相应的散点图如图所示:
【变式4-2】(25-26高二上·全国·课后作业)山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
【答案】(1)散点图见详解
(2)具有相关关系
【知识点】判断两个变量是否有相关关系、绘制散点图
【分析】(1)根据已知中表中7块并排、形状大小相同的试验田上,施化肥量x和产量y所得的数据,描点后可得散点图;
(2)根据(1)中散点图中的点大致分布在一个带状区域内(一条直线附近)可得两个变量具有相关关系.
【详解】(1)根据已知表格中的数据可得施化肥量x对产量y的散点图如下所示:
(2)根据(1)中散点图可知,各组数据对应点大致分布在一个带状区域内(一条直线附近),
故施化肥量x和产量y具有线性相关关系。
【变式4-3】(24-25高二下·全国·课后作业)下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:
气温(℃)
25
18
12
10
4
0
杯数
18
30
37
35
50
54
(1)根据表中的数据画出散点图;
(2)你能从散点图中发现气温与热茶杯数近似成什么关系吗?
【答案】(1)散点图见解析
(2)成线性相关关系
【知识点】绘制散点图、判断两个变量是否有相关关系
【分析】(1)根据题目所给的表格便可以画出散点图,
(2)根据散点图即可以看出气温与热茶杯数的关系.
【详解】(1)根据表中的数据画出该小卖部6天卖出热茶的杯数与当天气温的散点图,如图.
(2)从散点图中可以看出气温与卖出的热茶杯数近似地成线性相关关系,
且当气温越高时,所卖出的热茶的杯数就越少.
题型05 相关系数的意义及辨析
【典例5】(23-24高二下·江苏扬州·月考)设变量X和变量Y的样本相关系数为,变量U和变量V的样本相关系数为,且,,则( )
A.X和Y之间虽正线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
B.X和Y之间呈负线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
C.U和V之间呈负线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
D.U和V之间呈正线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
【答案】D
【知识点】相关系数的意义及辨析
【分析】根据变量间的相关系数的意义和辨析即可得出结果.
【详解】由线性相关系数,可知变量与之间呈负线性相关关系,
由线性相关系数,可知变量与之间呈正线性相关关系,
又,
所以与的线性相关程度弱于与的线性相关程度.
故选:D.
【变式5-1】(25-26高三上·河北邢台·月考)若甲、乙、丙、丁四组数据的相关系数分别为,,0.23,0.88,则在这四组数据中,线性相关性最强的是( )
A.甲组 B.乙组 C.丙组 D.丁组
【答案】A
【知识点】相关系数的意义及辨析
【分析】根据相关系数的含义,其绝对值越接近1,线性相关性越强.
【详解】根据题意,线性相关系数的绝对值越大,线性相关性越强.
因为,
故线性相关性最强的是甲组.
故选:A.
【变式5-2】(2026·天津河西·二模)某研究小组为了探究变量x与y之间的线性相关关系,收集了5组数据,(),并绘制成如图所示的散点图(点A,B,C,D,E).经计算,这5组数据的样本相关系数为r.若去掉点后,剩余4组数据的样本相关系数为,则下列结论正确的是( )
A. B. C. D.
【答案】A
【知识点】相关系数的意义及辨析
【分析】从图中可以看出点较其他点,偏离直线远,所以去掉点后,回归效果更好,结合相关系数的性质判断.
【详解】从散点图中可知,样本数据的两变量是正相关,
由于点较其他点偏离程度大,删除点后,回归效果更好,
从而相关系数的绝对值更接近于1,所以
【变式5-3】(25-26高三下·上海虹口·月考)分别对、、三组成对数据做相关性分析,计算出其对应的相关系数分别为、,,则、、三组相关性的强弱从弱到强排序依次为________.
【答案】
【知识点】相关系数的意义及辨析
【详解】已知三组相关系数的绝对值为:,,,
,
、、三组相关性的强弱从弱到强排序依次为.
题型06 相关系数的计算
【典例6】(25-26高二下·全国·课堂例题)关于两个变量x和y的7组数据如表所示:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
试判断y与x是否线性相关,并刻画它们的相关程度.
【答案】答案见解析
【知识点】相关系数的计算
【分析】应用已知数据先求和及样本中心点,再计算最后与比较判断相关程度.
【详解】,
,
,
,
,
所以
.
又因为,
所以与具有很强的线性相关关系.
【变式6-1】(25-26高二上·全国·单元测试)最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
【答案】A
【知识点】相关系数的计算
【分析】根据相关系数公式计算即可求解.
【详解】,,
,
.
故选:A.
【变式6-2】(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
【答案】答案见解析
【知识点】相关系数的计算
【分析】根据相关系数的计算结果来判断变量之间的相关性.
【详解】由题意,变量与的相关系数,
变量与的相关系数是,
可以看出TC指标值与BMI值,GLU指标值与BMI值都是高度正相关.
【变式6-3】(25-26高二下·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示.
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:;
若,则我们可以认为y与x之间具有较强的线性相关关系.
【答案】这10名学生的两次数学成绩具有较强的线性相关关系
【知识点】相关系数的计算
【分析】根据线性相关关系的概念,以及相关系数计算公式,求出相关系数,判断两组数据是否具有线性相关关系即可.
【详解】由题意知,
,
,
,,.
所以样本相关系数.
,故我们可以认为与之间具有较强的线性相关关系.
即这10名学生的两次数学成绩具有较强的线性相关关系.
题型07 相关系数与向量夹角问题
【典例7】(21-22高二·全国·课后作业)近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机拍取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据,,,数据如下表所示;
城市编号i
1
2
3
4
5
A指标
4
6
2
8
5
B指标
4
4
3
5
4
C指标
3
6
2
5
4
(1)分别求y与x之间的相关系数及z与x之间的相关系数,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数.
参考数据:,,,
,,,.
【答案】(1),,y与x之间的相关性比z与x之间的相关性强;
(2)y与x之间的相关性比z与x之间的相关性强.
【知识点】相关系数的计算、相关系数的意义及辨析
【分析】(1)应用相关系数公式求,并比较大小,即可得结论;
(2)将各数据集中数据减去对应平均数得到数据集对应的向量,应用向量夹角的坐标表示求向量夹角余弦值,根据其符号和绝对值大小,确定结论.
【详解】(1)由已知,,,,
所以,
,
所以y与x、z与x正相关,又,则y与x之间的相关性比z与x之间的相关性强.
(2)由(1)知:,,,
将题表中x,y,z的相关数据分别减去,,,
记,
,
,
则,,,
于是,
,
所以y与x、z与x正相关,又,则y与x之间的相关性比z与x之间的相关性强.
【变式7-1】(24-25高三上·全国·月考)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量.若的样本相关系数为,的样本相关系数为,则的样本相关系数的最大值为( )
附:样本相关系数
A. B. C. D.1
【答案】B
【知识点】用和、差角的余弦公式化简、求值、相关系数的计算
【分析】设,,,,,,与的夹角为,与的夹角为,再由相关系数可知,则与夹角的余弦值的最大值为,利用余弦差角公式求值即可.
【详解】设,,,
,,,
由样本相关系数公式可知,,
设与的夹角为,与的夹角为,则有,
易知均为锐角且,
与夹角的余弦值的最大值为,此时与样本相关系数最大,
,
故的样本相关系数的最大值为.
故选:B.
【变式7-2】(24-25高二下·江西抚州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的100个地块,从这些地块中用简单随机抽样的方法抽取10个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,分别表示这10个样本的植物覆盖面积和这种野生动物的数量的平均值,构造向量,并计算得,由选择性必修第一册教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数______.
【答案】0.96/
【知识点】相关系数的计算
【分析】计算出,故.
【详解】,故,
,
.
故答案为:0.96
【变式7-3】(24-25高三上·宁夏银川·期末)已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为_________.
【答案】
【知识点】相关系数的计算
【分析】利用相关系数公式可看成两个维向量的夹角公式,从而把相关系数问题转化为向量夹角问题,即可求解.
【详解】设,,,
则有,,,
由相关系数公式可知,
设与夹角为,与夹角为,
由和的样本相关系数为,所以,和的样本相关系数为,所以,
由这两个夹角为锐角,所以,所以与的夹角可能为,,
则与的夹角余弦最大值为.
故答案为:
一、单选题
1.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
【答案】A
【知识点】相关关系与函数关系的概念及辨析、判断两个变量是否有相关关系
【分析】根据相关关系的定义可得.
【详解】选项B,C,D中的两个变量都具有相关性,且都是一种不确定的关系,是相关关系.
而A中判别式和变量是一种确定的表达式,是一种函数关系,即一种确定的关系,所以不是相关关系.
故选:A
2.(21-22高二下·陕西渭南·期末)在下列4组样本数据的散点图中,样本相关系数最小的是( )
A. B. C. D.
【答案】B
【知识点】相关系数的意义及辨析、判断正、负相关、根据散点图判断是否线性相关
【分析】根据正负相关,以及相关性的强弱即可求解.
【详解】由图可知:,
由于图2的相关性比图4的相关性更强,故,
故选:B
3.(25-26高二上·陕西渭南·期末)已知甲,乙,丙,丁四组成对样本数据对应的线性相关系数分别为,则线性相关程度最强的是( )
A.甲组 B.乙组 C.丙组 D.丁组
【答案】D
【知识点】相关系数的意义及辨析
【分析】根据相关系数的性质即可得到答案.
【详解】相关系数的绝对值越大,则其相关程度越强,
又因为,所以线性相关程度最强的是丁组.
故选:D.
4.(25-26高二下·上海·月考)通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是( ).
A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【答案】B
【知识点】判断正、负相关、相关系数的意义及辨析
【详解】改变变量的单位,线性相关系数不变,C、D错;
去除A点后,线性相关程度变高,
因为是负相关,所以线性相关系数变小,故A错误、B正确.
5.(25-26高二下·上海·期中)某校随机抽取50名学生的身高与体重的散点图如下所示,则下列说法错误的是( )
A.身高越高,体重越重;
B.身高与体重同向变动的倾向;
C.身高与体重之间有明显的相关性;
D.身高与体重成正相关
【答案】A
【知识点】判断正、负相关、根据散点图判断是否线性相关、判断两个变量是否有相关关系
【详解】对于A,由于身高比较高的人,其体重可能大,也可能小,则选项A不正确;
对于B,由散点图知,身高增加时,体重也呈现增加的趋势,有同向变动的倾向,B正确;
对于C,身高和体重有明显的相关性,C正确;
对于D,身高增加时,体重也呈现增加的趋势,所以身高与体重呈正相关,D正确.
6.(25-26高二下·辽宁沈阳·月考)如图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( ).
A. B.
C. D.
【答案】A
【知识点】根据散点图判断是否线性相关
【详解】选项A的散点分布杂乱,没有明显的线性趋势,即散点不集中在一条直线附近,因此不适合用线性回归模型拟合;
选项B、C、D的散点都大致分布在一条直线附近,存在明显线性相关关系,适合线性回归模型拟合.
7.(24-25高二下·山东枣庄·期末)下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
【答案】C
【知识点】相关系数的计算、相关系数的意义及辨析
【分析】观察数据,对于①,样本相关系数为1,对于③,样本相关系数为-1,再对②和④进行观察和计算,最终可得答案.
【详解】对于①,数据均在上,故样本相关系数为1,
对于③,数据均在上,故样本相关系数为-1,
对于②,可看出其数据为正相关,故样本相关系数大于0,
对于④,显然所有数据无法落在某一个一次函数上,故,
事实上,
,
其中,故,
故,
综上,样本相关系数最小的是③.
故选:C
8.(25-26高三·全国·一轮复习)为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度( )
x
5
10
15
20
25
y
103
105
110
111
114
(参考数据:,,,≈15.8,≈9.01)
A.很强 B.很弱
C.无相关 D.不确定
【答案】A
【知识点】相关系数的意义及辨析、相关系数的计算
【分析】先计算线性相关系数 ,再通过 ()的绝对值判断相关强度( 越接近1,线性相关程度越强).
【详解】解析:由题可知样本量 ,所以:
=15,
=108.6,
又因为:,,,,≈15.8,
所以:
=,
因为相关系数很接近于1,故两个变量的线性相关程度很强.
答案:A.
二、多选题
9.(25-26高二上·全国·单元测试)某统计部门对四组成对样本数据进行统计分析后,获得如图所示的散点图,关于样本相关系数的比较,其中正确的是( )
A. B. C. D.
【答案】CD
【知识点】相关系数的意义及辨析
【分析】利用散点图去比较相关系数的大小即可.
【详解】由题中散点图可知(1)(3)为正相关,(2)(4)为负相关,
故,,,.
又因为(1)与(2)中散点图更接近于一条直线,故,,
所以.
故选:CD.
10.(25-26高二上·黑龙江齐齐哈尔·期末)通过随机抽样,得到变量和变量的7对数据,并绘制成散点图如图所示,已知变量和变量线性相关,且回归直线是图中直线,则下列说法正确的是( )
A.直线的斜率是负数
B.变量与变量正相关
C.相关系数
D.若去掉图中点后,剩余数据的相关系数变大
【答案】AC
【知识点】相关系数的意义及辨析、判断正、负相关
【分析】根据数据的散点图,结合相关性、相关系数的概念与定义,逐项判定,即可得解.
【详解】对于A、B、C:由图可知直线的斜率是负数,所以变量与变量负相关,相关系数,故A、C正确,B错误;
对于D:若去掉图中点后,剩余的数据会更集中,相关程度会更高,相关系数的绝对值变大,又,所以相关系数变小,故D错误.
故选:AC.
11.(25-26高二下·全国·课后作业)(多选)下列关于相关系数的说法正确的是( )
A.相关系数越大两个变量间相关性越强
B.相关系数的取值范围为
C.相关系数时两个变量正相关,时两个变量负相关
D.相关系数时,样本点在同一直线上
【答案】BCD
【知识点】相关系数的意义及辨析
【分析】根据相关系数的意义对每个结论进行分析、判断可得错误的结论.
【详解】对于相关系数,有以下结论:①当时,表明两个变量正相关;当时,表明两个变量负相关.
②的绝对值越接近于,表明两个变量的线性相关性越强;的绝对值越接近于,表明两个变量之间几乎不存在线性相关关系.
对于A,当时此结论不成立,所以A不正确.
对于B,由相关系数的性质可得,所以B正确.
对于C,由相关系数的性质可得正确.
对于D,由相关系数的性质可得正确.
故选:BCD.
三、填空题
12.(25-26高二上·安徽淮北·期末)已知一组变量线性相关,样本相关系数,现将坐标原点平移到点,则大多数点应该落在第____象限.
【答案】二、四
【知识点】相关系数的意义及辨析
【分析】根据负相关的散点图特点,判断结果即可.
【详解】因为,所以变量负相关,则在以为坐标原点的坐标系下的散点图,大多数点应该落在第二、四象限.
13.(24-25高二下·河北沧州·期中)某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数__________.(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
【答案】
【知识点】计算几个数的平均数、相关系数的计算
【分析】根据表中数据求出,进而得出的值,代入公式计算即可得出答案.
【详解】由已知可得,,
,
则,
,
所以,.
故答案为:.
14.(2025·上海奉贤·二模)通过随机抽样,获得某种商品消费者年需求量与该商品每千克价格之间的一组数据调查,如下表所示:
价格(百元)
4
4
4.6
5
5.2
5.6
6
6.6
7
10
需求量(千克)
3.5
3
2.7
2.4
2.5
2
1.5
1.2
1.2
1
那么线性相关系数______________.(精确到)线性相关系数公式
【答案】
【知识点】相关系数的计算
【分析】利用相关系数公式计算即可.
【详解】由题意可得,
,
所以
,
,
所以.
故答案为:.
四、解答题
15.(24-25高二下·江苏淮安·月考)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
参考数据:.
参考公式:相关系数.
【答案】(1),
(2)
【知识点】计算几个数的平均数、相关系数的计算
【分析】(1)利用平均数计算公式得到和;
(2)先计算出,利用公式计算出相关系数.
【详解】(1)由题可知,
;
(2)计算得,
故;
16.(24-25高二下·全国·课后作业)春节期间,由于调整免费,车流量逐渐增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表:
车流量/万辆
12
12.5
13
13.5
14
空气质量指数
74
76
78
77
80
(1)在下图中绘制出散点图;
(2)由(1)判断与的线性相关程度,并用相关系数加以说明.
参考公式:相关系数.
参考数据:,,.
【答案】(1)散点图见解析
(2)与的线性相关程度较高
【知识点】绘制散点图、相关系数的计算
【分析】(1)根据表里数据标点即可;
(2)根据表格中的数据,结合相关系数的公式,准确运算,即可求解;
【详解】(1)依题意,画出散点图如图.
(2)与有较强的线性相关程度.理由如下:
因为,
,
,
,
,
所以.
所以与的线性相关程度较高.
17.(24-25高二·全国·课堂例题)某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋的出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
1
2
3
4
5
6
每袋的出厂价格(元)
10.5
10.9
11
11.5
12
12.5
月销售量(万袋)
2.2
2
1.9
1.8
1.5
1.4
(1)计算该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格、平均月销售量和平均月销售收入;
(2)求每袋的出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若,则认为相关性很强,试判断该食品加工厂研制的袋装食品每袋的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数.
【答案】(1)11.4(元),(万元).
(2)-0.98
(3)该食品加工厂研制的袋装食品每袋的出厂价格与月销售量有较强的相关性.
【知识点】计算几个数的平均数、相关系数的计算、相关系数的意义及辨析
【分析】(1)由表格中的数据求相应的平均值;
(2)利用样本相关系数公式计算;
(3)由样本相关系数的值判断相关性的强弱.
【详解】(1)由题表得,该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格为(元).
平均月销售量为(万袋),
平均月销售收入为(万元).
(2)由题表及(1)得,
所以样本相关系数
.
(3)因为,所以该食品加工厂研制的袋装食品每袋的出厂价格与月销售量有较强的相关性.
1 / 17
学科网(北京)股份有限公司
$
专题4.1 成对数据的统计相关性
教学目标
1.结合实例,理解成对数据与相关关系的概念,能区分函数关系与相关关系。
2.会画散点图,能通过散点图直观判断两个变量的正相关、负相关、线性相关趋势。
3.了解样本相关系数r的统计含义、取值范围([-1,1])及性质,掌握其计算公式,能利用公式计算简单数据的相关系数。
4.能根据相关系数r的绝对值大小,定量判断线性相关的强弱(|r|越接近1,线性相关性越强;|r|接近 0,线性相关性越弱)。
教学重难点
1.重点:
(1)用散点图直观识别两个变量的线性相关关系(正相关、负相关、强弱趋势)。
(2)样本相关系数 r的统计含义、计算公式及性质。
(3)利用相关系数 r 定量判断线性相关的强弱。
2.难点:
(1) 相关系数 r 的统计意义与几何意义的理解(为何 r 能刻画线性相关程度,r 与向量夹角的关系)。
(2)相关系数公式的推导与灵活运用(公式结构复杂,易混淆;数据中心化处理的理解)。
(3)区分 “线性相关” 与 “非线性相关”:散点图有趋势但 | r | 不大时,能判断为非线性相关。
(4)实际问题的相关性分析:结合背景解释相关关系,避免将相关性误判为因果关系。
知识点01 散点图
1.散点图:建立直角坐标系,每对数据(Hi,Wi)都可在直角坐标系中用一个点Pi(i=1,2,…,12)表示。这些点称为散点,由坐标系及散点形成的数据图叫作散点图。
2.相关关系:
如果两个变量之间的关系近似地表现为一条直线,则称它们有线性相关关系,简称为相关关系;
3.线性关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.
【即学即练】
(25-26高二下·全国·课堂例题)10对中国父子的身高(英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
试根据上述资料:
(1)画出散点图;
(2)变量和之间是否具有线性关系?
(3)人们常说,父亲高,儿子肯定不矮,你赞成这种说法吗?
知识点02 相关系数
1.相关系数的定义:
一般地,对 n 个成对观测数据 (x1,y1),(x2,y2),…,(xn,yn),我们用 {xi} 表示数据x1,x2,…,xn,用 {yi} 表示数据 y1,y2,…,yn。
其中:均值:
标准差:
协方差:,称
为 {xi} 和 {yi} 的相关系数。
2.相关系数的性质
(1)取值范围与相关性类型:rxy的取值范围是 [−1,1]:
当 0<rxy<1 时,称 {xi} 和 {yi} 正相关;
当 −1<rxy<0 时,称 {xi} 和 {yi} 负相关;
当 rxy=0 时,称 {xi} 和 {yi} 不相关。
(2)线性相关程度的判断:∣rxy∣ 越接近于 1,变量 x,y 的线性相关程度越高,此时数据点(x1,y1),(x2,y2),…,(xn,yn) 越集中在一条直线附近。
(3)线性相关程度的判断:∣rxy∣越接近于 0,变量 x,y 的线性相关程度越低。
(4)对称性:rxy 具有对称性,即 rxy=ryx。
(5)线性相关的局限性rxy :仅仅是变量 x 与 y 之间线性相关程度的一个度量。rxy=0 只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系。
【即学即练】(25-26高二下·全国·课堂例题)一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高与右手长度进行测量得到如下数据(单位:cm):
身高
168
170
171
172
174
176
178
178
180
181
右手长度
19.0
20.0
21.0
21.5
21.0
22.0
23.0
24.0
22.5
23.0
(1)判断两者有无线性相关关系;
(2)如果具有线性相关关系,判断相关性的强弱.
知识点03 多组数据的相关性
考虑将其分成几个不同两组数据分别进行相关性分析。
【即学即练】(2023高二·全国·专题练习)某男孩的年龄与身高的统计数据如下.
年龄/岁
1
2
3
4
5
6
身高/cm
78
87
98
108
115
120
画出散点图,并判断它们是否有相关关系?如果有相关关系,是正相关还是负相关?
知识点04 相关系数与向量夹角
1. 成对数据的向量表示
(1)将成对观测数据 (x1,y1),(x2,y2),…,(xn,yn) 转化为 n 维向量形式:
· 原始数据向量:X=(x1,x2,…,xn),Y=(y1,y2,…,yn)
·
中心化数据向量(减去均值):a=(x1−,x2−,…,xn−),b=(y1−,y2−,…,yn−)。
(2)向量夹角公式:
2.结论:(1)样本相关系数 r 等于中心化数据向量夹角的余弦值。
(2)两向量夹角的取值范围为[0,π],其余弦值的取值范围为[−1,1]。
(3)当夹角属于[0, )时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低。
当夹角属于(,π]时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高。
当夹角为时,余弦值为0,这说明两组数据不相关。
【即学即练】(2025·上海·模拟预测)已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为_____.
(附:相关系数
题型01 相关关系与函数关系的概念及辨析
【典例1】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【变式1-1】(25-26高二上·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.光照时间和果树亩产量 B.降雪量和交通事故发生率
C.每亩田施肥量和粮食亩产量 D.圆的面积和半径
【变式1-2】(25-26高二下·全国·课后作业)下面变量之间是相关关系的是( )
A.出租车费与行驶的里程
B.正方形面积与边长
C.人的身高与体重
D.铁的体积与质量
【变式1-3】(25-26高二下·全国·课堂例题)下列两个变量之间,是相关关系的有( )
①角度与它的余弦值;②人的体重与视力;③正n边形的边数和它的内角度数之和;④圆心角的大小与所对的圆弧长;⑤光照时间和果树亩产量;⑥收入水平与购买能力;⑦正方体的棱长与体积.
A.①④⑥ B.②⑤⑥⑦ C.⑤⑥ D.③⑤⑦
题型02 判断两个变量是否有相关关系
【典例2】(2025高二·全国·专题练习)在下列各图中,两个变量具有相关关系的是( ).
A.①② B.①③ C.② D.②③
【变式2-1】(多选)(24-25高二下·全国·课后作业)下列关系中,是相关关系的为( )
A.学生的学习态度与学习成绩之间的关系
B.教师的教学水平与学生的学习成绩之间的关系
C.学生的身高与学生的学习成绩之间的关系
D.家庭的经济条件与学生的学习成绩之间的关系
【变式2-2】(多选)(25-26高二下·全国·课堂例题)(多选)在下列各变量之间的关系中,属于相关关系的是( )
A.汽车的重量和百公里耗油量 B.正n边形的边数与内角度数之和
C.一块农田的小麦产量与施肥量 D.家庭的经济条件与学生的学习成绩
【变式2-3】(多选)(24-25高二下·全国·课后作业)有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③森林中同一种树木,其断面直径与高度之间的关系;④角的度数与它的正弦值.其中,具有相关关系的是( )
A.① B.② C.③ D.④
题型03 判断正、负相关关系
【典例3】(25-26高三下·上海·月考)对四组数据进行统计,获得如图所示的散点图,其中相关系数最小的是( )
A. B. C. D.
【变式3-1】(25-26高二下·全国·课后作业)两个变量负相关时,散点图的特征是( )
A.点散布在从左下角到右上角的区域内
B.点散布在某带形区域内
C.点散布在某圆形区域内
D.点散布在从左上角到右下角的区域内
【变式3-2】(2026·上海闵行·二模)以下是由变量与所绘制的散点图,则它们的线性相关程度较高且正相关的是( )
A. B.
C. D.
【变式3-3】(多选)(2026·辽宁抚顺·一模)年我国粮食产量(单位:万吨)如图所示,下列结论正确的是( )
A.年我国粮食产量逐年增加
B.年我国粮食产量的中位数为万吨
C.年我国粮食产量的极差为万吨
D.年我国粮食产量与年份负相关
题型04 绘制散点图及其应用
【典例4】(24-25高二下·全国·课后作业)有人收集了10年中某城市居民年收入(即此城市所有居民在一年内的收入的总和)与某种商品的销售额的有关数据:(单位:亿元)
第年
1
2
3
4
5
6
7
8
9
10
年收入
32.2
31.1
32.9
35.8
37.1
38.0
39.0
43.0
44.6
46.0
销售额
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
(1)画出散点图,你能从散点图中发现居民年收入与该种商品销售额之间的近似关系吗?
(2)如果它们之间近似呈线性关系,请画出一条直线来近似表示这种关系.
【变式4-1】(24-25高二·全国·课堂例题)某种木材体积与树木的树龄之间有如下的对应关系:
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
若该种木材每单位体积的价值是元,作出木材的价值与树龄之间关系的散点图.
【变式4-2】(25-26高二上·全国·课后作业)山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x
15
20
25
30
35
40
45
棉花产量y
330
345
365
405
445
450
455
(1)画出散点图;
(2)判断是否具有相关关系.
【变式4-3】(24-25高二下·全国·课后作业)下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:
气温(℃)
25
18
12
10
4
0
杯数
18
30
37
35
50
54
(1)根据表中的数据画出散点图;
(2)你能从散点图中发现气温与热茶杯数近似成什么关系吗?
题型05 相关系数的意义及辨析
【典例5】(23-24高二下·江苏扬州·月考)设变量X和变量Y的样本相关系数为,变量U和变量V的样本相关系数为,且,,则( )
A.X和Y之间虽正线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
B.X和Y之间呈负线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
C.U和V之间呈负线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
D.U和V之间呈正线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
【变式5-1】(25-26高三上·河北邢台·月考)若甲、乙、丙、丁四组数据的相关系数分别为,,0.23,0.88,则在这四组数据中,线性相关性最强的是( )
A.甲组 B.乙组 C.丙组 D.丁组
【变式5-2】(2026·天津河西·二模)某研究小组为了探究变量x与y之间的线性相关关系,收集了5组数据,(),并绘制成如图所示的散点图(点A,B,C,D,E).经计算,这5组数据的样本相关系数为r.若去掉点后,剩余4组数据的样本相关系数为,则下列结论正确的是( )
A. B. C. D.
【变式5-3】(25-26高三下·上海虹口·月考)分别对、、三组成对数据做相关性分析,计算出其对应的相关系数分别为、,,则、、三组相关性的强弱从弱到强排序依次为________.
题型06 相关系数的计算
【典例6】(25-26高二下·全国·课堂例题)关于两个变量x和y的7组数据如表所示:
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
试判断y与x是否线性相关,并刻画它们的相关程度.
【变式6-1】(25-26高二上·全国·单元测试)最近7年,我国生活垃圾无害处理量如下表:
年份序号
1
2
3
4
5
6
7
处理量
通过计算得,,,,则样本相关系数( )
A.0.99 B.0.95 C.0.9 D.0.85
【变式6-2】(25-26高二下·全国·课堂例题)为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mmol/L),空腹血糖GLU指标值(单位:mmol/L)如表所示:
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
GLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、GLU指标值与BMI值的相关程度.
参考公式:
相关系数,
参考数据:,,,,,,,.
【变式6-3】(25-26高二下·全国·课堂例题)现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示.
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?
注:;
若,则我们可以认为y与x之间具有较强的线性相关关系.
题型07 相关系数与向量夹角问题
【典例7】(21-22高二·全国·课后作业)近年来,“共享汽车”在我国各城市迅猛发展,为人们的出行提供了便利,但也给城市交通管理带来了一些困难.为了解“共享汽车”在M省的发展情况,M省某调查机构从该省随机拍取了5个城市,分别收集和分析了“共享汽车”的A,B,C三项指标数据,,,数据如下表所示;
城市编号i
1
2
3
4
5
A指标
4
6
2
8
5
B指标
4
4
3
5
4
C指标
3
6
2
5
4
(1)分别求y与x之间的相关系数及z与x之间的相关系数,并比较y与x,z与x之间相关性的强弱;
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数.
参考数据:,,,
,,,.
【变式7-1】(24-25高三上·全国·月考)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量.若的样本相关系数为,的样本相关系数为,则的样本相关系数的最大值为( )
附:样本相关系数
A. B. C. D.1
【变式7-2】(24-25高二下·江西抚州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的100个地块,从这些地块中用简单随机抽样的方法抽取10个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,分别表示这10个样本的植物覆盖面积和这种野生动物的数量的平均值,构造向量,并计算得,由选择性必修第一册教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数______.
【变式7-3】(24-25高三上·宁夏银川·期末)已知高中学生的数学成绩,物理成绩,化学成绩两两成正相关关系,随机抽取10名同学,数学成绩和物理成绩的样本线性相关系数为,物理成绩与化学成绩的样本线性相关系数为,求的样本线性相关系数的最大值为_________.
一、单选题
1.(25-26高二下·全国·单元测试)下列变量之间的关系不是相关关系的是( )
A.已知二次函数,其中是常数,取为自变量,因变量为这个函数对应方程的判别式
B.光照时间和果树产量
C.降雪量和交通事故的发生率
D.土地施用肥料量和粮食产量
2.(21-22高二下·陕西渭南·期末)在下列4组样本数据的散点图中,样本相关系数最小的是( )
A. B. C. D.
3.(25-26高二上·陕西渭南·期末)已知甲,乙,丙,丁四组成对样本数据对应的线性相关系数分别为,则线性相关程度最强的是( )
A.甲组 B.乙组 C.丙组 D.丁组
【答案】D
【知识点】相关系数的意义及辨析
【分析】根据相关系数的性质即可得到答案.
【详解】相关系数的绝对值越大,则其相关程度越强,
又因为,所以线性相关程度最强的是丁组.
故选:D.
4.(25-26高二下·上海·月考)通过随机抽样绘制得到如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.下列说法正确的是( ).
A.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
B.若去掉图中右下方的点后,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
C.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.将“每千克价格”的单位由百元变为元,“每千克价格”与“年需求量”这两个变量的线性相关系数变小
5.(25-26高二下·上海·期中)某校随机抽取50名学生的身高与体重的散点图如下所示,则下列说法错误的是( )
A.身高越高,体重越重;
B.身高与体重同向变动的倾向;
C.身高与体重之间有明显的相关性;
D.身高与体重成正相关
6.(25-26高二下·辽宁沈阳·月考)如图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( ).
A. B.
C. D.
7.(24-25高二下·山东枣庄·期末)下列四组成对数据:①,,,,;②,,,,;③,,,,;④,,,,.其中样本相关系数最小的是( )(附:样本相关系数)
A.① B.② C.③ D.④
8.(25-26高三·全国·一轮复习)为考察两个变量x,y的相关性,搜集数据如表,则两个变量的线性相关程度( )
x
5
10
15
20
25
y
103
105
110
111
114
(参考数据:,,,≈15.8,≈9.01)
A.很强 B.很弱
C.无相关 D.不确定
二、多选题
9.(25-26高二上·全国·单元测试)某统计部门对四组成对样本数据进行统计分析后,获得如图所示的散点图,关于样本相关系数的比较,其中正确的是( )
A. B. C. D.
10.(25-26高二上·黑龙江齐齐哈尔·期末)通过随机抽样,得到变量和变量的7对数据,并绘制成散点图如图所示,已知变量和变量线性相关,且回归直线是图中直线,则下列说法正确的是( )
A.直线的斜率是负数
B.变量与变量正相关
C.相关系数
D.若去掉图中点后,剩余数据的相关系数变大
11.(25-26高二下·全国·课后作业)(多选)下列关于相关系数的说法正确的是( )
A.相关系数越大两个变量间相关性越强
B.相关系数的取值范围为
C.相关系数时两个变量正相关,时两个变量负相关
D.相关系数时,样本点在同一直线上
三、填空题
12.(25-26高二上·安徽淮北·期末)已知一组变量线性相关,样本相关系数,现将坐标原点平移到点,则大多数点应该落在第____象限.
13.(24-25高二下·河北沧州·期中)某工厂统计了甲产品在2024年7月至12月的销售量(单位:万件),得到以下数据:
月份
7
8
9
10
11
12
销售量
11
12
14
15
18
20
根据表中所给数据,可得相关系数__________.(结果用四舍五入法保留2位小数)
(参考公式:相关系数,参考数据:,)
14.(2025·上海奉贤·二模)通过随机抽样,获得某种商品消费者年需求量与该商品每千克价格之间的一组数据调查,如下表所示:
价格(百元)
4
4
4.6
5
5.2
5.6
6
6.6
7
10
需求量(千克)
3.5
3
2.7
2.4
2.5
2
1.5
1.2
1.2
1
那么线性相关系数______________.(精确到)线性相关系数公式
四、解答题
15.(24-25高二下·江苏淮安·月考)某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
参考数据:.
参考公式:相关系数.
16.(24-25高二下·全国·课后作业)春节期间,由于调整免费,车流量逐渐增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表:
车流量/万辆
12
12.5
13
13.5
14
空气质量指数
74
76
78
77
80
(1)在下图中绘制出散点图;
(2)由(1)判断与的线性相关程度,并用相关系数加以说明.
参考公式:相关系数.
参考数据:,,.
17.(24-25高二·全国·课堂例题)某食品加工厂新研制出一种袋装食品(规格:500g/袋),下面是近六个月每袋的出厂价格(单位:元)与销售量(单位:万袋)的对应关系表:
月份序号
1
2
3
4
5
6
每袋的出厂价格(元)
10.5
10.9
11
11.5
12
12.5
月销售量(万袋)
2.2
2
1.9
1.8
1.5
1.4
(1)计算该食品加工厂这六个月内这种袋装食品平均每袋的出厂价格、平均月销售量和平均月销售收入;
(2)求每袋的出厂价格与月销售量的样本相关系数(精确到0.01);
(3)若,则认为相关性很强,试判断该食品加工厂研制的袋装食品每袋的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数.
1 / 17
学科网(北京)股份有限公司
$