内容正文:
【解析版】 8.1 成对数据的相关分析
选择性必修第二册 第8章 成对数据的统计分析
初中学习的平面几何,研究的是平面上的一些简单图形及其几何性质;从本章开始,我们将把视野从二维的平面拓展到三维的空间;在三维空间中的图形统称为空间图形或立体图形;立体几何所研究的就是一些简单的空间图形及其几何性质;
从平面几何到立体几何,我们要注意借鉴平面几何中已有的一些概念、方法和结论,更要特别注意立体几何和平面几何之间的区别;以本章学习的空间直线与平面为例,我们不仅要研究平面这类典型的空间图形,而且要对“直线”有更为深刻的认识;我们生活在一个三维世界中,立体几何的学习有助于我们从几何的角度更好地理解现实的世界,并且锻炼我们的几何直观想象能力;因此,在学习中,要着重注意几何的直观和内涵,不要仅仅停留在表面上的严格推导和论证,还要多画一些示意图来帮助理解,这样才能更好地掌握几何的实质,逐步培养自己的立体感和空间想象能力;
在必修课程第13章“统计”中,我们主要研究了来自单一变量数据的一些统计特征,如集中趋势、离散程度、分布等.但现实世界中许多事物和现象之间都是有联系的;在本章中,我们将主要学习来自两个变量的成对数据的相关分析和回归分析,掌握它们之间的统计规律;本章将要学习的相关分析、回归分析及 检验都属于推断性统计方法,它们在构建统计模型、预测结果和因果分析等方面有许多应用;在必修课程中学过的散点图是进行成对数据统计分析的基础,通过观察散点图可以大致了解数据的整体形态和偏离情况,发现两组数据之间的变化规律,构建适当的统计模型.统计图表不仅可以直观地表示数据及其规律,也是
建立统计直觉的重要途径;
【本章教材目录】第8章 成对数据的统计分析
8.1 成对数据的相关分析
8.1.1成对数据间的关系;8.1.2相关系数
8.2 一元线性回归分析
8.2.1一元线性回归分析的基本思想;8.2.2一元线性回归分析的应用举例
8.3 2x2列联表
8.3.12x2列联表独立性检验;8.3.2 独立性检验的具体应用
【本章内容提要】
相关分析和一元线性回归分析是研究两个变量关系的两个互为补充的方法;相关分析描述了两个变量的相关程度,而回归分析则描述了因变量是怎样受自变量影响的;
1、为了得到两个变量之间是否具有一定关系的直观印象,可以用散点图来描述这些数据;
2、相关系数可以度量两个随机变量之间的线性关系;相关系数的值满足,且越接近1,两个随机变量的线性关系越密切;
3、回归方程代表了两个变量间的关系,回归直线经过散点图中数据点的中心;回归直线的斜率越大,解释变量狓的一个单位变化所引起的反应变量狔的波动就越大;
4、回归方程可以通过最小二乘法得到.回归直线能较好地反映一个变量对另一个变量的依赖情况,具有解释因果关系和预测的功能.利用回归方程可以由解释变量的值来预测反应变量的值,从而给出反应变量真实值的一个估计;
5、2×2列联表描述两个分类变量所有值的组合数据是如何分布的.判断2×2列联表中出现的两个分类变量是否独立可采用 检验; 检验的一般步骤是:(1)提出原假设;(2)确定显著性水平;(3)计算统计量 的值;(4)统计决断:当≥时,拒绝原假设,推断两个变量相关,否则,接受原假设,推断两个变量不相关(即两个变量是独立的);在实际情况下,是否完全拒绝原假设,还需要考虑样本量的大小;
【要点方法解读】
解读点001 变量的相关关系
1、相关分析
把这样来自同一对象的两组数据称为成对数据;研究成对数据相关性的方法称为相关分析;
2、变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;
(2)相关关系的分类:正相关和负相关;
①正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
②负相关:如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关;
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;
例1、下列命题中,两个变量存在相关关系的序号为
①扇形的半径与面积之间的关系
②降雪量与交通事故的发生率之间的关系
③人的身高与体重之间的关系
④家庭的支出与收入之间的关系
【提示】理解相关关系与函数关系的区别;
【答案】②③④
【解析】扇形的半径与面积之间的关系是函数关系,其余均为相关关系;
【说明】函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系;函数关系是一种因果关系, 而相关关系不一定是因果关系,也可能是伴随变化而已;
解读点002 用散点图观察两个变量之间的相关性
在必修课程第13章中,我们曾经用散点图观察两个变量之间的相关性;将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的统计图叫做散点图;利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关;
例2、某种树木体积与树木的树龄之间有如下的对应关系:
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
(1)请作出这些数据的散点图;
(2)你能由散点图发现树木体积与树木的树龄近似呈什么关系吗?
【提示】主要规范描点与分析;
【解析】(1)以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示.
(2)由散点图发现树木体积随着树龄的增加呈现增加的趋势,且散点大致落在一条直线附近,所以树木的体积与树龄近似呈线性相关关系;
【说明】判断两个变量x和y是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响;
解读点003 相关系数
(1)设由变量x和 y获得的两组数据分别为xi和yi(i=1,2,…,n),两组数据分别为xi和yi的线性相关系数是两个变量x和 y之间线性相关程度的统计量,其计算公式为:
;其中,;
它们分别是这两组数据的算术平均数;
线性相关系数常常简称相关系数;也称为皮尔逊系数;
(2)样本相关系数r的取值范围为[-1,1].
①若r>0时,成对样本数据正相关;
②若r<0时,成对样本数据负相关;
③当|r|越接近1时,成对样本数据的线性相关程度越强;
④当|r|越接近0时,成对样本数据的线性相关程度越弱;
题型一、相关系数的计算
例3、某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数据:
产量x(件)
1
2
3
4
5
生产总成本y(万元)
3
7
8
10
12
试求y与x的样本相关系数r.(结果保留两位小数)
参考公式:r=.
参考数据:≈10.7.
【提示】注意正确使用公式与正确计算公式中的相关数据;
【解析】==3,==8,
=,=,
(xi-)(yi-)=21.
故样本相关系数r=≈0.98;
【说明】利用样本相关系数r判断线性相关关系,需要应用公式计算出r的值,由于数据较大,有时需要借助计算器.
题型二、相关系数的性质
例4、甲、乙、丙、丁四位同学各自对a,b两变量的线性相关性做试验,并分别求得样本相关系数r如下表:
甲
乙
丙
丁
r
-0.82
-0.78
-0.69
-0.85
则________同学的试验结果体现a,b两变量有更强的线性相关性.
【提示】注意理解相关系数及其性质;
【答案】丁;
【解析】因为0.85>0.82>0.78>0.69,已知相关系数的绝对值越接近1,则两个变量的线性相关性越强,所以能体现出a,b两变量有更强的线性相关性的是丁同学的试验结果;
【说明】样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强;
题型三、判断相关的强弱
例5、近年来,随着互联网的发展,诸如“滴滴打车”“神州专车”等网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:
城市1
城市2
城市3
城市4
城市5
A指标数x
2
4
5
6
8
B指标数y
3
4
4
4
5
经计算得=2,=,
试求y与x之间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系.
附:样本相关系数公式
r=,
参考数据:≈0.55,≈0.95.
【解析】==5,==4, (xi-)(yi-)=6,
故r=
==≈0.95.
因为r≈0.95,所以可以推断y与x线性正相关,且具有较强的线性相关关系;
【说明】线性相关强弱的判断方法;1、散点图:散点图只是粗略作出判断,其图象越接近直线,相关性越强;2、样本相关系数:样本相关系数能够较准确的判断相关的程度,其绝对值越大,相关性越强;
题型四、相关系数的实际应用
例6、以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.
房屋大小x/m2
115
110
80
135
105
销售价格y/万元
24.8
21.6
18.4
29.2
22
(1)画出数据的散点图;
(2)求样本相关系数r,并作出评价.(精确到0.01,已知=60 975,=2 756.8,iyi=12 952)
【解析】(1)画出散点图如图所示.
(2)==109,==23.2,
r==
=eq \f(308,\r(1 570)×\r(65.6))≈0.96,
由此可知,新房屋的销售价格和房屋的大小这两个变量正线性相关,且相关程度很强;
【说明】求成对样本数据的样本相关系数时,可列表计算出样本相关系数所需数据,代入公式即可求出样本相关系数r,对于样本相关系数r,要理解其范围和意义,当r为正数时,表示成对数据正相关,当r为负数时,表示成对数据负相关;另外注意|r|的大小,|r|越大,线性相关程度越高.
题型五、【真题体验】
例7、(2025·天津模拟)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表(用x表示天数,y表示题数):
x
1
2
3
4
5
6
7
y
12
15
16
18
21
24
27
参考数据:=4,=19,x=140,y=2695,xiyi=600,≈2.45,
相关系数r=
=.
由表中数据可知该老师每天一次最多答对题数y与天数x之间是________(填“正”或“负”)相关,其相关系数r≈________(结果保留两位小数).
【答案】正 0.99
【解析】由表中数据知,y随x的增大而增大,所以该老师每天一次最多答对题数y与天数x之间是正相关;计算相关系数为
r=
=
=≈≈0.99.
例8、( 2024年天津市蓟州区高三校考开学考试)对两个变量,进行线性相关检验,得线性相关系数,对两个变量,进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
【提示】根据相关系数的概念与性质分析判断;
【答案】C
【解析】因为线性相关系数,所以,正相关,
因为线性相关系数,所以,负相关,
又因为,所以变量,的线性相关性比,的线性相关性强,
故A、B、D错误,C正确.
故选:C.
例9、(2022年高考全国乙卷数学(理))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
【提示】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值;
【答案】(1);;(2);(3)
【解析】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为,
又已知树木的材积量与其根部横截面积近似成正比,
可得,解之得.
则该林区这种树木的总材积量估计为
【针对性即时练】
1、下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③圆的面积和半径是相关关系.其中正确的是 (将所有正确的序号都填上);
【答案】①②;
【解析】根据函数关系及相关关系的定义,①函数关系是一种确定性关系;②相关关系是一种非确定性关系,是正确的;③圆的面积和半径是函数关系,故错误;
2、命题①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图可以大致判断两个相关变量是正相关还是负相关.其中正确的命题是
【答案】③④;
【解析】客观现象之间存在的相互依存关系叫相关关系,是一种不确定的关系,函数关系是一种确定的关系.①任何两个变量不一定都具有相关关系,故①错误;②圆的周长与该圆的半径是函数关系,而不是具有相关关系,故②错误;③某商品的需求量与该商品的价格是一种非确定性关系,故③正确;④根据散点图可以大致判断两个相关变量是正相关还是负相关. 上升趋势就是正相关,下降趋势就是负相关.故④正确.
3、5名学生的数学和物理成绩(单位:分)如下:
A
B
C
D
E
数学成绩
80
75
70
65
60
物理成绩
70
66
68
64
62
判断数学成绩与物理成绩是否具有线性相关关系; (填:“有”与“无”)
【提示】根据散点图判断;
【答案】有;
【解析】以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.
由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系;
【说明】本题考查利用散点图判断两个变量是否线性相关,同时考查了数据分析与数学抽象的核心素养;
4、两个变量的相关关系有①正相关、②负相关、③不相关,则下列散点图从左到右分别反映的变量间的相关关系的序号依次是
【答案】①③②;
【解析】对于(1),图中的点成带状分布,且从左到右上升,是正相关关系;对于(2),图中的点没有明显的带状分布,是不相关的;对于(3),图中的点成带状分布,且从左到右是下降的,是负相关关系.
5、如图所示,有5组数据:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉________组数据后剩下的4组数据的线性相关系数最大.
【答案】C
【解析】仔细观察点A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),可知点A,B,D,E在一条直线附近,而C点明显偏离此直线上,由此可知去掉点C后,使剩下的四点组成的数组相关关系数最大.
6、变量、的散点图如图所示,那么、之间的样本相关系数最接近的值为
【答案】0;
【解析】根据变量、的散点图,得、之间的样本相关关系非常不明显,
所以,相关系数最接近的值应为0.
7、若已知(xi-)2是(yi-)2的两倍,(xi-)(yi-)是(yi-)2的1.2倍,则样本相关系数r的值为( )
A. B. C.0.92 D.0.65
【答案】B
【解析】r==
=,故选B.
8、为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的样本相关系数,其数值分别为0.939,0.937,0.948,则( )
A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱
B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱
C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱
D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱
【答案】D;
【解析】因为样本相关系数的绝对值越大则线性相关性越强,所以丙组数据的线性相关性最强,乙组数据的线性相关性最弱.故选D;
9、从某地区12~30岁的居民中随机抽测了10个人的身高和体重,所得数据如下表所示:
身高/cm
143
156
159
172
165
171
177
161
164
160
体重/kg
41
49
61
79
68
69
74
69
68
54
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.
【解析】作出的散点图如图所示:
由散点图可知,两者之间具有相关关系,且为正相关.
10、某农科所对冬季昼夜温差(最高温度与最低温度的差)大小与某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,他们分别记录了12月1日至12月6日每天昼夜最高、最低的温度(如图甲),以及实验室每天每100颗种子中的发芽数情况(如图乙),得到如下资料:
(1)请画出发芽数y与温差x的散点图;
(2)请计算y与x的样本相关系数,说明y与x的线性相关程度如何.
参考数据:i=75,i=162,iyi=2 051,≈4.2,≈6.5.
参考公式:
r=(当|r|>0.75时,具有较强的线性相关关系).
【提示】根据成对样本数据的样本相关系数公式求得r的值,若r的绝对值越接近1,则两个变量的线性相关程度越强.
【解析】(1)散点图如图所示.
(2)r=
≈=≈0.952>0.75.
因为y与x的样本相关系数近似为0.952>0.75,所以y与x的线性相关
6
/
学科网(北京)股份有限公司
$$
【原卷版】 8.1 成对数据的相关分析
选择性必修第二册 第8章 成对数据的统计分析
初中学习的平面几何,研究的是平面上的一些简单图形及其几何性质;从本章开始,我们将把视野从二维的平面拓展到三维的空间;在三维空间中的图形统称为空间图形或立体图形;立体几何所研究的就是一些简单的空间图形及其几何性质;
从平面几何到立体几何,我们要注意借鉴平面几何中已有的一些概念、方法和结论,更要特别注意立体几何和平面几何之间的区别;以本章学习的空间直线与平面为例,我们不仅要研究平面这类典型的空间图形,而且要对“直线”有更为深刻的认识;我们生活在一个三维世界中,立体几何的学习有助于我们从几何的角度更好地理解现实的世界,并且锻炼我们的几何直观想象能力;因此,在学习中,要着重注意几何的直观和内涵,不要仅仅停留在表面上的严格推导和论证,还要多画一些示意图来帮助理解,这样才能更好地掌握几何的实质,逐步培养自己的立体感和空间想象能力;
在必修课程第13章“统计”中,我们主要研究了来自单一变量数据的一些统计特征,如集中趋势、离散程度、分布等.但现实世界中许多事物和现象之间都是有联系的;在本章中,我们将主要学习来自两个变量的成对数据的相关分析和回归分析,掌握它们之间的统计规律;本章将要学习的相关分析、回归分析及 检验都属于推断性统计方法,它们在构建统计模型、预测结果和因果分析等方面有许多应用;在必修课程中学过的散点图是进行成对数据统计分析的基础,通过观察散点图可以大致了解数据的整体形态和偏离情况,发现两组数据之间的变化规律,构建适当的统计模型.统计图表不仅可以直观地表示数据及其规律,也是
建立统计直觉的重要途径;
【本章教材目录】第8章 成对数据的统计分析
8.1 成对数据的相关分析
8.1.1成对数据间的关系;8.1.2相关系数
8.2 一元线性回归分析
8.2.1一元线性回归分析的基本思想;8.2.2一元线性回归分析的应用举例
8.3 2x2列联表
8.3.12x2列联表独立性检验;8.3.2 独立性检验的具体应用
【本章内容提要】
相关分析和一元线性回归分析是研究两个变量关系的两个互为补充的方法;相关分析描述了两个变量的相关程度,而回归分析则描述了因变量是怎样受自变量影响的;
1、为了得到两个变量之间是否具有一定关系的直观印象,可以用散点图来描述这些数据;
2、相关系数可以度量两个随机变量之间的线性关系;相关系数的值满足,且越接近1,两个随机变量的线性关系越密切;
3、回归方程代表了两个变量间的关系,回归直线经过散点图中数据点的中心;回归直线的斜率越大,解释变量狓的一个单位变化所引起的反应变量狔的波动就越大;
4、回归方程可以通过最小二乘法得到.回归直线能较好地反映一个变量对另一个变量的依赖情况,具有解释因果关系和预测的功能.利用回归方程可以由解释变量的值来预测反应变量的值,从而给出反应变量真实值的一个估计;
5、2×2列联表描述两个分类变量所有值的组合数据是如何分布的.判断2×2列联表中出现的两个分类变量是否独立可采用 检验; 检验的一般步骤是:(1)提出原假设;(2)确定显著性水平;(3)计算统计量 的值;(4)统计决断:当≥时,拒绝原假设,推断两个变量相关,否则,接受原假设,推断两个变量不相关(即两个变量是独立的);在实际情况下,是否完全拒绝原假设,还需要考虑样本量的大小;
【要点方法解读】
解读点001 变量的相关关系
1、相关分析
把这样来自同一对象的两组数据称为成对数据;研究成对数据相关性的方法称为相关分析;
2、变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;
(2)相关关系的分类:正相关和负相关;
①正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
②负相关:如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关;
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;
例1、下列命题中,两个变量存在相关关系的序号为
①扇形的半径与面积之间的关系
②降雪量与交通事故的发生率之间的关系
③人的身高与体重之间的关系
④家庭的支出与收入之间的关系
解读点002 用散点图观察两个变量之间的相关性
在必修课程第13章中,我们曾经用散点图观察两个变量之间的相关性;将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的统计图叫做散点图;利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关;
例2、某种树木体积与树木的树龄之间有如下的对应关系:
树龄
2
3
4
5
6
7
8
体积
30
34
40
60
55
62
70
(1)请作出这些数据的散点图;
(2)你能由散点图发现树木体积与树木的树龄近似呈什么关系吗?
解读点003 相关系数
(1)设由变量x和 y获得的两组数据分别为xi和yi(i=1,2,…,n),两组数据分别为xi和yi的线性相关系数是两个变量x和 y之间线性相关程度的统计量,其计算公式为:
;其中,;
它们分别是这两组数据的算术平均数;
线性相关系数常常简称相关系数;也称为皮尔逊系数;
(2)样本相关系数r的取值范围为[-1,1].
①若r>0时,成对样本数据正相关;
②若r<0时,成对样本数据负相关;
③当|r|越接近1时,成对样本数据的线性相关程度越强;
④当|r|越接近0时,成对样本数据的线性相关程度越弱;
题型一、相关系数的计算
例3、某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数据:
产量x(件)
1
2
3
4
5
生产总成本y(万元)
3
7
8
10
12
试求y与x的样本相关系数r.(结果保留两位小数)
参考公式:r=.
参考数据:≈10.7.
题型二、相关系数的性质
例4、甲、乙、丙、丁四位同学各自对a,b两变量的线性相关性做试验,并分别求得样本相关系数r如下表:
甲
乙
丙
丁
r
-0.82
-0.78
-0.69
-0.85
则________同学的试验结果体现a,b两变量有更强的线性相关性.
题型三、判断相关的强弱
例5、近年来,随着互联网的发展,诸如“滴滴打车”“神州专车”等网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在M省的发展情况,M省某调查机构从该省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:
城市1
城市2
城市3
城市4
城市5
A指标数x
2
4
5
6
8
B指标数y
3
4
4
4
5
经计算得=2,=,
试求y与x之间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系.
附:样本相关系数公式
r=,
参考数据:≈0.55,≈0.95.
题型四、相关系数的实际应用
例6、以下是收集到的新房屋的销售价格y(万元)和房屋的大小x(m2)的数据.
房屋大小x/m2
115
110
80
135
105
销售价格y/万元
24.8
21.6
18.4
29.2
22
(1)画出数据的散点图;
(2)求样本相关系数r,并作出评价.(精确到0.01,已知=60 975,=2 756.8,iyi=12 952)
题型五、【真题体验】
例7、(2025·天津模拟)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表(用x表示天数,y表示题数):
x
1
2
3
4
5
6
7
y
12
15
16
18
21
24
27
参考数据:=4,=19,x=140,y=2695,xiyi=600,≈2.45,
相关系数r=
=.
由表中数据可知该老师每天一次最多答对题数y与天数x之间是________(填“正”或“负”)相关,其相关系数r≈________(结果保留两位小数).
例8、( 2024年天津市蓟州区高三校考开学考试)对两个变量,进行线性相关检验,得线性相关系数,对两个变量,进行线性相关检验,得线性相关系数,则下列判断正确的是( )
A.变量与正相关,变量与负相关,变量与的线性相关性较强
B.变量与负相关,变量与正相关,变量与的线性相关性较强
C.变量与正相关,变量与负相关,变量与的线性相关性较强
D.变量与负相关,变量与正相关,变量与的线性相关性较强
例9、(2022年高考全国乙卷数学(理))某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
【针对性即时练】
1、下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③圆的面积和半径是相关关系.其中正确的是 (将所有正确的序号都填上);
2、命题①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图可以大致判断两个相关变量是正相关还是负相关.其中正确的命题是
3、5名学生的数学和物理成绩(单位:分)如下:
A
B
C
D
E
数学成绩
80
75
70
65
60
物理成绩
70
66
68
64
62
判断数学成绩与物理成绩是否具有线性相关关系; (填:“有”与“无”)
4、两个变量的相关关系有①正相关、②负相关、③不相关,则下列散点图从左到右分别反映的变量间的相关关系的序号依次是
5、如图所示,有5组数据:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉________组数据后剩下的4组数据的线性相关系数最大.
6、变量、的散点图如图所示,那么、之间的样本相关系数最接近的值为
7、若已知(xi-)2是(yi-)2的两倍,(xi-)(yi-)是(yi-)2的1.2倍,则样本相关系数r的值为( )
A. B. C.0.92 D.0.65
8、为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的样本相关系数,其数值分别为0.939,0.937,0.948,则( )
A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱
B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱
C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱
D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱
9、从某地区12~30岁的居民中随机抽测了10个人的身高和体重,所得数据如下表所示:
身高/cm
143
156
159
172
165
171
177
161
164
160
体重/kg
41
49
61
79
68
69
74
69
68
54
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.
10、某农科所对冬季昼夜温差(最高温度与最低温度的差)大小与某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,他们分别记录了12月1日至12月6日每天昼夜最高、最低的温度(如图甲),以及实验室每天每100颗种子中的发芽数情况(如图乙),得到如下资料:
(1)请画出发芽数y与温差x的散点图;
(2)请计算y与x的样本相关系数,说明y与x的线性相关程度如何.
参考数据:i=75,i=162,iyi=2 051,≈4.2,≈6.5.
参考公式:
r=(当|r|>0.75时,具有较强的线性相关关系).
6
/
学科网(北京)股份有限公司
$$