内容正文:
第01讲 8.1 成对数据的统计相关性
(8.1.1变量的相关关系+8.1.2样本相关系数)
课程标准
学习目标
①理解两个变量的相关关系的概念。
②能利用散点图判断两个变量之间是否具有相关关系,会作简单的散点图。
③会根据相关系数判断两个变量的相关程度。
通过本节课的学习,要求会画散点图,能根据散点图判断成对数据的相关情况,能利用相关系数判断两个变量的相关程度
知识点1:变量的相关关系
变量与变量之间的关系常见的有两类:一类是变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了;另一类是变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性.
(1)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)函数关系与相关关系的异同点
函数关系
相关关系
相同点
两者均是指两个变量之间的关系
不同点
是一种确定性关系
是一种非确定性的关系
是两个变量之间的关系
①一个为变量,另一个为随机变量;②两个都是随机变量
是一种因果关系
不一定是因果关系,也可能是伴随关系
是一种理想的相关关系模型
是一种更为一般的情况
知识点2:散点图的概念
(1)一般地,如果收集到了变量和变量的对数据(简称为成对样本数据),如下表所示
序号
1
2
3
4
变量
变量
则在直角坐标系中描出点,就可以得到这对数据的散点图
(2)正相关与负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
【即学即练1】(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
【答案】B
【知识点】判断正、负相关
【分析】由正、负相关的概念逐项判断即可.
【详解】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.
结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.
故选:B
(3)线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关理解.
知识点3:相关关系的强弱
(1)样本相关系数
现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用来衡量与的线性相关性强弱,我们称为变量和变量的样本相关系数.
【即学即练2】(23-24高二下·云南曲靖·阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A.B. C. D.
【答案】A
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】根据散点图和相关系数的概念和性质辨析即可.
【详解】由散点图可知,相关系数所在散点图呈负相关,所在散点图呈正相关,所以都为正数,都为负数.
所在散点图近似一条直线上,线性相关性比较强,相关系数的绝对值越接近,
而所在散点图比较分散,线性相关性比较弱,相关系数的绝对值越远离.
综上可得:.
故选:A.
(2)相关系数的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【即学即练3】(24-25高二下·全国·课后作业)近年来,随着社会对教育越来越重视,家庭的平均教育支出呈现出逐年增长的趋势,下表反映了2018-2022年某市家庭平均教育支出占家庭总支出的比例(百分比)与年份编号之间的关系:
年份
2018
2019
2020
2021
2022
1
2
3
4
5
21
26
40
49
54
则与的样本相关系数 (保留3位小数).
附:,.
【答案】0.976
【知识点】相关系数的计算、计算几个数的平均数
【分析】根据题中数据分别求,代入相应公式运算即可.
【详解】由题意可知:,
可得,
所以.
故答案为:0.976.
题型01 相关关系与函数关系的概念及辨析
【典例1】(24-25高二·全国·课后作业)判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画.
回归模型: ;函数模型: .
①某公司的销售收入和广告支出;
②某城市写字楼的出租率和每平米月租金;
③航空公司的顾客投诉次数和航班正点率;
④某地区的人均消费水平和人均国内生产总值(GDP);
⑤学生期末考试成绩和考前用于复习的时间;
⑥一辆汽车在某段路程中的行驶速度和行驶时间;
⑦正方形的面积与周长.
【答案】 ①②③④⑤ ⑥⑦
【知识点】相关关系与函数关系的概念及辨析
【分析】利用回归模型与函数模型的定义依次分析即可.
【详解】对于①,销售收入虽然跟广告支出有关,但并不是广告打得多就对销售得多,还得看产品质量等其他因素,故其为回归模型;
对于②,某城市写字楼的出租率和每平米月租金有关,但写字楼的出租率还跟租户的收入、写字楼的地理位置等因素有关,故其为回归模型;
对于③,航空公司的顾客投诉次数和航班正点率有关,但航班正点率还跟天气等因素有关,故其为回归模型;
对于④,某地区的人均消费水平和人均国内生产总值(GDP)有关,但同样的GDP,一线城市与十八线城市的人均消费显然是不一样的,故其为回归模型;
对于⑤,学生期末考试成绩和考前用于复习的时间有关,但显然跟学生原本的知识基础、智商水平等因素有关,故其为回归模型;
对于⑥,一辆汽车在某段路程中的行驶速度和行驶时间,由可知其为函数模型;
对于⑦,正方形的面积为,周长为,故,故其为函数模型.
故答案为:①②③④⑤;⑥⑦
【典例2】(24-25高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
【答案】(1)具有相关关系
(2)具有相关关系
(3)具有函数关系
(4)具有相关关系
【知识点】相关关系与函数关系的概念及辨析
【分析】(1)根据相关关系的概念判断即可;
(2)根据相关关系的概念判断即可;
(3)根据函数关系的概念判断即可;
(4)根据相关关系的概念判断即可.
【详解】(1)商品的销售价格与其供应量之间具有相关关系.一般来说,在品质相当的情况下,供应量越大,
价格就越低;供应量越小,价格就越高.某些品牌商品限量供应,就是保持较高价位的销售策略.
(2)汽车的行驶速度与耗油量之间具有相关关系.通常情况下,当速度很慢或速度很快时,耗油较多,
而在中等车速(不同的汽车范围不一定一样)时,速度稍高,耗油反而较少.
(3)根据自由落体运动方程,可知自由降落的小球,位移与时间之间是函数关系.
(4)日降雨量与空气中污染物浓度之间具有相关关系.通常情况下,降雨量越大,空气中污染物浓度就越低.
【变式1】(24-25高二上·上海·课后作业)两个变量x与y之间的回归方程( )
A.表示x与y之间的函数关系; B.表示x与y之间的不确定关系;
C.反映x与y之间的真实关系; D.是反映x与y之间的真实关系的一种最佳拟合.
【答案】D
【知识点】解释回归直线方程的意义、相关关系与函数关系的概念及辨析
【分析】根据回归直线方程的定义,结合选项,即可求解.
【详解】根据回归方程的定义,可得两个变量x与y之间的回归方程是反映x与y之间的真实关系的一种最佳拟合.
故选:D.
【变式2】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【答案】(1)函数关系
(2)相关关系
(3)相关关系
(4)函数关系
(5)相关关系
(6)相关关系
【知识点】相关关系与函数关系的概念及辨析
【分析】略.
【详解】(1)因为,所以圆的面积与半径之间的关系为函数关系;
(2)因为体重除了与身高有关系,还和性别、遗传等因素有关系,
所以16岁学生的体重与身高之间的关系为相关关系;
(3)因为销售量除了与销售价格有关系,还和是否打广告等方面有关系,
所以商品销售量与销售价格之间的关系为相关关系;
(4)设匀速运动的物体的速度为,
所以运动的路程与时间之间的关系为,
因此匀速运动的物体,其运动的路程与时间之间的关系为函数关系;
(5)因为学习成绩除了与平均学习时间有关系外,还与学习方法等因素有关系,
所以平均学习时间与学习成绩之间的关系为相关关系;
(6)因为科技创新能力除了与人才培养近亲繁殖率有关系,还有教育等因素有关系,
所以科技创新能力与人才培养近亲繁殖率之间的关系为相关关系.
题型02 判断两个变量的相关关系
【典例1】(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
【答案】A
【知识点】判断正、负相关、判断两个变量是否有相关关系
【分析】利用正相关的定义逐项判断可得答案.
【详解】对于A,一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;
对于B,正方形的面积与边长是函数关系,故B错误;
对于C,一般情况下,若花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,故不为正相关,故C错误;
对于D,期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
故选:A.
【典例2】(23-24高二下·安徽·期末)下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长a与其面积S
B.匀速直线行驶的汽车的位移s与行驶时间t
C.杂交水稻植株的高度h与土壤湿润度r
D.某班的学生人数n与该班某次数学考试的平均分x
【答案】C
【知识点】判断两个变量是否有相关关系
【分析】根据相关关系的定义即可逐一判断.
【详解】对于A选项,因为,边长a与面积S是确定的函数关系,故A错误;
对于B选项,设匀速直线行驶的汽车的速度为,,所以位移s与行驶时间t是确定的函数关系,故B错误;
对于C选项,杂交水稻植株的高度h与土壤湿润度r具有相关关系,通常情况下,土壤湿润度r会一定程度上影响杂交水稻植株的高度h值的,故C正确;
对于D选项,因为班级某次数学考试的平均分x等于班级总分除以学生人数n,所以当班级总分确定的情况下,某班的学生人数n与该班某次数学考试的平均分x是一种确定关系,故D正确;
故选:C.
【典例3】(多选)(24-25高二下·全国·课堂例题)下列两个变量存在相关关系的为( )
A.扇形的半径与面积之间的关系
B.降雪量与交通事故的发生率之间的关系
C.人的身高与体重之间的关系
D.家庭的支出与收入之间的关系
【答案】BCD
【知识点】判断两个变量是否有相关关系
【分析】根据相关关系的定义即可求解.
【详解】扇形的半径与面积之间的关系是函数关系,其余均为相关关系.
故选:BCD
【变式1】(23-24高二下·甘肃兰州·期末)下列各关系不属于相关关系的是( )
A.产品的样本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
【答案】B
【知识点】判断两个变量是否有相关关系
【分析】根据相关关系的定义判断.
【详解】对于A:产品的样本与生产数量是相关关系,故A正确;
对于B:设球的半径为,球的表面积为、体积为,
则,所以,而,
所以球的表面积与体积是一种函数关系,故B错误;
对于C:家庭的支出与收入是相关关系,故C正确;
对于D:人的年龄与体重是相关关系,故D正确.
故选:B
【变式2】(23-24高二下·吉林·期末)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【答案】D
【知识点】判断两个变量是否有相关关系
【分析】根据相关关系的定义判断即可.
【详解】对于A:人的身高与受教育的程度不具有相关关系,故A错误;
对于B:人的体重与眼睛的近视程度不具有相关关系,故B错误;
对于C:企业员工的工号与工资不具有相关关系,故C错误.
对于D:儿子的身高与父亲的身高具有相关关系,故D正确.
故选:D
【变式3】(多选)(24-25高二下·全国·随堂练习)下列关系是相关关系的是( )
A.角度和它的正弦值之间的关系
B.某商场搞促销活动与销售量之间的关系
C.作文水平与课外阅读量之间的关系
D.底面积一定的三棱锥的体积与高之间的关系
【答案】BC
【知识点】判断两个变量是否有相关关系
【分析】根据相关关系的定义即可判断.
【详解】A,D选项两个变量之间的关系是函数关系,
B,C选项两个变量之间的关系是相关关系.
故选:BC.
题型03 判断正负相关
【典例1】(2024高三·全国·专题练习)某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
下面关于样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】C
【知识点】相关系数的意义及辨析、根据散点图判断是否线性相关、判断正、负相关
【分析】根据散点图和相关系数的概念得到,,得到答案.
【详解】由题图可知,所对应的图中的散点呈现正相关,
而且对应的散点图更接近直线,相关性比对应的相关性要强,故,
所对应的图中的散点呈现负相关,
而且对应的散点图更接近直线,相关性比对应的相关性要强,故,
因此.
故选:C.
【典例2】(23-24高二下·山西大同·期中)对两个变量进行线性相关性检验,得线性相关系数,对两个变量进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
B.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
C.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
D.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
【答案】D
【知识点】相关系数的意义及辨析、判断正、负相关
【分析】根据相关系数的符号的正负决定两个变量的正相关、负相关,以及相关系数绝对值越大,两个变量的线性相关性越强,进而可得出结论.
【详解】由线性相关系数知与正相关,
由线性相关系数知与负相关,
又,所以变量与变量的线性相关性比变量与变量的线性相关性更强.
故选:D.
【典例3】(23-24高二下·山西太原·期末)观察下列散点图,关于两个变量的相关关系推断正确的是( )
A.(1)为正相关,(2)不相关,(3)负相关
B.(1)为正相关,(2)负相关,(3)不相关
C.(1)为负相关,(2)不相关,(3)正相关
D.(1)为负相关,(2)正相关,(3)不相关
【答案】A
【知识点】相关系数的意义及辨析、判断正、负相关
【分析】根据散点图的点的分布即可得到结论.
【详解】第一个图点的分布比较集中,且随的增加,而增加,是正相关.
第二个图点的分布比较分散,不相关.
第三个图点的分布比较集中,且随的增加,而减少,是负相关.
故选:A.
【变式1】(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【答案】C
【知识点】绘制散点图、判断正、负相关、判断两个变量是否有相关关系
【分析】根据散点图判断.
【详解】画出弹簧伸长长度x和相应所受外力F的散点图,
可以判断这两变量相关,且为正相关,故①②错误,③正确.
故选:C
【变式2】(23-24高二下·新疆巴音郭楞·期末)对变量x,y由观测数据得散点图1;对变量x,z由观测数据得散点图2.由这两个散点图可以判断( )
A.变量x与y正相关,x与z正相关 B.变量x与y负相关,x与z正相关
C.变量x与y负相关,x与z负相关 D.变量x与y正相关,x与z负相关
【答案】B
【知识点】根据散点图判断是否线性相关、判断正、负相关
【分析】根据散点图直接判断即可得出结论.
【详解】由散点图可知,变量x与y负相关,x与z正相关
故选:B
【变式3】(23-24高二下·四川乐山·期末)对变量x,y由观测数据得散点图1;对变量u,v由观测数据得散点图2.表示变量x,y之间的线性相关系数,表示变量u,v之间的线性相关系数,则下列说法正确的是( )
A.变量x与y呈现正相关,且 B.变量x与y呈现负相关,且
C.变量u与v呈现正相关,且 D.变量u与v呈现负相关,且
【答案】A
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】利用散点图,结合相关系数的知识可得答案.
【详解】观察散点图,得变量x与y呈现正相关,变量u与v呈现负相关,BC错误;
图1中各点比图2中各点更加集中,相关性更好,因此,A正确,D错误.
故选:A
题型04 样本相关系数大小对变量相关性的影响
【典例1】(24-25高三·上海·课堂例题)如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
【答案】A
【知识点】相关系数的意义及辨析、相关系数的计算
【分析】根据表格中的数据,结合相关系数的公式,求得的值,即可得到答案.
【详解】根据表格中的数据,得,,,,
,,,
则,
所以两个变量与的相关程度较高.
故选:A
【典例2】(多选)(24-25高二下·全国·课后作业)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
【答案】BD
【知识点】相关系数的意义及辨析
【分析】根据题意,结合相关系数的含义,逐项判定,即可求解.
【详解】对于A中,当样本相关系数为0,只能说明两变量不是线性相关关系,不能说明两变量之间没有其他关系,所以A错误;
对于B中,当样本相关系数为1,两变量呈确定的函数关系,所以B正确;
对于C中,当与的相关性强于与的相关性,所以C错误;
对于D中,样本相关系数相等,说明相关性强弱相等,所以D正确.
故选:BD.
【典例3】(23-24高二下·广西玉林·期末)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中, 研究的两个随机变量的线性相关程度最高.
【答案】甲
【知识点】相关系数的意义及辨析
【分析】根据相关系数的性质即可求解.
【详解】因为,所以这四人中,甲研究的两个随机变量的线性相关程度最高.
故答案为:甲.
【变式1】(23-24高二下·广东清远·期末)通过计算样本相关系数可以反映两个随机变量之间的线性相关程度,以下四个选项中分别计算出四个样本的相关系数,则反映样本数据成正相关,并且线性相关程度最强的是( )
A. B.
C. D.
【答案】A
【知识点】相关系数的意义及辨析
【分析】利用相关系数的绝对值越大,线性相关程度越强,及为正相关进行分析判断.
【详解】因为相关系数的绝对值越大,线性相关程度越强,且为正相关,
所以时,线性相关程度最强,且为正相关,
故选:A
【变式2】(多选)(24-25高二下·全国·课后作业)有变量与变量对应的4组样本数据,计算出它们的线性相关系数分别为,则与线性相关关系最弱的是( )
A. B. C. D.
【答案】BD
【知识点】相关系数的意义及辨析
【分析】根据相关系数的定义及性质结合绝对值判断即可.
【详解】相关系数的绝对值越小,变量间的线性相关性越弱,
因为,所以与线性相关关系最弱的是.
故选:BD.
【变式3】(多选)(23-24高二下·四川眉山·期末)下列有关样本相关系数r,叙述正确的是( )
A.r的取值范围是
B.r的取值范围是
C.越接近1,表示两变量的线性相关程度越强
D.越接近0,表示两变量的线性相关程度越强
【答案】AC
【知识点】相关系数的意义及辨析
【分析】利用相关系数的取值范围判断AB;利用相关系数的意义判断CD.
【详解】对于AB,样本相关系数r的取值范围是,A正确,B错误;
对于CD,越大,越接近于1,两变量的线性相关程度越强,
越小,越接近于0,两变量的线性相关程度越弱,C正确,D错误.
故选:AC
题型05 相关系数的计算
【典例1】(24-25高三上·四川成都·开学考试)为考察两个变量的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,,,,)
A.很强 B.很弱 C.无相关 D.不确定
【答案】A
【知识点】相关系数的意义及辨析、相关系数的计算
【分析】根据已知计算相关系数,再根据相关系数的值判断线性相关程度.
【详解】由题可得,
则,
因为相关系数很接近于1,故两个变量的线性相关程度很强.
故选:A.
【典例2】(24-25高二下·全国·课堂例题)某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量(件)与相应的生产总成本(万元)的五组对照数据:
产量(件)
1
2
3
4
5
生产总成本(万元)
3
7
8
10
12
试求与的相关系数,并利用相关系数说明与是否高度正相关.(结果保留两位小数)
参考公式:.
参考数据:.
【答案】0.98,与高度正相关.
【知识点】相关系数的计算
【分析】根据公式代入计算即可.
【详解】解:,
,
,
,
,
故相关系数,
,
与高度正相关.
【典例3】(2024高三·全国·专题练习)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额的统计表(金额(万元)).
月份
1月
2月
3月
4月
5月
月份编号
1
2
3
4
5
金额(万元)
7
12
13
19
24
根据统计表,
(1)求该公司带货金额的平均值;
(2)求该公司带货金额与月份编号的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为与的线性相关性较强;,则认为与的线性相关性较弱);
附:相关系数公式,参考数据:,,,.
【答案】(1)
(2),两个变量具有很强的线性相关性
【知识点】计算几个数的平均数、相关系数的计算
【分析】(1)根据平均数的计算公式即可求解;
(2)根据相关系数公式代入求解即可;
【详解】(1)由统计表数据可得:,
(2)由于,,,
所以相关系数,
因此,两个变量具有很强的线性相关性.
【变式1】(24-25高三上·上海·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .(精确到0.01,参考数据:,,)
【答案】0.99/
【知识点】相关系数的计算
【分析】根据表中的数据结合公式直接求解即可.
【详解】由题意,知,
所以.
所以结合参考数据知:.
所以y与x的相关系数近似为0.99.
故答案为:
【变式2】(2024高三·全国·专题练习)某高中数学兴趣小组,在学习了统计案例后,准备利用所学知识研究成年男性的臂长(cm)与身高(cm)之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:
159
165
170
176
180
67
71
73
76
78
根据上表数据,可用线性回归模型拟合与的关系,请用相关系数加以说明;
【答案】说明见解析
【知识点】相关系数的计算
【分析】利用相关系数的计算公式即可得解;
【详解】由表中的数据和附注中的参考数据得
,,,,
,
,,
∴.
因为与的相关系数近似为0.997,说明与的线性相关程度相当高,从而可以用线性回归模型拟合与的关系.
【变式3】(2024高三·全国·专题练习)当大气污染物(大气中直径小于或等于的颗粒物)的浓度超过一定限度时会影响人的身体健康.为了了解汽车的流量与空气中的浓度之间的关系,某科研小组在某城市的一个交通点建立监测站,连续记录了十天的汽车流量(单位:千辆)和相应每天该地空气中的平均浓度(单位:),得到如下数据表:
汽车流量
1.36
1.63
1.26
1.86
0.95
1.18
1.50
1.05
1.46
1.75
浓度
96
110
72
135
35
43
115
34
110
120
求与的相关系数,并判断与之间的相关程度(精确到0.01);
参考公式:,.
参考数据:.
【答案】,与线性相关程度很强
【知识点】相关系数的计算
【分析】利用相关系数的定义求出,即可求解
【详解】依题意,,
所以
,
因为且接近,所以与线性相关程度很强.
A夯实基础 B能力提升
A夯实基础
一、单选题
1.(24-25高三上·上海·开学考试)已知气候温度和海水表层温度相关,且相关系数为负数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
【答案】D
【知识点】相关系数的意义及辨析
【分析】根据相关系数的意义判断各项的正误即可.
【详解】由于相关系数表示一个变量变化对另一个变量变化趋势的影响,
所以随着气候温度由低到高,海水表层温度呈下降趋势.
故选:D
2.(23-24高二下·山西长治·期中)根据变量的观测数据,绘制成散点图1;根据变量的观测数据,绘制成散点图2.若用线性回归进行分析,设表示变量的样本相关系数,表示变量的样本相关系数,则( )
A. B.
C. D.
【答案】A
【知识点】相关系数的意义及辨析
【分析】根据散点图,结合相关系数知识即可得出答案.
【详解】由图可得随增大而减小,随增大而减小,
所以与增呈负相关关系,与呈负相关关系,故,
又由图可知图1相关性更强,故更接近,
所以.
故选:A.
3.(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
【答案】C
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】根据线性相关系数越接近1,表示两个变量之间的相关性越强,线性相关系数的正负表示两个变量之间呈正相关关系或负相关关系.
【详解】因为线性相关系数,,
所以变量x与y之间呈正相关关系,变量u与v之间呈负相关关系.
因为|r|越接近1,两个变量的线性相关程度越高,所以x与y之间的相关性弱于u与v之间的相关性.
故选:C.
4.(23-24高二下·北京东城·期末)某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是( )
A.肺活量 B.视力 C.肢体柔韧度 D.BMI指数
【答案】A
【知识点】判断正、负相关
【分析】根据给定的散点图,结合正相关的意义判断即得.
【详解】对于A,儿童的身高越高,其肺活量越大,肺活量与身高具有正相关关系,A正确;
对于B,儿童的视力随身高的增大先增大,后减小,视力与身高不具有正相关关系,B错误;
对于C,肢体柔韧度随身高增大而减小,肢体柔韧度与身高不具有正相关关系,C错误;
对于D,BMI指数与身高的相关性很弱,不具有正相关关系,D错误.
故选:A
5.(23-24高二下·吉林通化·期中)要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数r的大小,以下是四组数据的相关系数的值,则线性相关最强的是( )
A. B. C. D.
【答案】C
【知识点】相关系数的意义及辨析
【分析】由成对数据的线性相关程度的强弱,取决于相关系数的大小,因为,所以线性相关最强.
【详解】判断成对数据的线性相关程度的强弱,可以比较它们的相关系数的大小,
的值越接近1,线性相关程度越强;的值越接近0,线性相关程度越弱,
根据选项可知.
故选:C.
6.(2024·四川成都·二模)对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A.变量与呈现正相关,且 B.变量与呈现负相关,且
C.变量与呈现正相关,且 D.变量与呈现负相关,且
【答案】C
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】利用散点图,结合相关系数的知识可得答案.
【详解】由题意可知,变量的散点图中,随的增大而增大,所以变量与呈现正相关;
再分别观察两个散点图,图比图点更加集中,相关性更好,所以线性相关系数.
故选:C.
7.(24-25高二下·全国·课后作业)为考察两个变量,的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,)
A.很强 B.很弱 C.无相关 D.不确定
【答案】A
【知识点】相关系数的意义及辨析、相关系数的计算
【分析】根据已知计算相关系数,再根据相关系数的值判断线性相关程度.
【详解】由题可得,,
则
,
因为相关系数很接近于1,故两个变量的线性相关程度很强.
故选:A.
8.(2024·河南·一模)有下列说法:
①若某商品的销售量(件)关于销售价格(元/件)的线性回归方程为,当销售价格为10元时,销售量一定为300件;
②线性回归直线一定过样本点中心;
③若两个随机变量的线性相关性越强,则相关系数的值越接近于1;
④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;
⑤在线性回归模型中,相关指数表示解释变量对于预报变量变化的贡献率,越接近于1,表示回归的效果越好;
其中正确的结论有几个
A.1 B.2 C.3 D.4
【答案】B
【知识点】解释回归直线方程的意义、线性回归、相关系数的意义及辨析、残差的计算
【分析】由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关时,线性相关性越强,相关系数越接近,③错误;残差图中带状区域越窄,拟合度越高,④错误;越接近,模型拟合度越高,⑤正确;由此可得结果.
【详解】①当销售价格为时,销售量的预估值为件,但预估值与实际值未必相同,①错误;
②由最小二乘法可知,回归直线必过,②正确;
③若两个随机变量为负相关,若线性相关性越强,相关系数越接近,③错误;
④残差图中,带状区域越窄,模型拟合度越高,④错误;
⑤相关指数越接近,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确.
可知正确的结论为:②⑤,共个
本题正确选项:
【点睛】本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.
二、多选题
9.(24-25高二下·全国·课后作业)(多选)在某地区随机抽取了8对母女的身高数据,如表:
母亲的身高
154
157
158
159
160
161
162
163
女儿的身高
155
156
159
162
161
164
165
166
下列说法正确的是( )
A.8个成对数据呈正相关
B.变量和变量的相关系数约为0.963
C.用均值和为零点,平移后的成对数据,…,与原始成对数据相关性不相同
D.用相关系数可以估计总体两个变量的相关系数
【答案】ABD
【知识点】相关系数的意义及辨析、相关系数的计算
【分析】计算相关系数的值,可判断AB的真假,根据散点图的分布形状判断C的真假,根据统计学的思想可判断D的真假.
【详解】由成对数据可得,,
,,
,,
则,B正确;
由,则8个成对数据呈正相关,A正确;
平移后的成对数据所对应平面直角坐标系中的散点图与原始成对数据所对应的散点图形状完全一致,故相关性完全相同,C错误;
根据统计学思想,D正确.
故选:ABD
10.(23-24高三下·广西柳州·阶段练习)两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
【答案】AD
【知识点】相关系数的意义及辨析、残差的计算、相关指数的计算及分析
【分析】根据统计案例的相关知识逐项分析判断.
【详解】对于A:相关系数越接近1,相关性越强,故A正确;
对于B:回归直线方程拟合效果的强弱由决定系数,故B错误;
对于C:残差故C错误;
对于D:决定系数越小,残差平方和越大,效果越差,故D正确.
故选:AD.
三、填空题
11.(24-25高二下·全国·课后作业)在一次试验中,测得的四组值分别是,,,,则与的相关系数为 .
【答案】-1
【知识点】相关系数的意义及辨析、相关系数的计算
【分析】求出样本中心,再用相关系数公式计算即可.
【详解】由题得,,
则相关系数.
故答案为:-1.
12.(2024高二下·上海·专题练习)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .
6
8
10
12
6
5
3
2
【答案】
【知识点】相关系数的计算
【分析】利用相关系数公式就可以求出结果.
【详解】解:根据表中数据计算可知,,
所以变量,之间的相关系数.
故答案为:.
四、解答题
13.(2024·河南新乡·模拟预测)氮氧化物是一种常见的大气污染物,下图为我国2015年至2023年氮氧化物排放量(单位:万吨)的折线图,其中年份代码1~9分别对应年份2015~2023.
已知,,,.
(1)可否用线性回归模型拟合与的关系?请分别根据折线图和相关系数加以说明.
(2)若根据所给数据建立回归模型,可否用此模型来预测2024年和2034年我国的氮氧化物排放量?请说明理由.
附:相关系数.
【答案】(1)可以用线性回归模型拟合与的关系,说明见解析
(2)可以预测2024年的氮氧化物排放量,但不可以预测2034年的氮氧化物排放量,理由见解析
【知识点】用回归直线方程对总体进行估计、相关系数的计算
【分析】(1)根据题意,由相关系数的计算公式代入计算,即可判断;
(2)根据题意,由线性回归方程的意义,即可判断.
【详解】(1)从折线图看,各点落在一条直线附近,因而可以用线性回归模型拟合与的关系,
由题意知,
相关系数.
故可以用线性回归模型拟合与的关系.
(2)可以预测2024年的氮氧化物排放量,但不可以预测2034年的氮氧化物排放量.
理由如下:
①2024年与所给数据的年份较接近,因而可以认为短期内氮氧化物排放量将延续该趋势,故可以用此模型进行预测;
②2034年与所给数据的年份相距过远,而影响氮氧化物排放量的因素有很多,这些因素在短期内可能保持不变,但从长期看很有可能会变化,因而用此模型预测可能是不准确的.
14.(23-24高二下·福建宁德·阶段练习)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
材积量
0.25
0.40
0.22
0.54
0.51
0.34
样本号i
7
8
9
10
总和
根部横截面积
0.05
0.07
0.07
0.06
0.6
材积量
0.36
0.46
0.42
0.40
3.9
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数,.
【答案】(1)
(2)0.97
(3)
【知识点】计算几个数的平均数、相关系数的计算
【分析】(1)根据平均数的计算个数即可求解,
(2)根据相关系数的计算公式即可求解,
(3)根据比例即可求解.
【详解】(1)估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为.
(2)样本相关系数
.
(3)设这种树木的根部横截总面积为X ,总材积量为Y ,则,则,
所以该林区这种树木的总材积量的估计值为.
B能力提升
15.(24-25高三上·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取20名学生的错题订正整理情况得分和对应的考试成绩作为样本,得到样本数据,其中和分别表示第个样本错题订正整理情况得分和对应的考试成绩,计算得.
(1)求样本的相关系数(精确到0.01),并推断考试成绩和错题订正整理情况得分的相关程度;
(2)已知20个样本中有8个样本的考试成绩低于样本平均数.利用频率估计概率,从该地区所有高中学生中随机抽取4个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于的个数为X,求随机变量X的分布列.
附:相关系数.
【答案】(1)相关系数,考试成绩和错题订正整理情况得分高度相关
(2)答案见解析
【知识点】相关系数的计算、写出简单离散型随机变量分布列、利用二项分布求分布列
【分析】(1)根据相关系数的计算公式即可代入求解;
(2)根据二项分布概率公式求解概率,即可得分布列.
【详解】(1),
接近考试成绩和错题订正整理情况得分高度相关.
(2)考试成绩低于样本平均数的概率记为,
则
x
0
1
2
3
4
p
16.(24-25高三上·河南·开学考试)某学校对高三(1)班50名学生第一次模拟考试的数学成绩和化学成绩统计得到数据如下:数学成绩的方差为,化学成绩的方差为,其中且1分别表示这50名学生的数学成绩和化学成绩,关于的线性回归方程为.
(1)求与的样本相关系数;
(2)从概率统计规律来看,本次考试高三(1)班学生数学成绩服从正态分布,用样本平均数作为的估计值,用样本方差作为的估计值.试估计该校共800名高三学生中,数学成绩位于区间的人数.
附:①回归方程中:
②样本相关系数
③若,则
④
【答案】(1)
(2)652
【知识点】相关系数的计算、指定区间的概率、正态分布的实际应用
【分析】(1)根据方差和求出,,然后代入公式可得;
(2)由求出,然后根据特殊区间求出,然后可得.
【详解】(1)因为,
所以,
又,所以,
所以.
(2)因为,,
所以,解得,即,
因为,所以,
所以数学成绩服从正态分布,
因为
,
所以该校高三学生数学成绩位于区间大约有人.
原创精品资源学科网独家享有版权,侵权必究!13
学科网(北京)股份有限公司
$$
第01讲 8.1 成对数据的统计相关性
(8.1.1变量的相关关系+8.1.2样本相关系数)
课程标准
学习目标
①理解两个变量的相关关系的概念。
②能利用散点图判断两个变量之间是否具有相关关系,会作简单的散点图。
③会根据相关系数判断两个变量的相关程度。
通过本节课的学习,要求会画散点图,能根据散点图判断成对数据的相关情况,能利用相关系数判断两个变量的相关程度
知识点1:变量的相关关系
变量与变量之间的关系常见的有两类:一类是变量之间的关系具有确定性,当一个变量确定后,另一个变量就确定了;另一类是变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性.
(1)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)函数关系与相关关系的异同点
函数关系
相关关系
相同点
两者均是指两个变量之间的关系
不同点
是一种确定性关系
是一种非确定性的关系
是两个变量之间的关系
①一个为变量,另一个为随机变量;②两个都是随机变量
是一种因果关系
不一定是因果关系,也可能是伴随关系
是一种理想的相关关系模型
是一种更为一般的情况
知识点2:散点图的概念
(1)一般地,如果收集到了变量和变量的对数据(简称为成对样本数据),如下表所示
序号
1
2
3
4
变量
变量
则在直角坐标系中描出点,就可以得到这对数据的散点图
(2)正相关与负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
【即学即练1】(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )
A.1 B.2 C.3 D.4
(3)线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关理解.
知识点3:相关关系的强弱
(1)样本相关系数
现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用来衡量与的线性相关性强弱,我们称为变量和变量的样本相关系数.
【即学即练2】(23-24高二下·云南曲靖·阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )
A.B. C. D.
(2)相关系数的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
【即学即练3】(24-25高二下·全国·课后作业)近年来,随着社会对教育越来越重视,家庭的平均教育支出呈现出逐年增长的趋势,下表反映了2018-2022年某市家庭平均教育支出占家庭总支出的比例(百分比)与年份编号之间的关系:
年份
2018
2019
2020
2021
2022
1
2
3
4
5
21
26
40
49
54
则与的样本相关系数 (保留3位小数).
附:,.
题型01 相关关系与函数关系的概念及辨析
【典例1】(24-25高二·全国·课后作业)判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画.
回归模型: ;函数模型: .
①某公司的销售收入和广告支出;
②某城市写字楼的出租率和每平米月租金;
③航空公司的顾客投诉次数和航班正点率;
④某地区的人均消费水平和人均国内生产总值(GDP);
⑤学生期末考试成绩和考前用于复习的时间;
⑥一辆汽车在某段路程中的行驶速度和行驶时间;
⑦正方形的面积与周长.
【典例2】(24-25高二·全国·课堂例题)试判断下列各个问题中两个变量之间是否具有相关关系:
(1)商品的销售价格与其供应量;
(2)汽车的行驶速度与耗油量;
(3)真空中自由降落的小球,位移(单位:m)与时间(单位:s);
(4)日降雨量(单位:cm)与空气中污染物浓度(单位:).
【变式1】(24-25高二上·上海·课后作业)两个变量x与y之间的回归方程( )
A.表示x与y之间的函数关系; B.表示x与y之间的不确定关系;
C.反映x与y之间的真实关系; D.是反映x与y之间的真实关系的一种最佳拟合.
【变式2】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
题型02 判断两个变量的相关关系
【典例1】(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
【典例2】(23-24高二下·安徽·期末)下列两个变量之间的关系是相关关系的是( )
A.等边三角形的边长a与其面积S
B.匀速直线行驶的汽车的位移s与行驶时间t
C.杂交水稻植株的高度h与土壤湿润度r
D.某班的学生人数n与该班某次数学考试的平均分x
【典例3】(多选)(24-25高二下·全国·课堂例题)下列两个变量存在相关关系的为( )
A.扇形的半径与面积之间的关系
B.降雪量与交通事故的发生率之间的关系
C.人的身高与体重之间的关系
D.家庭的支出与收入之间的关系
【变式1】(23-24高二下·甘肃兰州·期末)下列各关系不属于相关关系的是( )
A.产品的样本与生产数量 B.球的表面积与体积
C.家庭的支出与收入 D.人的年龄与体重
【变式2】(23-24高二下·吉林·期末)下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
【变式3】(多选)(24-25高二下·全国·随堂练习)下列关系是相关关系的是( )
A.角度和它的正弦值之间的关系
B.某商场搞促销活动与销售量之间的关系
C.作文水平与课外阅读量之间的关系
D.底面积一定的三棱锥的体积与高之间的关系
题型03 判断正负相关
【典例1】(2024高三·全国·专题练习)某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
下面关于样本相关系数的比较,正确的是( )
A. B.
C. D.
【典例2】(23-24高二下·山西大同·期中)对两个变量进行线性相关性检验,得线性相关系数,对两个变量进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
B.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
C.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
D.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
【典例3】(23-24高二下·山西太原·期末)观察下列散点图,关于两个变量的相关关系推断正确的是( )
A.(1)为正相关,(2)不相关,(3)负相关
B.(1)为正相关,(2)负相关,(3)不相关
C.(1)为负相关,(2)不相关,(3)正相关
D.(1)为负相关,(2)正相关,(3)不相关
【变式1】(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【变式2】(23-24高二下·新疆巴音郭楞·期末)对变量x,y由观测数据得散点图1;对变量x,z由观测数据得散点图2.由这两个散点图可以判断( )
A.变量x与y正相关,x与z正相关 B.变量x与y负相关,x与z正相关
C.变量x与y负相关,x与z负相关 D.变量x与y正相关,x与z负相关
【变式3】(23-24高二下·四川乐山·期末)对变量x,y由观测数据得散点图1;对变量u,v由观测数据得散点图2.表示变量x,y之间的线性相关系数,表示变量u,v之间的线性相关系数,则下列说法正确的是( )
A.变量x与y呈现正相关,且 B.变量x与y呈现负相关,且
C.变量u与v呈现正相关,且 D.变量u与v呈现负相关,且
题型04 样本相关系数大小对变量相关性的影响
【典例1】(24-25高三·上海·课堂例题)如两个变量满足下表关系:
5
10
15
20
25
103
105
110
111
114
则两个变量线性相关程度( )
A.较高 B.较低 C.不相关 D.不确定.
【典例2】(多选)(24-25高二下·全国·课后作业)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
【典例3】(23-24高二下·广西玉林·期末)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为,,,,则这四人中, 研究的两个随机变量的线性相关程度最高.
【变式1】(23-24高二下·广东清远·期末)通过计算样本相关系数可以反映两个随机变量之间的线性相关程度,以下四个选项中分别计算出四个样本的相关系数,则反映样本数据成正相关,并且线性相关程度最强的是( )
A. B.
C. D.
【变式2】(多选)(24-25高二下·全国·课后作业)有变量与变量对应的4组样本数据,计算出它们的线性相关系数分别为,则与线性相关关系最弱的是( )
A. B. C. D.
【变式3】(多选)(23-24高二下·四川眉山·期末)下列有关样本相关系数r,叙述正确的是( )
A.r的取值范围是
B.r的取值范围是
C.越接近1,表示两变量的线性相关程度越强
D.越接近0,表示两变量的线性相关程度越强
题型05 相关系数的计算
【典例1】(24-25高三上·四川成都·开学考试)为考察两个变量的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,,,,)
A.很强 B.很弱 C.无相关 D.不确定
【典例2】(24-25高二下·全国·课堂例题)某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销售模式.下表是该企业每月生产的一种核心产品的产量(件)与相应的生产总成本(万元)的五组对照数据:
产量(件)
1
2
3
4
5
生产总成本(万元)
3
7
8
10
12
试求与的相关系数,并利用相关系数说明与是否高度正相关.(结果保留两位小数)
参考公式:.
参考数据:.
【典例3】(2024高三·全国·专题练习)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额的统计表(金额(万元)).
月份
1月
2月
3月
4月
5月
月份编号
1
2
3
4
5
金额(万元)
7
12
13
19
24
根据统计表,
(1)求该公司带货金额的平均值;
(2)求该公司带货金额与月份编号的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为与的线性相关性较强;,则认为与的线性相关性较弱);
附:相关系数公式,参考数据:,,,.
【变式1】(24-25高三上·上海·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
由上表数据可知,y与x的相关系数为 .(精确到0.01,参考数据:,,)
【变式2】(2024高三·全国·专题练习)某高中数学兴趣小组,在学习了统计案例后,准备利用所学知识研究成年男性的臂长(cm)与身高(cm)之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:
159
165
170
176
180
67
71
73
76
78
根据上表数据,可用线性回归模型拟合与的关系,请用相关系数加以说明;
【变式3】(2024高三·全国·专题练习)当大气污染物(大气中直径小于或等于的颗粒物)的浓度超过一定限度时会影响人的身体健康.为了了解汽车的流量与空气中的浓度之间的关系,某科研小组在某城市的一个交通点建立监测站,连续记录了十天的汽车流量(单位:千辆)和相应每天该地空气中的平均浓度(单位:),得到如下数据表:
汽车流量
1.36
1.63
1.26
1.86
0.95
1.18
1.50
1.05
1.46
1.75
浓度
96
110
72
135
35
43
115
34
110
120
求与的相关系数,并判断与之间的相关程度(精确到0.01);
参考公式:,.
参考数据:.
A夯实基础 B能力提升
A夯实基础
一、单选题
1.(24-25高三上·上海·开学考试)已知气候温度和海水表层温度相关,且相关系数为负数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
2.(23-24高二下·山西长治·期中)根据变量的观测数据,绘制成散点图1;根据变量的观测数据,绘制成散点图2.若用线性回归进行分析,设表示变量的样本相关系数,表示变量的样本相关系数,则( )
A. B.
C. D.
3.(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
4.(23-24高二下·北京东城·期末)某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是( )
A.肺活量 B.视力 C.肢体柔韧度 D.BMI指数
5.(23-24高二下·吉林通化·期中)要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数r的大小,以下是四组数据的相关系数的值,则线性相关最强的是( )
A. B. C. D.
6.(2024·四川成都·二模)对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )
A.变量与呈现正相关,且 B.变量与呈现负相关,且
C.变量与呈现正相关,且 D.变量与呈现负相关,且
7.(24-25高二下·全国·课后作业)为考察两个变量,的相关性,搜集数据如表,则两个变量的线性相关程度( )
5
10
15
20
25
103
105
110
111
114
(参考数据:,,)
A.很强 B.很弱 C.无相关 D.不确定
8.(2024·河南·一模)有下列说法:
①若某商品的销售量(件)关于销售价格(元/件)的线性回归方程为,当销售价格为10元时,销售量一定为300件;
②线性回归直线一定过样本点中心;
③若两个随机变量的线性相关性越强,则相关系数的值越接近于1;
④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;
⑤在线性回归模型中,相关指数表示解释变量对于预报变量变化的贡献率,越接近于1,表示回归的效果越好;
其中正确的结论有几个
A.1 B.2 C.3 D.4
二、多选题
9.(24-25高二下·全国·课后作业)(多选)在某地区随机抽取了8对母女的身高数据,如表:
母亲的身高
154
157
158
159
160
161
162
163
女儿的身高
155
156
159
162
161
164
165
166
下列说法正确的是( )
A.8个成对数据呈正相关
B.变量和变量的相关系数约为0.963
C.用均值和为零点,平移后的成对数据,…,与原始成对数据相关性不相同
D.用相关系数可以估计总体两个变量的相关系数
10.(23-24高三下·广西柳州·阶段练习)两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
三、填空题
11.(24-25高二下·全国·课后作业)在一次试验中,测得的四组值分别是,,,,则与的相关系数为 .
12.(2024高二下·上海·专题练习)已知变量,之间的一组相关数据如表所示,则变量,之间的相关系数 .
6
8
10
12
6
5
3
2
四、解答题
13.(2024·河南新乡·模拟预测)氮氧化物是一种常见的大气污染物,下图为我国2015年至2023年氮氧化物排放量(单位:万吨)的折线图,其中年份代码1~9分别对应年份2015~2023.
已知,,,.
(1)可否用线性回归模型拟合与的关系?请分别根据折线图和相关系数加以说明.
(2)若根据所给数据建立回归模型,可否用此模型来预测2024年和2034年我国的氮氧化物排放量?请说明理由.
附:相关系数.
14.(23-24高二下·福建宁德·阶段练习)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
材积量
0.25
0.40
0.22
0.54
0.51
0.34
样本号i
7
8
9
10
总和
根部横截面积
0.05
0.07
0.07
0.06
0.6
材积量
0.36
0.46
0.42
0.40
3.9
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数,.
B能力提升
15.(24-25高三上·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取20名学生的错题订正整理情况得分和对应的考试成绩作为样本,得到样本数据,其中和分别表示第个样本错题订正整理情况得分和对应的考试成绩,计算得.
(1)求样本的相关系数(精确到0.01),并推断考试成绩和错题订正整理情况得分的相关程度;
(2)已知20个样本中有8个样本的考试成绩低于样本平均数.利用频率估计概率,从该地区所有高中学生中随机抽取4个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于的个数为X,求随机变量X的分布列.
附:相关系数.
16.(24-25高三上·河南·开学考试)某学校对高三(1)班50名学生第一次模拟考试的数学成绩和化学成绩统计得到数据如下:数学成绩的方差为,化学成绩的方差为,其中且1分别表示这50名学生的数学成绩和化学成绩,关于的线性回归方程为.
(1)求与的样本相关系数;
(2)从概率统计规律来看,本次考试高三(1)班学生数学成绩服从正态分布,用样本平均数作为的估计值,用样本方差作为的估计值.试估计该校共800名高三学生中,数学成绩位于区间的人数.
附:①回归方程中:
②样本相关系数
③若,则
④
原创精品资源学科网独家享有版权,侵权必究!13
学科网(北京)股份有限公司
$$