内容正文:
8.1 成对数据的统计相关性
一、相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
相关关系与函数关系的异同点
(1)相同点:均是指两个变量的关系.
(2)不同点:①函数关系是一种确定的关系,而相关关系是一种非确定关系.
②相关关系中两个变量之间产生相关关系的原因是受许多不确定的随机因素的影响.
二、散点图
1.如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;
如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
2.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
3.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
三、散点图的应用
四、样本的相关系数
样本相关系数:r=
=.
样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映出成对样本数据的变化特征.
当r>0时,称成对样本数据正相关;
当r<0时,称成对样本数据负相关.
五、相关关系的强弱
样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
注意点:
当|r|=1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系.
当r=0时,表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系.
六、样本相关系数的实际应用
当样本相关系数|r|越接近1时,两个变量的相关关系越强,当样本相关系数|r|越接近0时,两个变量的相关关系越弱.
考点一 相关关系
【例1】(2020·武威第八中学)下列两变量具有相关关系的是( )
A.正方体的体积与边长 B.人的身高与体重
C.匀速行驶车辆的行驶距离与时间 D.球的半径与体积
【练1】(2021·秦安县第一中学高二期末)根据下面给出的2009年至2018年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2018年减少二氧化硫排放量的效果最显著
B.2012年我国治理二氧化硫排放显现成效
C.2011年以来我国二氧化硫年排放量呈减少趋势
D.2011年以来我国二氧化硫年排放量与年份正相关
考点二 样本的相关系数
【例2】(2020·吴起高级中学)甲、乙、丙、丁四位同学各自对两变量的线性相关性做试验,并用回归分析方法分别求得相关系数如下表:
甲
乙
丙
丁
-0.78
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙 C.丙 D.丁
【练2】(2020·广东广州市)在建立两个变量y与x的回归模型,模型的的值依次是0.35,0.67,0.84,0.92,则其中拟合效果最好的模型是( )
A.模型1 B.模型2 C.模型3 D.模型4
课后练习
1. (2019·广东广州市·执信中学)对于散点图下列说法正确一个是( )
A.一定可以看出变量之间的变化规律 B.一定不可以看出变量之间的变化规律
C.可以看出正相关与负相关有明显区别 D.看不出正相关与负相关有什么区别
2. (2021·江门市)下列语句表示的事件中的因素不具有相关关系的是( )
A.瑞雪兆丰年 B.名师出高徒 C.不积跬步,无以至千里 D.喜鹊叫喜,乌鸦叫丧
3. (2020·吉林长白山保护开发区教育局高一月考)下列两个变量之间的关系哪个不是函数关系( )
A.角度和它的正切值 B.人的右手一柞长和身高
C.正方体的棱长和表面积 D.真空中自由落体运动物体的下落距离和下落时间
4. (2020·江西赣州市·南康中学高二期中(文))观察下列各图形,
其中两个变量具有相关关系的图是( )
A.①② B.①④ C.③④ D.③
5.
(2020·广东广州市)在建立两个变量y与x的回归模型,模型的的值依次是0.35,0.67,0.84,0.92,则其中拟合效果最好的模型是( )
A.模型1 B.模型2 C.模型3 D.模型4
6. (2020·河南)有一散点图如图所示,现拟合模型为直线l1,在5个(x,y)数据中去掉D(3,10)后,重新拟合模型为直线l2给出下列说法:①相关系数r变大;②相关指数R2变大;③残差平方和变小;④解释变量x与预报变量y的相关性变强.其中正确说法的个数为(