内容正文:
8.1 成对数据的统计相关性
8.1.1 变量的相关关系
8.1.2 样本相关系数
[课程目标] 1.理解两个变量的相关关系的概念;2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系;3.会根据相关系数判断两个变量的相关程度;4.结合实例,了解样本相关系数的统计含义,会通过相关系数比较多组成对数据的相关性.
知识点一 变量的相关关系
(1)相关关系是一种不确定性关系,相关关系是相对于函数关系而言的.两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为__相关关系__.
(2)相关关系的分类
按变量间的增减性分为正相关和负相关.
①正相关:当一个变量的值__增加__时,另一个变量的相应值__也呈现增加的趋势__;
②负相关:当一个变量的值__增加__时,另一个变量的相应值__呈现减少的趋势__.
按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量__线性__相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.
(3)散点图:将样本中的每一个编号下的__成对__样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图叫做__散点图__.
知识点二 样本相关系数
(1)我们常用样本相关系数r来确切地反映成对样本数据(xi,yi)的相关程度,其中
r=
=.
(2)样本相关系数r的取值范围为[-1,1].
①当__r>0__时,成对样本数据正相关;
②当__r<0__时,成对样本数据负相关;
③当|r|越接近1时,成对样本数据的线性相关程度__越强__;
④当|r|越接近0时,成对样本数据的线性相关程度__越弱__.
[研读]相关关系与函数关系的异同点
关系
项目
函数关系
相关关系
相同点
都是两个变量间的关系
不同点
是一种确定关系
是一种非确定关系
是一种因果关系
不一定是因果关系,也可能是伴随关系
判断正误(请在括号中打“√”或“×”).
(1)任意两个成对样本数据均可以作出散点图.( √ )
(2)人的身高与体重是相关关系.( √ )
(3)正方体的棱长与正方体的内切球的体积是函数关系.( √ )
为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所得数据如下:
质量(g)
5
10
15
20
25
30
弹簧长度(cm)
7.25
8.12
8.95
9.90
10.90
11.80
判断它们是否有相关关系,若有,判断是正相关还是负相关.
解:散点图如图:
由散点图可以看出两个变量对应的点大致分布在一条直线附近,因此可以得出结论:质量与弹簧长度这两个变量具有相关关系,且它们是正相关关系.
[规律方法]
在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作出如下判断:
(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;
(2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系;
(3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不具有相关关系,即两个变量之间是相互独立的.
活学活用
(1)对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( C )
A.函数关系 B.线性关系
C.相关关系 D.回归关系
(2)对变量x,y有观测数据(xi,yi)(i=1,2,3,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,3,…,10),得散点图2,由这两个散点图可以断定( C )
A.x与y正相关,u与v正相关
B.x与y正相关,u与v负相关
C.x与y负相关,u与v正相关
D.x与y负相关,u与v负相关
【解析】 (1)对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫相关关系.故选C.
(2)由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x与y负相关;由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u与v正相关.故选C.
根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
依据数据的散点图可以看出,y与x之间有较强的线性相关关系.请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高).
附:样本相关系数公式:r==.
解:由已知数据可得==5,