内容正文:
8.1 成对数据的统计相关性
[核心素养·学习目标]
课程标准
课标解读
1. 理解两个变量的相关关系的概念;
2. 能利用散点图判断两个变量之间是否具有相关关系,会作简单的散点图;
3. 会根据相关系数判断两个变量的相关程度;
通过本节课的学习,要求会画散点图,能根据散点图判断成对数据的相关情况,能利用相关系数判断两个变量的相关程度.
课前预习
预习01相关关系的定义
相关关系的定义:两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.
预习02相关关系的分类
(1)按变量间的增减性分为 相关和 相关.
①正相关:当一个变量的值增加时,另一个变量的相应值也呈现 的趋势;
②负相关:当一个变量的值增加时,另一个变量的相应值呈现 的趋势.
(2)按变量间是否有线性特征分为 相关和 相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在 附近,我们称这两个变量线性相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是 相关,我们称这两个变量非线性相关或曲线相关.
预习03相关关系的刻画
1.散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.
2.样本相关系数
(1)我们常用样本相关系数r来确切地反映成对样本数据(xi,yi)的相关程度,
其中r=.
(2)样本相关系数r的取值范围为 .
①若r>0时,成对样本数据 相关;
②若r<0时,成对样本数据 相关;
③当|r|越接近 时,成对样本数据的线性相关程度越强;
④当|r|越接近 时,成对样本数据的线性相关程度越弱.
预习04相关系数r的性质
(1)当r>0时,称成对样本数据 相关;当r<0时,成对样本数据 相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为 .
当|r|越接近1时,成对样本数据的线性相关程度越 ;
当|r|越接近0时,成对样本数据的线性相关程度越 .
预习05样本相关系数与标准化数据向量夹角的关系
r=x′·y′=|x′||y′|cos θ=cos θ(其中x′=(x1′,x2′,…,xn′),y′=(y1′,y2′,…,yn′),|x′|=|y′|=,θ为向量x′和向量y′的夹角).
知识讲解
知识点
1. 两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(1)正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称这两个变量正相关,在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关,在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
2.线性相关关系与非线性相关关系:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关. 这条直线叫做回归直线.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
3.相关系数:
对于变量和变量,设经过随机抽样获得的成对样本数据为,其中和的均值分别为和,则
我们称为变量和变量的样本相关系数.
① 当时,称成对数据正相关;当时,称成对数据负相关.
② 越接近于,两个变量的线性相关性越强;
接近于时,两个变量之间几乎不存在线性相关关系.
③ 样本相关系数也可以推导得到
【特别注意】通常|r|大于0.75时,认为两个变量有很强的线性相关性.
【大招总结】
大招1相关关系与函数关系的辨析
函数关系与相关关系的异同点
函数关系
相关关系
相同点
两者均是指两个变量之间的关系
不同点
是一种确定性关系
是一种非确定性的关系
是两个变量之间的关系
①一个为变量,另一个为随机变量;②两个都是随机变量
是一种因果关系
不一定是因果关系,也可能是伴随关系
是一种理想的相关关系模型
是一种更为一般的情况
大招2判断两个变量是否有相关关系
两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断.
(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
大招3相关系数的意义
样本相