内容正文:
9.1 线性回归分析
9.1.1 变量的相关性
必备知识 清单破
1.相关关系
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相关关系.
2.散点图
将样本中的n个数据构成的点(xi,yi)(i=1,2,3,…,n)描在平面直角坐标系中得到的图形称为
散点图.
知识点 1
变量间的相关关系
第9章 统计
高中同步
3.线性相关关系
散点图中的点散布在一条直线附近,将具有这种特性的相关关系称为线性相关关系.
4.正相关与负相关
如果具有相关关系的两个变量的散点图呈从左下向右上方向发展的趋势,我们称这两个
变量之间正相关.同理,如果呈从左上逐渐向右下方向发展的趋势,则称这两个变量之间负相
关.
第9章 统计
高中同步
1.对于变量x与y的n对数据(xi,yi)(i=1,2,3,…,n),一般用
r=
=
来衡量y与x的线性相关程度 ,这里的r称为样本相关系数.
知识点 2
样本相关系数
第9章 统计
高中同步
2.样本相关系数r的性质
(1)-1≤r≤1;
(2)r>0时y与x呈正相关关系,r<0时y与x呈负相关关系;
(3)|r|越接近1,y与x相关的程度就越强,|r|越接近0,y与x相关的程度就越弱.
通常情况下,当|r|>0.5时,认为线性相关关系显著;当|r|<0.3时,认为几乎没有线性相关关
系.
第9章 统计
高中同步
知识辨析
1.相关关系是函数关系吗?
2.若散点不是落在一条直线附近,则说明两个变量没有相关关系吗?
3.样本相关系数r越大,两变量间的相关程度越强吗?
4.若两个变量的样本相关系数r=0,则说明两个变量间没有任何关系吗?
第9章 统计
高中同步
一语破的
1.不是.当一个变量一定时,另一个变量的取值也是确定的,这就是函数关系;两个变量有关系,
但又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系.
2.不是.只能说明两个变量不是线性相关,若散点落在一条曲线附近,则说明两个变量非线性
相关.
3.不是.样本相关系数的绝对值越接近1,两变量间的线性相关程度越强.
4.不是.两个变量的样本相关系数r=0只表明两个变量间没有线性相关关系,但不排除它们之
间有其他相关关系.
第9章 统计
高中同步
1.利用散点图判断两个变量的相关性
(1)如果变量x和y正相关,那么散点图表现为点散布的位置是从左下到右上的区域;如果变量x
和y负相关,那么散点图表现为点散布的位置是从左上到右下的区域.
(2)如果散点落在一条直线附近,则认为这两个变量线性相关.
2.利用样本相关系数判断两个变量相关性的强弱
样本相关系数r是从数值上来判断变量间的线性相关程度的量,是定量分析.
|r|刻画了样本点集中于某条直线的程度,|r|越接近1,散点图中的点分布越接近一条直线,
两个变量的线性相关程度越强.
关键能力 定点破
定点
变量间相关关系的判断
第9章 统计
高中同步
典例 某农科所对冬季昼夜温差(最高温度与最低温度的差)大小与某反季节大豆新品种一
天内发芽数之间的关系进行了分析研究,他们记录了4月1日至4月6日每天昼夜最高、最低的
温度(如图甲),以及实验室每天每100颗种子的发芽数情况(如图乙).
图甲
第9章 统计
高中同步
图乙
(1)请画出发芽数y与温差x的散点图;
(2)判断两个变量是否线性相关,计算样本相关系数,并刻画它们的相关程度.
第9章 统计
高中同步
xi yi xiyi
75 162 2 051 4.2 6.5
参考公式:样本相关系数r= .(当|r|>0.75时,认为成对样本数据的线性相
关程度较强)
参考数据:
第9章 统计
高中同步
解析 (1)散点图如图所示.
(2)r=
=
第9章 统计
高中同步
≈0.952.
由样本相关系数r≈0.952>0.75,可以推断发芽数与温差这两个变量正相关,且线性相关程度
较强.
第9章 统计
高中同步
$