内容正文:
第01讲 成对数据的统计相关性
(
目标导航
)
课程标准
课标解读
1. 理解两个变量的相关关系的概念;
2. 能利用散点图判断两个变量之间是否具有相关关系,会作简单的散点图;
3. 会根据相关系数判断两个变量的相关程度;
通过本节课的学习,要求会画散点图,能根据散点图判断成对数据的相关情况,能利用相关系数判断两个变量的相关程度.
(
知识精讲
)
知识点
1. 两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(1)正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称这两个变量正相关,在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关,在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
2.线性相关关系与非线性相关关系:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关. 这条直线叫做回归直线.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
3.相关系数:
对于变量和变量,设经过随机抽样获得的成对样本数据为,其中和的均值分别为和,则
我们称为变量和变量的样本相关系数.
① 当时,称成对数据正相关;当时,称成对数据负相关.
② 越接近于,两个变量的线性相关性越强;
接近于时,两个变量之间几乎不存在线性相关关系.
③ 样本相关系数也可以推导得到
【微点拨】通常|r|大于0.75时,认为两个变量有很强的线性相关性.
【即学即练1】下列两个变量间的关系,是相关关系的是( )
A.任意实数和它的平方 B.圆半径和圆的周长
C.正多边形的边数和内角度数之和 D.天空中的云量和下雨
【即学即练2】下列说法错误的是( )
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间的关系是相关关系
C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关
D.体重与学习成绩之间不具有相关关系
【即学即练3】从统计学的角度看,下列关于变量间的关系说法正确的是( )
A.人体的脂肪含量与年龄之间没有相关关系
B.汽车的重量和汽车每消耗汽油所行驶的平均路程负相关
C.吸烟量与健康水平正相关
D.气温与热饮销售好不好正相关
【即学即练4】在下列各图中,每个图的两个变量具有相关关系的图是( )
A.(1)(2) B.(1)(3) C.(2) D.(2)(3)
【即学即练5】下列语句表示的事件中的因素不具有相关关系的是( )
A.瑞雪兆丰年 B.名师出高徒 C.不积跬步,无以至千里 D.喜鹊叫喜,乌鸦叫丧
【即学即练6】某市居民年家庭年平均收入(单位:万元)与年平均支出(单位:万元)的统计资料如下表所示:
年份
年平均收入
年平均支出
根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有______相关关系.(填“正”或“负”)
【即学即练7】已知变量与相对应的一组数据为,,,,,变量与相对应的一组数据为,,,,.表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
【即学即练8】下列现象中线性相关程度最强的是( )
A.商店的职工人数与商品销售额之间的线性相关系数为0.87
B.流通费用率与商业利润率之间的线性相关系数为-0.94
C.商品销售额与商业利润率之间的线性相关系数为0.51
D.商品销售额与流通费用率之间的线性相关系数为0.70
【即学即练9】有人收集了某城市居民年收入(即所有居民在一年内收入的总和)与商品销售额的年数据,如表.
表
第年
居民年收入/亿元
商品销售额/万元
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数判断居民年收入与商品销售额的相关程度和变化趋势的异同.
【即学即练10】根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);
附:相关系数公式.
参考数据:,