内容正文:
第9章 统计
9.1.1 变量的相关性
【课标要求】
1.了解变量间的相关关系,并明确其与函数关系的区别和联系.
2.能根据散点图判断两个变量是否具有相关关系.
3.了解两个变量间的相关系数r,能利用相关系数r判断两个变量线性相关程度的大小.
要点深化·核心知识提炼
知识点一 相关关系
1.定义
两个变量之间具有一定的联系,但又没有确定性函数关系,这种关系称为相关关系.
2.散点图
为直观地描述样本数据中两个变量间的关系,用横坐标表示其中的一个变量,纵坐标表示另一个变量,则样本数据都可以用直角坐标系中的点表示出来,由这些点组成的统计图叫作散点图.
3.线性相关关系
散点落在一条直线附近,我们称这两个变量线性相关.
4.相关关系的分类
具有相关关系的两个变量的散点图:
(1)如果散点呈从左下向右上方向发展的趋势,则称这两个变量之间正相关.
(2)如果散点呈从左上向右下方向发展的趋势,则称这两个变量之间负相关.
名师点睛
散点图的作用
(1)散点图具有直观、简明的特点,能体现样本数据的密切程度,可以根据散点图判断变量之间是否具有相关关系.
(2)通过散点图不但可以从点的位置判断测量值的大小、高低、变动范围与趋势,还可以通过观察剔除异常数据,提高估计相关程度的准确性.
知识点二 相关系数
1.相关系数r的计算公式
r=
=.
2.相关系数r的性质
(1)-1≤r≤1.
(2)当r>0时,y与x呈正相关关系;当r<0时,y与x呈负相关关系.
(3)|r|越接近1,y与x相关的程度就越强;|r|越接近0,y与x相关的程度就越弱.
通常情况下,当|r|>0.5时,认为线性相关关系显著;当|r|<0.3时,认为几乎没有线性相关关系.
名师点睛
当r=1时,两个变量完全正相关;当r=-1时,两个变量完全负相关.
自主诊断
判断正误.(正确的画√,错误的画×)
(1)任意给定统计数据,都可以绘制散点图.( )
(2)从散点图中可以看出两个量是否具有一定的关系.( )
(3)|r|很小只是说明两个变量之间的线性相关程度弱,但不一定不相关.( )
×
√
√
题型分析·能力素养提升
【题型一】相关关系的概念
例 1 [链接教材例1](1)有下列关系:
①人的年龄与他(她)拥有的财富之间的关系;
②曲线上的点与该点的坐标之间的关系;
③苹果的产量与气候之间的关系;
④森林中的同一种树木,其横断面直径与高度之间的关系.
其中是相关关系的是( )
A.①②③ B.①②
C.②③ D.①③④
D
解析 根据变量间相关关系的含义可知,①③④中两个变量具有相关关系;
而②,曲线上的点定了,该点的坐标也就随之确定,这两个变量间的关系为确定性关系.
故选D.
(2)以下两个变量成负相关的是 .
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
②
解析 ①无相关关系;②负相关;③④正相关.故答案为②.
规律方法 函数关系与相关关系辨析
名称 函数关系 相关关系
相同点 两者均是两个变量之间的关系
不同点 是一种确定性关系 是一种非确定性关系
是一种因果关系 不一定是因果关系,也可能是伴随关系
是一种理想的关系 是更为一般的情况
跟踪训练1(多选题)下列说法正确的有( )
A.闯红灯与交通事故发生率的关系是相关关系
B.同一物体的加速度与作用力是函数关系
C.圆的周长与面积的关系是相关关系
D.广告费用与销售量之间的关系是相关关系
ABD
解析 闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,A正确;物体的加速度与作用力的关系是函数关系,B正确;圆的周长与面积的关系是函数关系,C错误;广告费用与销售量之间是相关关系,D正确.
【题型二】散点图的应用
例 2 (1)某校学生科研兴趣小组为了解1~12岁儿童的体质健康情况,随机调查了20名儿童的相关数据,分别制作了肺活量、视力、肢体柔韧度、BMI指数和身高之间的散点图,则与身高之间具有正相关关系的是( )
A.肺活量
B.视力
C.肢体柔韧度
D.BMI指数
A
解析 对于A,儿童的身高越高,其肺活量越大,肺活量与身高具有正相关关系,A正确;对于B,儿童的视力随身高的增大先增大,后减小,视力与身高不具有正相关关系,B错误;对于C,肢体柔韧度随身高增大而减小,肢体柔韧度与身高不具有正相关关系,C错误;对于D,BMI指数与身高的相关性很弱,不具有正相关关系,D错误.故选A.
(2)某商场五天内某种T恤衫的销售情况如表:
第x天 1 2 3 4 5
销售量y/件 19 39 59 79 104
则下列说法正确的是( )
A.y与x负相关
B.y与x正相关
C.y与x不相关
D.y与x成正比例关系
B
解析 根据表格中的数据作出散点图如图,
可知所有点都在一条直线附近波动,是线性相关的,且y值随着x值的增大而增大,即y与x正相关,故选B.
规律方法 判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的.注意不要受个别点的位置的影响.
跟踪训练2对变量x,y由观测数据得散点图①,对变量y,z由观测数据得散点图②.由这两个散点图可以判断( )
A.变量x与y正相关,y与z正相关
B.变量x与y正相关,y与z负相关
C.变量x与y负相关,y与z正相关
D.变量x与y负相关,y与z负相关
C
解析 通过观察散点图可以知道,题图①散点呈从左上向右下方向发展的趋势,所以x与y负相关;题图②散点呈从左下向右上方向发展的趋势,所以y与z正相关.
【题型三】相关系数
角度1相关系数的性质
例 3 已知r1表示变量x与y之间的相关系数,r2表示变量u与v之间的相关系数,且r1=0.836,r2=-0.958,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
C
解析 因为线性相关系数r1=0.836,r2=-0.958,所以变量x与y之间呈正相关关系,变量u与v之间呈负相关关系.因为|r|越接近1,两个变量的线性相关程度越高,所以x与y之间的相关性弱于u与v之间的相关性.故选C.
规律方法 相关系数的性质:当r>0时,y与x呈正相关关系,当r<0时,y与x呈负相关关系;|r|越接近1,y与x的相关程度越强;|r|越接近0,y与x的相关程度越弱.
跟踪训练3(1)已知四组不同数据的两变量的线性相关系数r如下:数据组①的相关系数r1=0;数据组②的相关系数r2=-0.95;数据组③的相关系数|r3|=0.89;数据组④的相关系数r4=0.75.则下列说法正确的是( )
A.数据组①对应的数据点都在同一条直线上
B.数据组②中的两变量线性相关性最强
C.数据组③中的两变量线性相关性最强
D.数据组④中的两变量线性相关性最弱
B
解析 对于A,数据组①的相关系数r1=0,故数据组①对应的数据点无线性关系,故A错误;对于B,C,数据组②的相关系数|r2|=0.95为4组中绝对值的最大值,故数据组②中的两变量线性相关性最强,故B正确,C错误;对于D,数据组①的相关系数r1=0为4组中绝对值最小,故数据组①中的两变量线性相关性最弱,故D错误.故选B.
(2)在一次试验中,测得(x,y)的五组数据分别为(1,3),(2,4),(4,5),(5,13),(10,12),去掉一组数据(5,13)后,下列说法正确的是( )
A.样本数据由正相关变成负相关
B.样本的相关系数不变
C.样本的相关性变弱
D.样本的相关系数变大
D
解析 由题意,去掉离群点(5,13)后,仍然为正相关,相关性变强,相关系数变大,故A,B,C错误,D正确.故选D.
角度2相关系数的计算及应用
例 4 [链接教材例2]有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
第n年 1 2 3 4 5
居民年收入/万元 32.2 31.1 32.9 35.8 37.1
A商品销售额/万元 25.0 30.0 34.0 37.0 39.0
第n年 6 7 8 9 10
居民年收入/万元 38 39 43 44.6 46
A商品销售额/万元 41.0 42.0 44.0 48.0 51.0
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
参考数据:=37.97,=39.1,xiyi=15 202.9,=14 663.67,=15 857.
解 画出散点图如图所示.从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
r=≈0.95.
可以推断居民年收入与A商品销售额正相关,
即居民年收入越高,A商品销售额也越大.
规律方法 线性相关强弱的判断方法
(1)散点图:根据散点图只能粗略作出判断,其图象越接近直线,相关性越强.
(2)相关系数:相关系数能够较准确地判断相关的程度,其绝对值越大,相关性越强.
跟踪训练4(1)若已知的4倍,(xi-)(yi-)是的1.5倍,则样本相关系数r的值为 .
0.75
解析 由=4,
(xi-)(yi-)=1.5,
则r===0.75.
(2)关于两个变量x和y的7组数据如下表所示:
x 21 23 25 27 29 32 35
y 7 11 21 24 66 115 325
求变量y与x的相关系数,并判断变量y与x之间是正相关还是负相关.
解 xi=21+23+25+27+29+32+35=192,
yi=7+11+21+24+66+115+325=569,
=212+232+252+272+292+322+352=5 414,
xiyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,
=72+112+212+242+662+1152+3252=124 393,
根据r=,可得相关系数r ≈0.863 9.
∵r>0,∴变量y与x之间正相关.
$