内容正文:
第八章 成对数据的统计分析
8.1 成对数据的统计相关性
8.1.1 变量的相关关系
8.1.2 样本相关系数
数学
学习目标
通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.
数学
知识梳理·自主探究
师生互动·合作探究
数学
知识梳理·自主探究
知识探究
1.相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2.散点图、正相关、负相关
(1)散点图:将样本中几个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形.
数学
(2)正相关与负相关:如果从整体上看,当一个变量的值 时,另一个变量的相应值也呈现 的趋势,我们就称这两个变量正相关.
如果当一个变量的值 时,另一个变量的相应值呈现 的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条 .附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
增加
增加
增加
减少
直线
数学
4.样本相关系数
当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
(2)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强.
当|r|越接近0时,成对样本数据的线性相关程度越弱.
数学
师生互动·合作探究
探究点一
相关关系的判断
[例1] 5个学生的数学和物理成绩(单位:分)如下表:
学生
成绩
学科 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断它们是否具有线性相关关系.
数学
解:以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示,由散点图可知,两者之间具有线性相关关系,且是正相关.
数学
方法总结
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)样本相关系数:r>0时,正相关;r<0时,负相关.
数学
[针对训练] 在下列所示的四个图中,每个图的两个变量具有相关关系的是
( )
A.①② B.①③ C.②④ D.②③
解析:图①的两个变量具有函数关系;图②③的两个变量具有相关关系;图④的两个变量之间既不是函数关系,也不是相关关系.故选D.
数学
探究点二
样本相关系数的意义
[例2] (2022·江苏宿迁高二期末)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r1<r4<0<r3<r2
B.r4<r1<0<r3<r2
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
解析:由题图可知,图②和图③是正相关,图①和图④是负相关,
图①和图②的点相对更加集中,所以相关性更强,所以r1接近于-1,r2接近于1,所以r1<r4<0<r3<r2.故选A.
数学
方法总结
变量之间的样本相关系数r具有如下性质
(1)r2≤1,故变量之间的样本相关系数r的取值范围为[-1,1].
(2)|r|越大,变量之间的线性相关程度越强;|r|越接近0,变量之间的线性相关程度越弱.
(3)当r>0时,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关;当r<0时,一个变量增加,另一个变量有减少的趋势,称两个变量负相关;当r=0时,称两个变量没有线性相关关系.
数学
[针对训练] 甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:
解析:因为|-0.85|>|-0.82|>|-0.78|>|-0.69|,且相关系数的绝对值越接近1,则两个变量的线性相关性越强,所以能体现出A,B两变量有更强的线性相关性的是丁.
名称 甲 乙 丙 丁
r -0.82 -0.78 -0.69 -0.85
则 同学的试验结果体现A,B两变量有更强的线性相关性.
答案:丁
数学
当堂检测
1.(2022·安徽黄山高二期末)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
①模型Ⅰ的相关系数r为-0.90;
②模型Ⅱ的相关系数r为0.80;
③模型Ⅲ的相关系数r为-0.50;
④模型Ⅳ的相关系数r为0.25.
A.Ⅰ B.Ⅱ C.Ⅲ D.Ⅳ
解析:因为|r|越趋近1,相关性越强,模型拟合效果越好,所以拟合效果最好的模型是Ⅰ.
A
数学
2.(2022·北京高二期末)以下四幅散点图所对应的样本相关系数最大的是
( )
A.r1 B.r2 C.r3