内容正文:
8.1.1 变量的相关关系
8.1.2 样本相关系数
学习目标 1.了解变量间的相关关系.
2.能根据散点图,判断两个变量是否具有相关关系.
3.了解样本相关系数的概念及公式,会判断相关性的强弱.
知识点1 变量的相关关系
两个变量间的关系有函数关系、相关关系和无相关性
1.相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2.散点图:将样本中的每个编号下的成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
3.正相关与负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现 的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现 的趋势,则称这两个变量负相关.
增加
减少
4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 附近,我们就称这两个变量线性相关.
5.非线性相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或 .
一条直线
曲线相关
思考辨析
如何判断具有相关关系的两个变量呈线性相关还是非线性相关?
提示 可以通过散点图进行判断.
自主诊断
1.判断正误.(正确的画√,错误的画×)
(1)函数关系是一种确定关系,而相关关系是一种不确定关系.( )
(2)散点图可以直观地分析出两个变量是否具有相关性.( )
(3)若变量x,y满足函数关系,则这两个变量线性相关.( )
(4)当一个变量的值增加时,另一个变量的值随之减少,则称这两个变量负相关.( )
√
√
×
×
2.(北师大版教材习题改编)下表是某小卖部6天卖出热茶的杯数(单位:杯)与当天气温(单位: ℃)的对比表:
气温/℃ 26 18 13 10 4 -1
杯数/杯 20 24 34 38 50 64
(1)根据上表中的数据画出散点图.
(2)你能从散点图中发现当天气温与卖出热茶的杯数近似地呈现什么关系吗?
(3)如果近似呈线性关系,请画出一条直线来近似地表示这种线性关系.
解 (1)根据提供的数据,画出散点图如图.
(2)从散点图可以看出,当天气温与卖出热茶的杯数近似地呈现线性相关关系,并且当气温越高时,卖出热茶的杯数就越少.
(3)根据散点图画直线如图.
知识点2 样本相关系数
1.对于变量x和变量y,设经过随机抽样获得的成对样本数据为
我们称r为变量x和变量y的样本相关系数.
2.样本相关系数r的取值范围为 .
(1)当r>0时,称成对样本数据 相关;
(2)当r<0时,称成对样本数据 相关;
(3)当|r|越接近 时,成对样本数据的线性相关程度越强;
(4)当|r|越接近 时,成对样本数据的线性相关程度越弱.
[-1,1]
正
负
1
0
思考辨析
当|r|=1时,样本数据的散点图有什么特征?
提示 散点图中的点落在同一条直线上.
自主诊断
1.判断正误.(正确的画“√”,错误的画“×”)
(1)两个变量之间产生相关关系的原因受许多不确定的随机因素的影响.
( )
(2)两个变量的样本相关系数越大,它们的相关程度越强.( )
(3)若样本相关系数r=0,则两变量x,y之间没有关系.( )
√
×
×
2.以下是对四组数据进行统计获得的散点图,根据散点图的特点你能得出对应样本相关系数的大小关系吗?
解 由给出的四组数据的散点图可以看出,题图1和题图3是正相关,样本相关系数大于0,题图2和题图4是负相关,样本相关系数小于0,题图1和题图2的样本点集中在一条直线附近,所以相关性更强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.
探究点一 相关关系的概念
【例1】 判断以下两个变量之间是否具有相关关系?
(1)正方形的面积与其周长之间的关系;
(2)父母的身高与子女的身高之间的关系;
(3)学生的学号与身高;
(4)汽车匀速行驶时的路程与时间的关系.
解 (1)设正方形的面积为S,周长为C,则S=( )2,即正方形的面积由其周长唯一确定,因此二者是函数关系,不是相关关系.
(2)子女身高除了与父母的身高有一定关系外,还与其他因素有关,即子女的身高并不是由其父母的身高唯一确定的,因此二者之间具有相关关系.
(3)学生的学号与身高之间没有任何关系,不具有相关关系.
(4)若汽车匀速行驶时的速度为v,行驶的路程为s,时间为t,则有s=vt,因此当速度一定时,路程由时间唯一确定,二者之间具有函数关系,而不是相关关系.
规律方法 函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
变式训练1下列两个变量具有相关关系且不是函数关系的是( )
A.圆的半径与面积
B.真空中自由落体运动物体的下落距离和下落时间
C.庄稼的产量与施肥量
D.人的身高与视力
C
解析 由圆的半径与面积的公式S=πr2知,圆的半径与面积之间为函数关系,故A不正确;
真空中自由落体运动物体的下落距离和下落时间有函数关系s= gt2,故B不正确;
施肥量会影响庄稼产量,但不是唯一因素,故庄稼的产量与施肥量两个变量具有相关关系且不是函数关系,故C正确;
人的身高与视力之间没有关系,故D不正确.故选C.
探究点二 散点图的应用
【例2】 某公司2019~2024年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:
年份 2019 2020 2021 2022 2023 2024
利润x/百万元 12.2 14.6 16 18 20.4 22.3
支出y/百万元 0.62 0.74 0.81 0.89 1 1.11
判断x与y是否线性相关,若是线性相关,试判断是正相关还是负相关?
解 作出散点图(图略),由散点图可知,各点分布在一条直线附近,故x与y之间线性相关,且y随x的增加呈现增加的趋势,是正相关.
规律方法 判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
变式训练2对变量x,y,由观测数据得散点图1;对变量y,z,由观测数据得散点图2.由这两个散点图可以判断( )
图1
图2
A.变量x与y正相关,z与y正相关 B.变量x与y正相关,z与y负相关
C.变量x与y负相关,z与y正相关 D.变量x与y负相关,z与y负相关
C
解析 通过观察散点图可以知道,y随x的增大而减小,各点整体呈下降趋势,x与y负相关,z随y的增大而增大,各点整体呈上升趋势,z与y正相关.
探究点三 样本相关系数的应用
【例3】 (2025河南一模)某景区试卖一款纪念品,现统计了该款纪念品的定价x(单位:元)与销量y(单位:百件)的对应数据,如下表所示:
x 12 12.5 13 13.5 14
y 14 13 11 9 8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算x与y的样本相关系数;
(3)由(2)的计算结果,判断y与x的相关程度,并说明理由.
参考数据:(xi-)(yi-)=-8,≈0.992.
参考公式:样本相关系数r=.
解 (1)由题可知(12+12.5+13+13.5+14)=13,
(14+13+11+9+8)=11.
(2)画出散点图(图略),可以推断x和y线性相关.
计算得(xi-)2=2.5,(yi-)2=26,
故r==--0.992.
(3)由(2)可知,y与x的样本相关系数的绝对值近似为0.992,大于0.75且非常接近1,说明y与x的相关程度很强.
规律方法 利用样本相关系数判断线性相关的求解策略
(1)先计算样本相关系数r的值;
(2)用|r|与0或1比较;
(3)对变量x与变量y的相关关系作出判断.
变式训练3(1)对变量x,y,由观测数据(xi,yi)(i=1,2,…,10)得散点图1;对变量u,v,由观测数据(ui,vi)(i=1,2,…,10)得散点图2.r1表示变量x,y之间的样本相关系数,r2表示变量u,v之间的样本相关系数,则下列结论正确的是( )
图1
图2
A.-1<r1<r2<0
B.-1<r2<r1<0
C.0<r1<r2<1
D.0<r2<r1<1
A
解析 从图象中看出y随x的增大而减小,v随u的增大而减小,则y与x负相关,v与u负相关,即r1<0,r2<0,故C,D不正确;
另外对比两图,容易看出y与x相关性更强,故r1更接近-1,所以得-1<r1<r2<0,故A正确,B错误.故选A.
A.0.6 B.0.5 C.0.4 D.0.3
D
本节要点归纳
1.知识清单:
(1)相关关系及散点图;
(2)样本相关系数;
(3)相关关系的强弱及其实际应用.
2.方法归纳:数形结合.
3.常见误区:(1)相关关系与函数关系不分;(2)混淆样本相关系数绝对值的大小与相关程度的关系.
(x1,y1),(x2,y2),…,(xn,yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分别为,
计算r= .
(2)已知xi=28,=303.4,yi=75,=598.5, xiyi=237,x与y线性相关,则y与x的样本相关系数r的绝对值为( )
解析 因为xi=28,yi=75,所以=2.8,=7.5,
|r|===0.3.故选D.
$