内容正文:
第2课时 相关系数 [教学方式:深化学习课——梯度进阶式教学]
[课时目标] 会通过相关系数判断两个变量的相关性强弱,并会求相关系数.
1.相关系数
来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相关系数).
2.相关系数r的性质
(1)|r|≤1,且y与x正相关的充要条件是 r>0,y与x负相关的充要条件是 r<0.
(2)|r|越小,说明两个变量之间的线性相关性越弱,也就是得出的回归直线方程越没有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线性相关性越强,也就是得出的回归直线方程越有价值.
(3)|r|=1的充要条件是成对数据构成的点都在回归直线上.
基础落实训练
1.判断正误(正确的画“√”,错误的画“×”)
(1)求回归直线方程前必须进行相关性检验. ( )
(2)两个变量的相关系数越大,它们的相关程度越强. ( )
(3)若相关系数r=0,则两变量x,y之间没有关系. ( )
答案:(1)√ (2)× (3)×
2.若回归直线方程中的回归系数=0,则相关系数r= .
解析:
答案:0
题型(一) 相关系数与相关关系的强弱
[例1] 对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是 ( )
A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
解析:选A 由散点图可知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2<r4<0<r3<r1.故选A.
|思|维|建|模|
相关关系强弱的定量分析与定性分析
(1)定量分析:相关系数r的范围为-1≤r≤1,r为正时,成对数据正相关;r为负时,成对数据负相关;|r|越接近于1,成对数据的线性相关程度越大;|r|越接近于0,成对数据的线性相关程度越小;当|r|=1时,所有数据点都在一条直线上.
(2)定性分析:相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱.
[针对训练]
1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性 ( )
A.甲 B.乙
C.丙 D.丁
解析:选D |r|越接近1,相关性越强.
2.在一组成对数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组成对数据的相关系数为-1,则所有的成对数据(xi,yi)(i=1,2,…,n)满足的方程可以是 ( )
A.y=-x+1 B.y=x-1
C.y=x+1 D.y=-x2
解析:选A ∵这组成对数据的相关系数为-1,∴这一组数据(x1,y1),(x2,y2),…,(xn,yn)线性相关,且是负相关.故选A.
题型(二) 相关系数的计算
[例2] 减脂是现在很热门的话题,人体内的脂肪会受年龄的影响而不同,为了解脂肪和年龄是否有关系,某兴趣小组得到年龄和脂肪观测值的如下数据:
年龄
23
27
39
41
45
50
53
56
脂肪值
9.5
17.8
21.2
25.9
27.5
28.2
29.6
31.4
并计算得≈41.8,≈23.9,=14 930,≈4 941, xiyi=8 562.5.求年龄和脂肪值的样本相关系数.(精确到0.01)
解:
≈
=
≈
≈0.96.
|思|维|建|模|
求相关系数的注意点
(1)一般情况下,题目会给出求相关系数的公式,注意代入计算,
(2)特别地,当r=±1时,说明所有散点均在一条直线上.
[针对训练]
3.一唱片公司研究预支出费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10千张,得到如下的资料:xi=28,=303.4,yi=75,=598.5,xiyi=237,则y与x的相关系数r= .
解析:
答案:0.3
题型(三) 相关系数的实际应用
[例3] 国家为了加快新能源汽车的普及,在全国范围内逐步增建充电桩.某地区2020~2024年的充电桩数量及新能源汽车的年销量如表所示:
年份
2020
2021
2022
2023
2024
充电桩数量x/万台
1
3
5
7
9
新能源汽车年销量y/万辆
25
37
48
58
72
(1)由上表中新能源汽车年销量y和充电桩数量x的样本数据所画出的散点图知,它们的关系可用线性回归模型拟合,请用所学统计知识进行定量分析;(结果精确到0.001)
(2)求y关于x的回归直线方程,且预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考数据:=40,=1 326,xiyi=1 430,≈230.304 1.
解:(1)由题知=×(1+3+5+7+9)=5,=×(25+37+48+58+72)=48,
又=40,=1 326,xiyi=1 430,
=≈≈0.999.
因为y与x的相关系数近似为0.999,非常接近1,
所以y与x的线性相关程度很高,可以用线性回归模型拟合y与x的关系.
(2)
所以y关于x的回归直线方程为=5.75x+19.25.当x=24时,=5.75×24+19.25=157.25,
故当该地区充电桩数量为24万台时,新能源汽车的年销量约为157.25万辆.
|思|维|建|模|
相关系数常与回归直线方程相结合考查.先利用相关系数说明两个变量有关系,再求回归直线方程.
[针对训练]
4.国家发展改革委制定了煤改气、煤改电价格扶持新政策,从而使得煤改气、煤改电用户大幅度增加.下面条形图反映了某省连续7个月的煤改气、煤改电的用户数量.
(1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;
(2)建立y关于t的回归直线方程(系数精确到0.01),预测该省第11个月的煤改气、煤改电的用户数量.
解:(1)作出散点图如图所示,y与t的数据点集中在一条直线附近,y与t具有线性相关性.
∴r≈≈0.99.
∵y与t的相关系数近似为0.99,∴y与t的线性相关性相当高.
(2)由==1.32及(1)得,
∴=-≈1.32-0.10×4=0.92,
∴y关于t的回归直线方程为
=0.10t+0.92.将t=11代入回归直线方程得,
=0.10×11+0.92=2.02,∴预测该省第11个月的煤改气、煤改电的用户数量达到2.02万户.
学科网(北京)股份有限公司
$