内容正文:
专题18 线性回归方程的应用
一、考点梳理
1.相关关系与回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.
(1) 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关;
(2) 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关;
(3) 如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.
2.线性回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:,其回归方程为,则注意:线性回归直线经过定点.
(3)相关系数:.
【技能方法】
(1)利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.
(2)利用相关系数判定,当越趋近于1相关性越强.当残差平方和越小,相关指数越大,相关性越强.
(3)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
(4)正确运用计算的公式和准确的计算,是求线性回归方程的关键.并充分利用回归直线过样本点的中心进行求值.
【易错指导】
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
二、题型分析
重难点题型突破01 “直线型”回归方程的应用
例1.(2021·浙江杭州市·高二课时练习)已知两个变量和之间有线性相关关系,经调查得到如下样本数据,
3
4
5
6
7
3.5
2.4
1.1
-0.2
-1.3
根据表格中的数据求得同归方程,则下列说法正确的是( )
A., B.,
C., D.,
【答案】B
【分析】
根据已知数据,可知变量和变量之间存在负相关的关系,即可判断出,再令,可求出,即可得出答案.
【详解】
解:由已知数据,可知随着的增大而减小,
则变量和变量之间存在负相关的关系,,
当时,则,
即:,.
故选:B.
【点睛】
本题考查变量间的相关关系和线性回归方程的应用问题.
【变式训练1-1】.(2020·全国高二课时练习)下表是鞋子的长度与对应码数的关系
长度()
24
24.5
25
25.5
26
26.5
码数
38
39
40
41
42
43
如果人的身高与脚板长呈线性相关且回归直线方程为.若某人的身高为173,据此模型,估计其穿的鞋子的码数为
A.40 B.41 C.42 D.43
【答案】C
【分析】
把人的身高代入方程,可求出脚板长,再查表可得到本题的答案.
【详解】
令代入直线方程,解得,所以脚板长为,查表得穿的鞋子的码数应为42.
故选:C
【点睛】
本题主要考查线性回归方程的简单应用,属于基础题.
【变式训练1-2】.(2018·全国高一课时练习)登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温x(℃)
18
13
10
-1
山高y(km)
24
34
38
64
由表中数据,得到线性回归方程=-2x+∈R),由此估计出山高为72(km)处的气温为_____℃.
【答案】-6
【解析】
由题意可得=10,=40,所以+2=40+2×10=60,所以=-2x+60,当=72时,-2x+60=72,解得x=-6.
例2.(2021·全国高三其他模拟)2020年全面建成小康社会取得伟大历史成就,决战脱贫攻坚取得决定性胜利.某市积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收,某商家统计了7个月的月广告投入(单位:万元)与月销量(单位:万件)的数据如表所示:
月广告投入/万元
1
2
3
4
5
6
7
月销量/万件
28
32
35
45
49
52
60
(1)已知可用线性回归模型拟合与的关系,请用相关系数加以说明,并求关于的线性回归方程;
(2)根据(1)的结论,预计月广告投入大于多少万元时,月销量能突破70万件.
参考数据:,,.
参考公式:相关系数;
回归直线的斜率和截距的最小二乘估计分别为,.
【