内容正文:
【解答题抢分专题】备战2023年高考数学解答题典型例题+跟踪训练(新高考通用)
专题17 统计之回归方程问题
目录一览
一、典型例题讲解
二、梳理必备知识
三、基础知识过关
四、解题技巧实战
五、跟踪训练达标
(1)线性回归方程
(2)非线性回归方程
六、高考真题衔接
一、典型例题讲解
【典例1】某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)求y关于x的线性回归方程.
(3)如果广告费支出为一千万元,预测销售额大约为多少百万元?
参考公式:,
【典例2】长沙某公司对其主推产品在过去5个月的月广告投入xi(百万元)和相应的销售额yi(百万元)进行了统计,其中i=1,2,3,4,5,对所得数据进行整理,绘制散点图并计算出一些统计量如下:
,,,,,
,,其中,i=1,2,3,4,5.
(Ⅰ)根据散点图判断,与哪一个适宜作为月销售额关于月广告投入xi的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及题中所给数据,建立y关于x的回归方程,并据此估计月广告投入220万元时的月销售额.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
【典例详解】
【典例1】试题分析:(1)根据表中所给的五组数据,得到五个点的坐标,在平面直角坐标系中画出散点图.(2)先求出横标和纵标的平均数,得到这组数据的样本中心点,利用最小二乘法求出线性回归方程的系数,代入样本中心点求出a的值,写出线性回归方程.
(3)将x=10代入回归直线方程求出y的值即为当广告费支出一千万元时的销售额的估计值.
【详解】(1)
.
(2)(求平均值时细心检验)
;
于是所求的线性回归方程是 (不表达线性回归方程扣1分)
(3)当时,.
【典例2】【分析】(1)根据散点图选择作为回归方程.
(2)利用公式及所给数据计算回归方程后可估计月销售额.
【详解】(1)根据散点图选择作为回归方程.
(2)令,(换元后,回归到线性回归方程问题)则,
,
故回归方程为,
当月广告投入为万元时,月销售额为(百万元).
答:选择作为回归方程,当月广告投入为万元时,月销售额约(万元).
解题技巧:线性回归方程的问题主要是对应好参考公式,利用好题目中的数据,计算平均数的时候要细心检验,其次就是计算时掌握一些技巧,防止出错!非线性回归方程的问题就是注意换元关系,本质上考查的还是线性回归方程的计算问题!
二、梳理必备知识
1.散点图
将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示.
2.相关系数
若相应于变量的取值,变量的观测值为,则变量与的相关系数,通常用来衡量与之间的线性关系的强弱,的范围为.
(1)当时,表示两个变量正相关;当时,表示两个变量负相关.
(2)越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上.
(3)通常当时,认为两个变量具有很强的线性相关关系.
3.线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
4.残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图
通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:.
越接近于,说明残差的平方和越小,也表示回归的效果越好.
5.非线性回归
建立非线性回归模型的基本步骤
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验