内容正文:
8.2 一元线性回归模型及其应用
课时3 一元线性回归模型及其参数的
最小二乘估计
学习目标
课程目标 学科核心素养
结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义,会用一元线性回归模型进行预测 通过构建一元线性回归模型解决实际问题,培养数学建模、数据分析、数学运算素养
了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件 在运用最小二乘法求经验回归方程,并据此进行预测的过程中,培养数学抽象、数据分析、数学运算素养
情境导学
1885年,美国著名统计学家高尔顿在研究人的个子高矮的遗传规律时,随机选取了205对夫妇及其928个成年子女的身高数据时,发现一个有趣的现象:当父母的平均身高大于平均值时,他们的子女相对较高,但与父母相比还是矮一些;当父母的平均身高小于平均值时,他们的子女相对较矮,但比父母又要高一些.这表明子女身高有向平均身高“回归”的倾向.后来,人们把由一个变量去推测另一个变量的变化方法称为回归分析.
本节课我们将学习一元线性回归模型,在实际生产生活问题中,会用最小二乘法求出经验回归方程,并据此进行预测.
初探新知
【活动1】
构建一元线性回归模型
问题1
生活经验告诉我们,儿子的身高与父亲的身高相关.一般来说,父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表1所示.
由这组样本数据能否推断儿子的身高与父亲的身高有关系?关系的相关程度如何?是函数关系还是线性相关关系?为什么?
初探新知
问题2
由问题1表1的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?
问题3
从前面讨论可知,儿子身高和父亲身高有较强的线性相关关系但不是函数关系.那么请你说说影响儿子身高的其他因素是什么,如何构建儿子身高和父亲身高的回归模型.
初探新知
【活动2】
一元线性回归模型的理解、随机误差的产生原因
问题4
问题3中的一元线性回归模型中,为何要假设E(e)=0,而不假设其为某个不为0的常数?
问题5
你能结合父亲身高x与儿子身高Y的实例,解释一元线性回归模型的含义吗?
问题6
你能结合具体实例,解释线性回归模型(*)中随机误差项e产生的原因吗?
问题7
某人计算出父亲身高与儿子身高的一元线性回归模型中参数b=0.778,请说明参数b的含义是什么?
初探新知
【活动3】
最小二乘法推导经验回归方程的探究
问题8
在一元线性回归模型中,表达式Y=bx+a+e刻画的是变量与变量之间的线性相关关系,其中参数a和b未知,通过成对样本数据估计这两个参数,相当于寻找一个适当的直线,使得表示成对样本数据的这些散点在整体上与这条直线最接近.想一想,和同学交流一下有哪些做法.这些做法可行吗?如何用数学的方法去刻画“从整体上看,各散点与直线最接近”呢?
问题9
如何确定a和b的值,使得Q=取得最小值.
初探新知
【活动4】
模型的拟合效果分析
问题10
如何判断模型刻画数据的效果?
问题11
观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?
知识梳理
1. 一元线性回归模型中a,b的最小二乘估计.
2. 我们将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
典例精析
【思路点拨】(1) 样本相关系数的绝对值越接近1,变量的线性相关程度越强,因此可以用样本相关系数判断两变量是否可以用一元线性回归模型拟合. (2) 根据参考数据以及最小二乘估计公式,可以求出经验回归方程的参数,再利用所得经验回归方程进行预测.
【例1】[2022·辽宁省朝阳市建平县实验中学高二月考]随着人民生活水平的日益提高,汽车进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受到人们喜欢.某新能源汽车销售企业在2018—2022年的销售量y(单位:万辆)数据如表所示.
(1) 根据数据资料,可用一元线性回归模型拟合y与x的关系,请用样本相关系数加以说明;
(2) 建立y关于x的经验回归方程,并预计2023年该新能源汽车企业的销售量.
参考数据:=16,=10,=26,
参考公式:=
经验回归方程中=中,,
典例精析
【解】
(1) 由题意可得r===,显然接近1,
故y与x线性相关程度很强,故可用一元线性回归模型拟合.
(2) 由(1)可知,可用一元线性回归模型来刻画y与x的关系.根据最小二乘法公式及表中的数据可得,==1.6,又=×(1+2+3+4+5)=3,
=×(17+18+20+22+23)=20,故20-1.6×3=15.2,所以经验回归方程为=1.6x+15.2,又2023年对应的年份代号x为6,故=1.6×6+15.2=24.8