内容正文:
8.2.2 一元线性回归模型参数的最小二乘估计(第1课时)
教学设计
1、 课时教学内容
本节的主要内容是一元线性回归模型,它是线性回归 分析的核心内容,也是后续研究两变量间的相关性有关问 题的基础.通过散点图直观探究分析得出的直线拟合方式 不同,拟合的效果就不同,它们与实际观测值均有一定的偏 差.在经历用不同估算方法描述两个变量线性相关关系的过 程中,解决用数学方法刻画从整体上看各观测点到拟合直线 的距离最小的问题,让学生在此基础上了解更为科学的数据 处理方式——最小二乘法,有助于他们更好地理解核心概念 “经验回归直线”,并最终体现回归方法的应用价值.
2、 课时教学目标
1.进一步掌握一元线性回归模型参数的统计意义,会用相关统计软件.
2.了解非线性回归模型.
3.会通过分析残差和利用R2判断回归模型的拟合效果.
3、 教学重点、难点
1. 重点:一元线性回归模型的基本思想,经验回归方程,最小二乘法.
2. 难点:求最小二乘估计,残差分析.
4、 教学过程设计
环节一 创设情境,引入课题
在一元线性回归模型中,表达式刻画的是变量Y与变量x之间的线性相关关系,其中参数a和b未知,需要根据成对样本数据进行估计.由模型的建立过程可知,参数a和b刻画了变量Y与变量x的线性关系,因此通过成对样本数据估计这两个参数,相当于寻找一条
适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.
问题1:从成对样本数据出发,如何用数学的方法刻画“从整体上看,各散点与直线最接近”?
【设计意图】明确问题,指明思考的方向,引发学生思考.
思路1:先画出一条直线,测量出各点到直线的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就得到一条直线.
问题2.我们怎样寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”?
【师生活动】教师提出探究问题,并引导学生得出探究目标,然后让学生小组合作讨论.学生分组合作讨论,然后各组派代表交流研究成果.
【设计意图】培养学生的团结协作意识,提升学生的逻辑推理核心素养.
探究:利用散点图8.2-1找出一条直线,使各散点在整体上与此直线尽可能接近.
有的同学可能会想,可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到一条直线,如图8.2-2所示.
思路2:可以在散点图中选两点画一条直线,使得直线两侧点的个数基本相同,把这条直线作为所求直线.
有的同学可能会想,可以在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同,把这条直线作为所求直线,如图8.2-3所示.
思路3:在散点图中多取几对点,确定出几条直线,再分别求出这些直线的斜率、截距的平均数作为所求直线的斜率和截距.
还有的同学会想,在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距如图8.2-4所示.
同学们不妨去实践一下,看看这些方法是不是真的可行.
环节二 观察分析,感知概念
上面这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径先进一步明确我们面临的任务:从成对样本数据出发,用数学的方法刻画“从整体上看,各散点与直线最接近”.
通常,我们会想到利用点到直线的“距离”来刻画散点与该直线的接近程度,然
后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度我们设满足一元线性回归模型的两个变量的对样本数据为,,…,,由,得.显然越小,表示点与点的“距离”越小,即样本数据点离直线的竖直距离越小,如图8.2-5所示.特别地,时,表示点在这条直线上.
因此,可以用这n个竖直距离之和
来刻画各样本观测数据与直线的“整体接近程度”.
问题3.你能结合具体实例解释产生模型①中随机误差项的原因吗?
在实际应用中,因为绝对值使得计算不方便,所以人们通常用各散点到直线的竖直距离的平方之和
来刻画“整体接近程度”.
在上式中,是已知的成对样本数据,所以Q由a和b所决定,即它是a和b的函数.因为Q还可以表示为,即它是随机误差的平方和,这个和当然越小越好,所以我们取使Q达到最小的a和b的值,作为截距和斜率的估计值.
环节三 抽象概括,形成概念
问题4:如何求a,b的值,使 最小?
【设计意图】将距离最值问题抽象为函数求二元函数最值问题.
下面利用成对样本数据求使Q取最小值的a,b.
记,.因为
,
注意到
所以.
上式右边各项均为非负数,且前n项与a无关.所以,要使Q取到最小值,后一项的值应为0,即此时.
上式是关于b的二次函数,因此要使Q取得最小值,当且仅当b的取值为
.
综上,当a,b的取值为
(2)
时,Q达到最小.