8.2.2 一元线性回归模型参数的最小二乘估计(第2课时)课件-2025-2026学年高二下学期数学人教A版选择性必修第三册

2026-06-19
| 29页
| 208人阅读
| 0人下载
普通
简思数学
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版选择性必修第三册
年级 高二
章节 8.2.2 一元线性回归模型参数的最小二乘估计
类型 课件
知识点 -
使用场景 同步教学-新授课
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 PPTX
文件大小 4.18 MB
发布时间 2026-06-19
更新时间 2026-06-19
作者 简思数学
品牌系列 -
审核时间 2026-06-19
下载链接 https://m.zxxk.com/soft/58416559.html
价格 2.00储值(1储值=1元)
来源 学科网

摘要:

该高中数学课件聚焦一元线性回归模型的残差分析、决定系数及非线性回归方程转化,通过“温故知新”复习经验回归方程与最小二乘估计,结合树高与胸径实例引入残差分析,搭建新旧知识学习支架。 其亮点在于用残差图、决定系数比较模型拟合效果,借百米世界纪录案例将非线性问题转化为线性回归,培育数据分析、逻辑推理核心素养。归纳非线性回归步骤,助力学生掌握方法,教师教学更高效。

内容正文:

第八章 成对数据的统计分析 8.2一元线性回归模型及其应用 8.2.2一元线性回归模型参数的最小二乘估计 (第二课时) 课堂构建 知识 一元线性回归模型 经验回归方程 残差分析 决定系数 经验回归方程的求法 经验回归方程拟合效果的判断方法 非线性经验回归方程的求法 方法 数据分析 数学运算 素养或思想 学习目标 理解残差的概念 能通过残差分析和决定系数 判断回归模型的拟合效果,培育逻辑推理、数学运算的核心素养. 针对实际问题,会用一元线性回归模型进行预测,能够根据线性回归的方法转化求解非线性回归问题,并作出统计决策,提升逻辑推理与数据分析的核心素养. 温 故 而 知 新 1、经验回归方程 我们将 称为Y关于x的经验回归方程,也称经验回归函数 或经验回归公式,其图形称为经验回归直线. 这种求经验回归方程的 方法叫做最小二乘法. 2、最小二乘估计 经验回归方程中的参数 计算公式为: 3、残差分析 残差是随机误差的估计值,通过对残差的分析可判断回归模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面的工作称为残差分析. 新知探究 例1 经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高,由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高. 在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据(如表8.2-3),试根据这些数据建立树高关于胸径的经验回归方程. 分析:因为要由胸径预测树高,所以要以成对样本数据的胸径为横坐标、树高为纵坐标画出散点,进而得到散点图,再根据散点图推断树高与胸径是否线性相关.如果是,再利用公式(2)计算出即可. 新知探究 以胸径为横坐标,树高为纵坐标作散点图: 散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系. 用d表示胸径,h表示树高,根据据最小二乘法,计算可得经验回归方程为 相应的经验回归直线如下图所示. 新知探究 根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,如下表所示 新知探究 以胸径为横坐标,残差为纵坐标,作残差图,得到下图 0 0.5 1.0 -0.5 -1.0 15 20 25 30 35 40 残差/m 胸径/cm • • • • • • • • • • • • • • 45 观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高. 新知探究 回归分析的实际意义 建立树的胸径和树高的关系是有实际意义的.实际上,在采伐设计、资源评估、森林规划调查等林业工作中常需测算森林蓄积量.可以从森林中抽取部分树木,通过树的胸径与树高估计抽到的每棵树的体积,进而推断整片森林的蓄积量.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.因此,建模时将胸径作为解释变量,树高作为响应变量,即树高作为响应变量是解决实际问题的需要. 新知探究 例2 人们常将男子短跑100m的高水平运动员称为“百米飞人”. 下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据. 试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程. 编号 年份 记录/s 1 1896 11.80 2 1912 10.60 3 1921 10.40 4 1930 10.30 5 1936 10.20 6 1956 10.10 7 1960 10.00 8 1968 9.95 画散点图: 在图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程. 新知探究 求经验回归方程 用表示男子短跑的世界纪录,表示纪录产生的年份,利用一元线性回归方程模型 来刻画世界纪录和世界纪录产生年份之间的关系. 根据最小二乘法, 由表中的数据得到经验回归方程为 将经验回归直线叠加到散点图,得到下图. 新知探究 观察:从下图中可以看到,该经验回归方程能否较好地刻画了散点的变化趋势?请仔细观察图形,你能看出其中存在的问题吗? 以经验回归直线为参照,可以发现经验回归方程的不足之处,以及散点的更为精细的分布特征.以经验回归直线为参照,可以发现经验回归方程的不足之处,以及散点的更为精细的分布特征.散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征. 新知探究 思考1:你能对模型进行修改,以使其更好地反映散点的分布特征吗? 修改模型: 仔细观察右图, 可以发现散点更趋向于落在中间下凸且递减的某条曲线附近. 函数y=-lnx的图象具有类似的形状特征. 注意到100m短跑的第一个世界纪录产生于1896年 , 因此可认为散点是集中在曲线:y=f(t)=+ln(t-1895) (其中、为未知参数,且<0). 新知探究 用上述函数刻画数据变化的趋势,这是一个非线性经验回归函数,其中,是待定系数.现在问题转化为如何利用成对数据估计参数和. 令x=ln(t-1895),通过x=ln(t-1895) ,将年份变量数据进行变换,得到新的成对数据,如下表. 编号 年份/t x 记录/s 1 1896 0.00 11.80 2 1912 2.83 10.60 3 1921 3.26 10.40 4 1930 3.56 10.30 5 1936 3.71 10.20 6 1956 4.11 10.10 7 1960 4.17 10.00 8 1968 4.29 9.95 如果上表对应的散点图呈现出很强的线性相关特征,我们就可以借助一元线性回归模型和新的成对数据,对参数c1 和 c2作出估计,进而可以得到Y关于t的非线性经验回归方程. 由散点图可知,现在散点的分布呈现出很强的线性相关特征,故可以用一元线性回归模型建立经验回归方程. 新知探究 编号 年份/t x 记录/s 1 1896 0.00 11.80 2 1912 2.83 10.60 3 1921 3.26 10.40 4 1930 3.56 10.30 5 1936 3.71 10.20 6 1956 4.11 10.10 7 1960 4.17 10.00 8 1968 4.29 9.95 拟合上表中的成对数据,得到经验回归方程 上图表明,经验回归方程对于改进后的成对数据具有非常好的拟合精度. 将x=ln(t-1895)代入 得到由创纪录年份预报世界纪录的经验非线性回归方程: 新知探究 思考2:对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗? ② ① (1) 直接观察法. 由图可发现:散点图中各散点都非常靠近②的图像, 表明非线性经验回归方程②对于原始数据的拟合效果远远好于经验回归方程①. 新知探究 (2) 残差分析: 残差平方和小的回归模型拟合的效果更好. 用ti表示编号为i的年份数据,用yi表示编号为i的纪录数据,则经验回归方程①和②的残差计算公式分别为 两个经验回归方程的残差(精确到0.001)如下表所示. 编号 t 1 1896 0.591 -0.001 2 1912 -0.284 0.007 3 1921 -0.301 -0.012 4 1930 -0.218 0.015 5 1936 -0.196 -0.018 6 1956 0.111 0.052 7 1960 0.092 -0.021 8 1968 0.205 -0.022 观察各项残差的绝对值,发现经验回归方程②远远小于①,即经验回归方程②的拟合效果要远远好于①. 新知探究 (2) 残差分析: 在一般情况下,直接比较两个模型的残差比较困难,因为在某些散点上一个模型的残差的绝对值比另一个模型的小,而另一些散点的情况则相反.可以通过比较残差的平方和来比较两个模型的效果.由 编号 t 1 1896 0.591 -0.001 2 1912 -0.284 0.007 3 1921 -0.301 -0.012 4 1930 -0.218 0.015 5 1936 -0.196 -0.018 6 1956 0.111 0.052 7 1960 0.092 -0.021 8 1968 0.205 -0.022 可知Q2小于Q1. 因此在残差平方和最小的标准下, 非线性回归模型的拟合效果要优于一元线性回归模型. 新知探究 (3)决定系数R2 也可以用决定系数R2来比较这两个模型的拟合效果,R2的计算公式为 残差平方和 偏差平方和 (与经验回归方程有关) (与经验回归方程无关) 越大,表示残差平方和越小,即模型拟合效果越好; 越小,表示残差平方和越大,即模型的拟合效果越差. 新知探究 编号 t 1 1896 0.591 -0.001 2 1912 -0.284 0.007 3 1921 -0.301 -0.012 4 1930 -0.218 0.015 5 1936 -0.196 -0.018 6 1956 0.111 0.052 7 1960 0.092 -0.021 8 1968 0.205 -0.022 由上述残差表可算出经验回归方程①和②的决定系数R2分别为 由 因此经验回归方程②的刻画效果比经验回归方程①的好很多. 另外,我们还可以用新的观测数据来检验模型的拟合效果. 事实上,我们还有1968年之后的男子短跑100m世界纪录数据,如下表所示. 编号 t Y/s 9 1983 9.93 10 1988 9.92 11 1991 9.90 12 1991 9.86 13 1994 9.85 14 1996 9.84 15 1999 9.79 16 2005 9.77 17 2007 9.74 18 2008 9.72 19 2008 9.69 20 2009 9.58 在散点图中继续绘制上表中的散点(绿色),再添加经验回归方程①所对应的经验回归直线,以及经验回归方程②所对应的经验回归曲线,得到下图. 显然绿色散点分布在蓝色经验回归曲线的附近,远离红色经验回归直线,表明经验回归方程②对于新数据的预报效果远远好于①. 新知探究 思考:在上述问题情境中,男子短跑100m世界纪录和纪录产生年份之间呈现出对数关系,能借助样本相关系数刻画这种关系的强弱吗? 新知探究 在使用经验回归方程进行预测时,需要注意下列问题: 1.经验回归方程只适用于所研究的样本的总体; 2.经验回归方程一般都有时效性; 3.解释变量的取值不能离样本数据的范围太远; 4.不能期望回归方程得到的预报值就是响应变量的精确值.事实上,它是响应变量的可能取值的平均值. 典例分析 例1、为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1-10分别对应年份2013-2022. 根据散点图,分别用模型① 和模型② 作为年研发投入y关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值: (1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y关于年份代码x的经验回归方程模型?并说明理由; (2)根据(1)中所选模型,求出关于的经验回归方程,并预测该公司2028年的高科技研发投入. 附:对于一组数据 ,其经验回归直线 的斜率和截距的最小二乘估计分别为 典例分析 解:(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜. (2)设 ,所以 所以 , 所以y关于x的经验回归方程为 令 ,则 即预测该公司2028年的高科技研发投入亿元. 归纳小结 解决非线性回归问题的方法与步骤 (1)确定变量:确定解释变量为x,响应变量为y; (2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数、反比例函数等)作比较,选取拟合效果好的函数模型; (3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题; (4)分析拟合效果:通过计算决定系数来判断拟合效果; (5)写出非线性经验回归方程。 课堂达标 1.下列命题为真命题的是( ) A.经验回归直线是经过散点图中样本数据点最多的那条直线 B.可以用样本相关系数来刻画变量和的线性相关程度的强弱,的值越小,说 明两个变量的线性相关程度越弱 C.在回归分析中,决定系数的模型比决定系数 的模型的拟合效 果要好 D.残差平方和越小,回归模型的拟合效果越好 [解析] 确定经验回归直线的根据是误差最小,并不是经过的样本数据点最多, 所以A是假命题; 越接近0,变量与 的线性相关程度越弱,所以B是假命题; 决定系数 越大,模型的拟合效果越好,所以C是假命题; 由残差的统计学意义知,D为真命题.故选D. D 课堂达标 2.某种产品的广告费支出(单位:万元)与销售额 (单位:万元)的几组数据如下: 2 30 4 40 5 60 6 50 8 70 关于的经验回归方程为 ,当广告费支出5万元时,残差为( ) A. B. C. 20 D. 10 [解析] 当广告费支出5万元时,销售额的观测值为60, 预测值为, 则残差为 .故选D. D 课堂总结 (2)残差平方和 (1)残差分析: 列残差表 画残差图 (3)决定系数R2 分析模型的回归效果方法: 谢 谢 THANKS

资源预览图

8.2.2  一元线性回归模型参数的最小二乘估计(第2课时)课件-2025-2026学年高二下学期数学人教A版选择性必修第三册
1
8.2.2  一元线性回归模型参数的最小二乘估计(第2课时)课件-2025-2026学年高二下学期数学人教A版选择性必修第三册
2
8.2.2  一元线性回归模型参数的最小二乘估计(第2课时)课件-2025-2026学年高二下学期数学人教A版选择性必修第三册
3
8.2.2  一元线性回归模型参数的最小二乘估计(第2课时)课件-2025-2026学年高二下学期数学人教A版选择性必修第三册
4
8.2.2  一元线性回归模型参数的最小二乘估计(第2课时)课件-2025-2026学年高二下学期数学人教A版选择性必修第三册
5
8.2.2  一元线性回归模型参数的最小二乘估计(第2课时)课件-2025-2026学年高二下学期数学人教A版选择性必修第三册
6
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。