剖析回归模型的建立与应用-《中学生数理化》高考数学2025年6月刊

2025-06-12
| 3页
| 25人阅读
| 2人下载
教辅
中学生数理化高中版编辑部
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 -
使用场景 高考复习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 PDF
文件大小 822 KB
发布时间 2025-06-12
更新时间 2025-06-12
作者 中学生数理化高中版编辑部
品牌系列 中学生数理化·高考数学
审核时间 2025-06-12
下载链接 https://m.zxxk.com/soft/52541315.html
价格 2.00储值(1储值=1元)
来源 学科网

内容正文:

■江苏省淮州中学 王草野 回归模型的建立与应用是统计中综合数 据分析与数据处理的一个重要方面。统计中 的数据信息是借助线性经验回归与非线性经 验回归模型的建立来判断回归模型的拟合效 果。回归模型的建立与应用是借助回归分 析,对有相关关系的两个变量进行统计分析, 通过相关系数进行检验,进而分析并判断两 个变量是否具有线性相关关系。回归分析是 通过对散点图直观地了解两个变量的关系, 然后建立线性或非线性回归模型来评价模型 的好坏,以及判断回归模型的拟合效果等。 本文结合典型实例剖析、归纳、总结有关回归 分析问题的解题技巧与方法,引领并指导同 学们的复习与备考。 一、线性经验回归问题 线性经验回归是回归模型中考查的重点 问题之一,要求同学们能够根据已有数据获 取信息,进而判断是线性经验分析,并结合经 验回归方程的求解,进一步加以数据分析或 预测决策等。 例 1 (2024年山东省济南市高考数 学模拟试卷)随着科技的发展,网购成了人们 购物的重要选择,并对实体经济产生了一定 影响。为了解实体经济的现状,某研究机构 统计了一个大商场2019~2023年的线下销 售额,如表1所示: 表1 年份编号x 1 2 3 4 5 年份 201920202021 2022 2023 销售额y (单位:万元) 1 5131 4651 2021 060 860 (1)结合表1中的数据,判断销售额y 与 年份编号x 之间的关系是否可以用线性回归 模型来拟合与应用,并用样本相关系数加以 分析与说明; (2)试建立销售额y 与年份编号x 之间 的经验回归方程,并预测2025年该商场的线 下销售额。 附:r= ∑ n i=1 xiyi -nx y ∑ n i=1 x2i -nx2 ∑ n i=1 y2i -ny2 , b̂= ∑ n i=1 xiyi-nx y ∑ n i=1 x2i -nx2 , â=y- b̂ 􀭵x,∑ 5 i=1 yi=6 100, ∑ 5 i=1 xiyi=16 589, ∑ 5 i=1 x2i-5x2 ∑ 5 i=1 y2i-5y2 ≈1 736。 解析:(1)由已知数据可得,x =3,y= ∑ 5 i=1 yi 5 = 6 100 5 =1 220,所以∑ 5 i=1 xiyi-5x y= 16 589-5×3×1 220=-1 711。 所以r= ∑ 5 i=1 xiyi-5x y ∑ 5 i=1 x2i -5x2 ∑ 5 i=1 y2i -5y2 ≈- 1 711 1 736 ≈ -0.985 6。 因为|r|非常接近1,所以可用线性回 归模型拟合销售额y与年份编号x 的关系。 (2)由已知数据可得,∑ 5 i=1 x2i =12+22+ 32+42+52=55,所以b̂= ∑ 5 i=1 xiyi -5x y ∑ 5 i=1 x2i -5x2 = 16 589-5×3×1 220 55-5×32 =-171.1,̂a=y- b̂x=1 220-(-171.1)×3=1 733.3。 所以y 关于x 的经验回归方程为ŷ= 42 解题篇 创新题追根溯源 高考数学 2025年6月 -171.1x+1 733.3。 令x=7,得ŷ=-171.1×7+1 733.3= 535.6(万元),所以预测2025年该商场的线 下销售额为535.6万元。 点评:解决此类线性回归分析问题的基 本策略为:①利用最小二乘估计公式,借助数 学运算求出回归系数b̂;②利用经验回归直 线过样本点的中心这一基本性质,代入求解 相应的系数â;③根据系数确定写出经验回 归方程,并利用经验回归方程进行合理的预 测与决策等。 二、非线性经验回归问题 非线性经验回归是基于基本初等函数模 型(主要包括幂函数、指数函数、对数函数等) 与线性函数之间的对应关系,化非线性经验 回归为线性函数,借助数据分析与方程求解 后再加以还原处理。 例 2 (2024年黑龙江省龙西北名校 联合体高三(上)期中数学试卷)在隧道施工 过程中,若隧道拱顶下沉速率过快,无法保证 工程施工的安全性,则需及时调整支护参数。 某施工队对正在施工的某隧道工程进行下沉 量监控,通过对监控结果进行回归分析,建立 前t天隧道拱顶的累加总下沉量z(单位:毫 米)与时间t(单位:天)的经验回归方程,通过 经验回归方程预测是否需要调整支护参数。 已知该隧道拱顶下沉的实测数据如表2所示: 表2 t(单位:天) 1 2 3 4 5 6 7 z(单位:毫米)0.01 0.04 0.14 0.52 1.38 2.31 4.30 研究人员制作相应散点图,通过观察,拟 用函数z=kebt 进行拟合。令u=ln z,计算 得∑ 7 i=1 (ti -t)(ui-u)≈25.2,∑ 7 i=1 (ui -u)2 ≈30,u=-1.2。 (1)试建立z与t的经验回归方程,并预 测前8天该隧道拱顶的累加总下沉量;(精确 到0.1) (2)已知拱顶在某天的下沉速率超过27 毫米/天,支护系统将超负荷,隧道有塌方风 险,施工队需要提前一天调整支护参数,试估 计最迟在第几天调整支护参数。(精确到整 数) 附:①回归直线ŷ=̂a+̂bx 中斜率和截 距 的 最 小 二 乘 估 计 公 式 分 别 为 b̂ = ∑ n i=1 (xi -x)(yi -y) ∑ n i=1 (xi -x)2 ,̂a=y-̂b􀭺x; ② 参考数 据: 210 ≈14.5,ln 30≈ 3.4,e2.4 ≈11.0。 解析:(1)由题知t=4,∑ 7 i=1 (ti -t)2=28, 所以r≈ 25.2 28×30 = 25.2 2 210 ≈0.9。 所以可以用线性回归模型拟合u 与t的 关系,由z=kebt,则u=ln z=bt+ln k。 因为b̂= ∑ 7 i=1 (ti -t)(ui -u) ∑ 7 i=1 (ti -t)2 ≈ 25.2 28 = 0.9,ln k=􀭵u-̂b􀭺x=-1.2-0.9×4=-4.8, 所以k=e-4.8,所以ẑ=e0.9t-4.8。 当t=8 时,̂z=e0.9×8-4.8=e2.4≈11.0(毫 米),所以预测前8天该隧道拱顶的累加总下 沉量约为11.0毫米。 (2)由(1)知ẑ=e0.9t-4.8,则下沉速率为 ẑ'=0.9e0.9t-4.8。 设第n天的下沉速率超过27毫米/天, 则0.9e0.9n-4.8>27,即e0.9n-4.8>30,即0.9n- 4.8>ln 30,即0.9n>3.4+4.8,即n>9.1。 所以第10天该隧道拱顶的下沉速率超 过27毫米/天,最迟在第9天需调整支护参 数,才能避免塌方。 点评:解决此类非线性回归分析问题时, 需要根据题设已知数据所对应的散点图的趋 势变化情况,联系各种基本初等函数的图像 加以分析与对比,合理进行拟合与比较,借助 变量的代换与转化进行线性回归分析。具体 的解题步骤一般为:①根据原始数据信息,作 出对应的散点图;②根据散点图的大体变化 趋势特征,选择恰当的拟合函数;③借助恰当 的变换,将非线性函数转化为线性函数,求出 相应的经验回归方程;④通过对应的变换与 还原,即可得到对应的非线性回归方程。 52 解题篇 创新题追根溯源 高考数学 2025年6月 三、回归模型的拟合效果 回归模拟的拟合效果可以从几何与代数 两个不同视角加以分析,几何直观层面可以 从残差图进行直观分析,代数运算层面可以 从系数法进行数学运算等,进而科学分析并 判断拟合效果,为预测或决策提供依据。 例 3 (2024年四川省泸州市泸县四 中高考数学适应性试卷)某科技公司积极响 应国家政策,加大高科技研发投入,现对近十 年来高科技研发投入情况分析调研,统计了 近十年的研发投入y(单位:亿元)与年份代 码x 共10组数据,其中年份代码x=1,2, …,10,分别指2014年,2015年,…,2023年。 现用模型:①y=bx+a,②y=d x+c分别 图1 进行拟合,结合 与之对应的经验 回归方程,借助 残差分析得到对 应的残差图(图 1)。 根据收集到的数据,计算得y=75,t= 2.25,∑ 10 i=1 (xi -x)2 =82.5,∑ 10 i=1 (ti -t)2 = 4.5,∑ 10 i=1 (yi -y)(xi -x)=121.4,∑ 10 i=1 (yi - y)(ti -t)=28.82,其 中ti = xi,t= 1 10∑ 10 i=1 ti。 (1)根据以上两种模型的残差图,比较模 型①和模型②的拟合效果,应作何选择,并给 出相应的理由说明。 (2)根据(1)中所选模型及其应用,求出 y 关于x 的经验回归方程;根据该模型,求该 公司2029年高科技研发投入y 的预测值。 (回归系数精确到0.01) 附:对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),…,(xn,yn),其回归直线 ŷ=̂a+̂bx 的斜率和截距的最小二乘估计公式分 别为̂b= ∑ n i=1 (xi -x)(yi -y) ∑ n i=1 (xi -x)2 ,̂a=y-̂bx。 解析:(1)应该选择模型②。 由于模型②对应的残差点比模型①对应 的残差点更加均匀地落在水平的带状区域 中,因此模型②对应的经验回归方程的预报 精度相比模型①会更高。 (2)根据模型②,令t= x,研发投入y 与t 可用线性回归模型来拟合,有ŷ=̂dt+̂c。 由d̂ = ∑ 10 i=1 (yi -y)(ti -t) ∑ 10 i=1 (ti -t)2 = 28.82 4.5 ≈ 6.40,可得ĉ=y-̂dt=75- 28.82 4.5 ×2.25= 60.59,则y 关于t 的经验回归方程为ŷ= 6.40t+60.59。 所以y 关于x 的经验回归方程为ŷ= 6.40 x+60.59。 2029年,即当x=16 时,̂y=6.40 16 +60.59=86.19(亿元)。 所以该公司2029年高科技研发投入y 的预测值为86.19亿元。 点评:对于此类判断回归模型的拟合效 果问题,具体的判断技巧与方法主要有以下 两种:(1)残差分析法:作出残差图,观察残差 点所在的水平带状区域,带状区域的宽度越 窄,说明模型拟合精度越高。(2)决定系数 法:R2 =1 - ∑ n i=1 (yi -̂yi)2 ∑ n i=1 (yi -y)2 , 其 中 y = 1 n∑ n i=1 yi。R2 的值越趋近于1,模型的拟合效 果越好。 其实,借助统计数据的分析与处理,结合 回归模型的建立与应用,具有线性关系的回 归模型利用线性经验回归来构建与应用,具 有非线性关系的回归模型利用具体散点图的 变化情况选择对应的非线性经验回归来构建 与应用。在此基础上,通过回归模型的建立, 从“形”或“数”的视角对回归模型的拟合效果 进行判断与应用,使得数据分析与处理更加 接近现实模型需求,为深入预测、判断或决策 提供有效的数据支持。(责任编辑 王福华) 62 解题篇 创新题追根溯源 高考数学 2025年6月

资源预览图

剖析回归模型的建立与应用-《中学生数理化》高考数学2025年6月刊
1
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。