内容正文:
■江苏省淮州中学 王草野
回归模型的建立与应用是统计中综合数
据分析与数据处理的一个重要方面。统计中
的数据信息是借助线性经验回归与非线性经
验回归模型的建立来判断回归模型的拟合效
果。回归模型的建立与应用是借助回归分
析,对有相关关系的两个变量进行统计分析,
通过相关系数进行检验,进而分析并判断两
个变量是否具有线性相关关系。回归分析是
通过对散点图直观地了解两个变量的关系,
然后建立线性或非线性回归模型来评价模型
的好坏,以及判断回归模型的拟合效果等。
本文结合典型实例剖析、归纳、总结有关回归
分析问题的解题技巧与方法,引领并指导同
学们的复习与备考。
一、线性经验回归问题
线性经验回归是回归模型中考查的重点
问题之一,要求同学们能够根据已有数据获
取信息,进而判断是线性经验分析,并结合经
验回归方程的求解,进一步加以数据分析或
预测决策等。
例 1 (2024年山东省济南市高考数
学模拟试卷)随着科技的发展,网购成了人们
购物的重要选择,并对实体经济产生了一定
影响。为了解实体经济的现状,某研究机构
统计了一个大商场2019~2023年的线下销
售额,如表1所示:
表1
年份编号x 1 2 3 4 5
年份 201920202021 2022 2023
销售额y
(单位:万元)
1
5131
4651
2021
060 860
(1)结合表1中的数据,判断销售额y 与
年份编号x 之间的关系是否可以用线性回归
模型来拟合与应用,并用样本相关系数加以
分析与说明;
(2)试建立销售额y 与年份编号x 之间
的经验回归方程,并预测2025年该商场的线
下销售额。
附:r=
∑
n
i=1
xiyi -nx
y
∑
n
i=1
x2i -nx2 ∑
n
i=1
y2i -ny2
,
b̂=
∑
n
i=1
xiyi-nx
y
∑
n
i=1
x2i -nx2
,
â=y-
b̂
x,∑
5
i=1
yi=6
100,
∑
5
i=1
xiyi=16
589,
∑
5
i=1
x2i-5x2 ∑
5
i=1
y2i-5y2
≈1
736。
解析:(1)由已知数据可得,x =3,y=
∑
5
i=1
yi
5 =
6
100
5 =1
220,所以∑
5
i=1
xiyi-5x
y=
16
589-5×3×1
220=-1
711。
所以r=
∑
5
i=1
xiyi-5x
y
∑
5
i=1
x2i -5x2 ∑
5
i=1
y2i -5y2
≈-
1
711
1
736 ≈
-0.985
6。
因为|r|非常接近1,所以可用线性回
归模型拟合销售额y与年份编号x 的关系。
(2)由已知数据可得,∑
5
i=1
x2i =12+22+
32+42+52=55,所以b̂=
∑
5
i=1
xiyi -5x
y
∑
5
i=1
x2i -5x2
=
16
589-5×3×1
220
55-5×32
=-171.1,̂a=y-
b̂x=1
220-(-171.1)×3=1
733.3。
所以y 关于x 的经验回归方程为ŷ=
42
解题篇 创新题追根溯源
高考数学 2025年6月
-171.1x+1
733.3。
令x=7,得ŷ=-171.1×7+1
733.3=
535.6(万元),所以预测2025年该商场的线
下销售额为535.6万元。
点评:解决此类线性回归分析问题的基
本策略为:①利用最小二乘估计公式,借助数
学运算求出回归系数b̂;②利用经验回归直
线过样本点的中心这一基本性质,代入求解
相应的系数â;③根据系数确定写出经验回
归方程,并利用经验回归方程进行合理的预
测与决策等。
二、非线性经验回归问题
非线性经验回归是基于基本初等函数模
型(主要包括幂函数、指数函数、对数函数等)
与线性函数之间的对应关系,化非线性经验
回归为线性函数,借助数据分析与方程求解
后再加以还原处理。
例 2 (2024年黑龙江省龙西北名校
联合体高三(上)期中数学试卷)在隧道施工
过程中,若隧道拱顶下沉速率过快,无法保证
工程施工的安全性,则需及时调整支护参数。
某施工队对正在施工的某隧道工程进行下沉
量监控,通过对监控结果进行回归分析,建立
前t天隧道拱顶的累加总下沉量z(单位:毫
米)与时间t(单位:天)的经验回归方程,通过
经验回归方程预测是否需要调整支护参数。
已知该隧道拱顶下沉的实测数据如表2所示:
表2
t(单位:天) 1 2 3 4 5 6 7
z(单位:毫米)0.01 0.04 0.14 0.52 1.38 2.31 4.30
研究人员制作相应散点图,通过观察,拟
用函数z=kebt 进行拟合。令u=ln
z,计算
得∑
7
i=1
(ti -t)(ui-u)≈25.2,∑
7
i=1
(ui -u)2
≈30,u=-1.2。
(1)试建立z与t的经验回归方程,并预
测前8天该隧道拱顶的累加总下沉量;(精确
到0.1)
(2)已知拱顶在某天的下沉速率超过27
毫米/天,支护系统将超负荷,隧道有塌方风
险,施工队需要提前一天调整支护参数,试估
计最迟在第几天调整支护参数。(精确到整
数)
附:①回归直线ŷ=̂a+̂bx 中斜率和截
距 的 最 小 二 乘 估 计 公 式 分 别 为 b̂ =
∑
n
i=1
(xi -x)(yi -y)
∑
n
i=1
(xi -x)2
,̂a=y-̂bx;
② 参考数 据: 210 ≈14.5,ln
30≈
3.4,e2.4 ≈11.0。
解析:(1)由题知t=4,∑
7
i=1
(ti -t)2=28,
所以r≈
25.2
28×30
=
25.2
2 210
≈0.9。
所以可以用线性回归模型拟合u 与t的
关系,由z=kebt,则u=ln
z=bt+ln
k。
因为b̂=
∑
7
i=1
(ti -t)(ui -u)
∑
7
i=1
(ti -t)2
≈
25.2
28 =
0.9,ln
k=u-̂bx=-1.2-0.9×4=-4.8,
所以k=e-4.8,所以ẑ=e0.9t-4.8。
当t=8
时,̂z=e0.9×8-4.8=e2.4≈11.0(毫
米),所以预测前8天该隧道拱顶的累加总下
沉量约为11.0毫米。
(2)由(1)知ẑ=e0.9t-4.8,则下沉速率为
ẑ'=0.9e0.9t-4.8。
设第n天的下沉速率超过27毫米/天,
则0.9e0.9n-4.8>27,即e0.9n-4.8>30,即0.9n-
4.8>ln
30,即0.9n>3.4+4.8,即n>9.1。
所以第10天该隧道拱顶的下沉速率超
过27毫米/天,最迟在第9天需调整支护参
数,才能避免塌方。
点评:解决此类非线性回归分析问题时,
需要根据题设已知数据所对应的散点图的趋
势变化情况,联系各种基本初等函数的图像
加以分析与对比,合理进行拟合与比较,借助
变量的代换与转化进行线性回归分析。具体
的解题步骤一般为:①根据原始数据信息,作
出对应的散点图;②根据散点图的大体变化
趋势特征,选择恰当的拟合函数;③借助恰当
的变换,将非线性函数转化为线性函数,求出
相应的经验回归方程;④通过对应的变换与
还原,即可得到对应的非线性回归方程。
52
解题篇 创新题追根溯源
高考数学 2025年6月
三、回归模型的拟合效果
回归模拟的拟合效果可以从几何与代数
两个不同视角加以分析,几何直观层面可以
从残差图进行直观分析,代数运算层面可以
从系数法进行数学运算等,进而科学分析并
判断拟合效果,为预测或决策提供依据。
例 3 (2024年四川省泸州市泸县四
中高考数学适应性试卷)某科技公司积极响
应国家政策,加大高科技研发投入,现对近十
年来高科技研发投入情况分析调研,统计了
近十年的研发投入y(单位:亿元)与年份代
码x 共10组数据,其中年份代码x=1,2,
…,10,分别指2014年,2015年,…,2023年。
现用模型:①y=bx+a,②y=d x+c分别
图1
进行拟合,结合
与之对应的经验
回归方程,借助
残差分析得到对
应的残差图(图
1)。
根据收集到的数据,计算得y=75,t=
2.25,∑
10
i=1
(xi -x)2 =82.5,∑
10
i=1
(ti -t)2 =
4.5,∑
10
i=1
(yi -y)(xi -x)=121.4,∑
10
i=1
(yi -
y)(ti -t)=28.82,其 中ti = xi,t=
1
10∑
10
i=1
ti。
(1)根据以上两种模型的残差图,比较模
型①和模型②的拟合效果,应作何选择,并给
出相应的理由说明。
(2)根据(1)中所选模型及其应用,求出
y 关于x 的经验回归方程;根据该模型,求该
公司2029年高科技研发投入y 的预测值。
(回归系数精确到0.01)
附:对于一组具有线性相关关系的数据
(x1,y1),(x2,y2),…,(xn,yn),其回归直线
ŷ=̂a+̂bx 的斜率和截距的最小二乘估计公式分
别为̂b=
∑
n
i=1
(xi -x)(yi -y)
∑
n
i=1
(xi -x)2
,̂a=y-̂bx。
解析:(1)应该选择模型②。
由于模型②对应的残差点比模型①对应
的残差点更加均匀地落在水平的带状区域
中,因此模型②对应的经验回归方程的预报
精度相比模型①会更高。
(2)根据模型②,令t= x,研发投入y
与t
可用线性回归模型来拟合,有ŷ=̂dt+̂c。
由d̂ =
∑
10
i=1
(yi -y)(ti -t)
∑
10
i=1
(ti -t)2
=
28.82
4.5 ≈
6.40,可得ĉ=y-̂dt=75-
28.82
4.5 ×2.25=
60.59,则y
关于t
的经验回归方程为ŷ=
6.40t+60.59。
所以y 关于x 的经验回归方程为ŷ=
6.40 x+60.59。
2029年,即当x=16
时,̂y=6.40 16
+60.59=86.19(亿元)。
所以该公司2029年高科技研发投入y
的预测值为86.19亿元。
点评:对于此类判断回归模型的拟合效
果问题,具体的判断技巧与方法主要有以下
两种:(1)残差分析法:作出残差图,观察残差
点所在的水平带状区域,带状区域的宽度越
窄,说明模型拟合精度越高。(2)决定系数
法:R2 =1 -
∑
n
i=1
(yi -̂yi)2
∑
n
i=1
(yi -y)2
, 其 中 y =
1
n∑
n
i=1
yi。R2 的值越趋近于1,模型的拟合效
果越好。
其实,借助统计数据的分析与处理,结合
回归模型的建立与应用,具有线性关系的回
归模型利用线性经验回归来构建与应用,具
有非线性关系的回归模型利用具体散点图的
变化情况选择对应的非线性经验回归来构建
与应用。在此基础上,通过回归模型的建立,
从“形”或“数”的视角对回归模型的拟合效果
进行判断与应用,使得数据分析与处理更加
接近现实模型需求,为深入预测、判断或决策
提供有效的数据支持。(责任编辑 王福华)
62
解题篇 创新题追根溯源
高考数学 2025年6月