9.1.2 第2课时 非线性回归模型及拟合效果的判断(教用word)-【优学精讲】2025-2026学年高中数学选择性必修第二册(苏教版)
2026-05-18
|
14页
|
5人阅读
|
0人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学苏教版选择性必修 第二册 |
| 年级 | 高二 |
| 章节 | 9.1.2线性回归方程 |
| 类型 | 教案-讲义 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 558 KB |
| 发布时间 | 2026-05-18 |
| 更新时间 | 2026-05-18 |
| 作者 | 拾光树文化 |
| 品牌系列 | 优学精讲·高中同步 |
| 审核时间 | 2026-04-01 |
| 下载链接 | https://m.zxxk.com/soft/57121669.html |
| 价格 | 4.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
本讲义聚焦非线性回归模型及拟合效果判断核心知识点,从红铃虫产卵数与温度的实例切入,通过散点图观察非线性关系,系统梳理残差(残差图、残差平方和)、决定系数R²等分析方法,最终构建非线性回归方程的建立步骤,形成从数据观察到模型构建的完整学习支架。
该资料以真实案例为载体,通过散点图直观呈现数据特征培养数学眼光,借助残差分析和R²推理拟合效果发展数学思维,用变量代换建立非线性模型强化数学语言表达。题型示例与跟踪训练结合,课中辅助教师教学,课后帮助学生巩固知识、查漏补缺。
内容正文:
第2课时 非线性回归模型及拟合效果的判断
一只红铃虫的产卵数y(个)和温度x(℃)有关.现收集了7组观测数据列表如下:
温度x/℃
21
23
25
27
29
32
35
产卵数y/个
7
11
21
24
66
115
325
画出散点图如图.
【问题】 (1)温度与产卵数是正相关关系吗?散点图是否分布在某条直线附近?
(2)连接这些散点图后曲线类似于哪一种函数变换后的图象?
知识点一 残差分析
1.残差:一般地,我们将 观测值 与对应的估计值 之差 称为残差.残差是随机误差ε的估计结果.
2.残差图:以观测值为横坐标,残差为纵坐标作点,可以画出残差图.
3.残差分析:通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
知识点二 对模型刻画数据效果的分析
1.残差图法:在残差图中,如果残差点比较均匀地分布在横轴的两边,则说明回归方程较好地刻画了两个变量的关系,这样的带状区域的宽度越窄,说明模型拟合精度越高.
2.残差平方和法*:残差平方和(yi-)2越小,模型的拟合效果越好.
3.决定系数R2法*:可以用R2=1-来比较两个模型的拟合效果,R2越大,模型的拟合效果越好,R2越小,模型的拟合效果越差.
知识点三 非线性经验回归方程
1.非线性回归分析的思想
研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系.
2.非线性经验回归方程
当回归方程不是形如=x+(,∈R)时,称之为非线性经验回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性经验回归方程.
3.求非线性经验回归方程的一般步骤
1.判断正误.(正确的画“√”,错误的画“×”)
(1)残差平方和越接近0, 线性回归模型的拟合效果越好.( √ )
(2)R2越小, 线性回归模型的拟合效果越好.( × )
(3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ )
2.已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第几个( )
A.5 B.6 C.7 D.8
解析:B 原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大.
3.某校数学学习兴趣小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,由试验数据得到如图所示的散点图.由此散点图,可以得出最适宜作为发芽率y和温度x的回归模型的是( )
A.y=a+bx B.y=a+bln x
C.y=a+bex D.y=a+bx2
解析:B 由散点图可知,数据分布成递增趋势,但是呈现上凸效果,即增加越来越缓慢.A中,y=a+bx是直线型,均匀增长,不符合要求;B中,y=a+bln x是对数型,增长越来越缓慢,符合要求;C中,y=a+bex是指数型,爆炸式增长,增长越来越快,不符合要求;D中,y=a+bx2是二次函数型,图象既有上升,又有下降,不符合要求.
题型一|残差与残差分析
【例1】 某运动员训练次数x与成绩y的数据如表:
次数x
30
33
35
37
39
44
46
50
成绩y
30
34
37
39
42
46
48
51
(1)建立成绩y关于次数x的经验回归方程(结果精确到0.001);
(2)用残差分析的方法判断用线性回归模型是否合理.
参考数据:=12 656,xiyi=13 180.
解:(1)∵=39.25,=40.875,
∴==≈1.041,
=-≈0.016.
∴经验回归方程为=1.041x+0.016.
(2)某运动员训练次数与成绩之间的数据及相应的残差数据为
x
30
33
35
37
39
44
46
50
y
30
34
37
39
42
46
48
51
ε=y-
-1.246
-0.369
0.549
0.467
1.385
0.18
0.098
-1.066
残差图如图所示.
由图可知,残差比较均匀地分布在横轴的两边,说明该线性回归模型比较合理.
通性通法
1.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
2.残差是随机误差的估计值,=yi-.
【跟踪训练】
1.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
解析:A 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.
2.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+,若样本点(r,1)与(1,s)的残差相同,则有( )
A.r=s B.s=2r
C.s=-2r+3 D.s=2r+1
解析:C 样本点(r,1)的残差为1-2r-,样本点(1,s)的残差为s--2,依题意得1-2r-=s--2,故s=-2r+3.
题型二|残差平方和法*与决定系数R2法*
【例2】 已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
(1)求y关于x的经验回归方程;
(2)借助残差平方和与R2说明回归模型拟合效果的好坏.
(参考公式及数据:=,=-,=1 660,xiyi=620,(yi-)2=53.2)
解:(1)=×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
所以===-1.15,
=7.4+1.15×18=28.1,
所以所求经验回归方程是=-1.15x+28.1.
(2)列出残差表为
yi-
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以(yi-)2=0.3,且(yi-)2=53.2,
R2=1-≈0.994,
所以回归模型的拟合效果很好.
通性通法
刻画回归效果的三种方法
(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适;
(2)残差平方和法:残差平方和(yi-)2越小,模型的拟合效果越好;
(3)决定系数法:R2=1-越接近1,表明模型的拟合效果越好.
【跟踪训练】
1.一组数据(xi,yi)经过分析,提出了四种回归模型①②③④,四种模型残差平方和的值分别是1.23,0.80,0.12,1.36.则拟合效果最好的是( )
A.模型① B.模型②
C.模型③ D.模型④
解析:C 残差平方和越小则拟合效果越好,而模型③的残差平方和最小,所以C正确.故选C.
2.在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了85%的热茶销售杯数变化,而随机误差贡献了剩余的15%,所以气温对热茶销售杯数的效应比随机误差的效应大得多.
解析:由决定系数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.
题型三|求非线性经验回归方程
【例3】 某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,统计了近10年投入的年研发费用xi与年销售量yi(i=1,2,…,10)的数据,得到散点图如图所示.
(1)利用散点图判断y=a+bx和y=c·xd(其中c,d均为大于0的常数)哪一个更适合作为年销售量y和年研发费用x的回归方程类型(只要给出判断即可,不必说明理由);
(2)对数据作出如下处理,令ui=ln xi,vi=ln yi,得到相关统计量的值如下表:
vi
ui
(ui-)(vi-)
(ui-)2
15
15
28.25
56.5
根据(1)的判断结果及表中数据, 求y关于x的回归方程.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线=+u的斜率和截距的最小二乘估计分别为=,=-.
解:(1)由散点图可知,选择回归方程类型y=c·xd更适合.
(2)对y=c·xd两边取对数,得ln y=ln c+dln x,即v=ln c+du.
由表中数据求得===,
===.
令ln c=m,
则=-=-×=,即c=,
所以年销售量y与年研发费用x的回归方程为=.
通性通法
非线性回归问题的处理方法
(1)指数函数型y=ebx+a:两边取对数得ln y=ln ebx+a,即ln y=bx+a.令z=ln y,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b;
(2)对数函数型y=bln x+a:设x'=ln x,原方程可化为y=bx'+a,再根据线性回归模型的方法求出a,b;
(3)y=bx2+a型:设x'=x2,原方程可化为y=bx'+a,再根据线性回归模型的方法求出a,b.
【跟踪训练】
1.若一函数模型为y=ax2+bx+c(a≠0),将y转化为t的经验回归方程,则需做变换t=( )
A.x2 B.(x+a)2
C.(x+)2 D.以上都不对
解析:C y=ax2+bx+c=a(x+)2+(a≠0),可令t=(x+)2,则y=at+为y关于t的经验回归方程.
2.已知变量y关于x的非线性经验回归方程为y=ebx-0.5,若对y=ebx-0.5两边取自然对数,可以发现ln y与x线性相关,现有一组数据如下表所示,x=5时,预测y值为e7.5.
x
1
2
3
4
y
e
e3
e4
e6
解析:对y=ebx-0.5两边取对数,得ln y=bx-0.5,令z=ln y则z=bx-0.5,列表如下:
x
1
2
3
4
y
e
e3
e4
e6
z
1
3
4
6
==2.5,==3.5 ,代入=b-0.5得3.5=b·2.5-0.5,故b=1.6,故z=1.6x-0.5,y=e1.6x-0.5,当x=5时,y=e1.6×5-0.5=e7.5.
1.某种产品的投入x(单位:万元)与收入y(单位:万元)之间的关系如下表所示:
x/万元
2
4
5
6
8
y/万元
30
40
60
50
70
若y与x的经验回归方程为=6.5x+17.5,则相应于点(4,40)的残差为( )
A.-4.5 B.4.5
C.-3.5 D.3.5
解析:C =4×6.5+17.5=43.5,ε=40-43.5=-3.5.
2.用模型y=aebx+1(a>0)拟合一组数据时,令z=ln y,将其变换后得到经验回归方程z=2x+a,则=( )
A.e B.
C. D.2
解析:D 对y=aebx+1(a>0)两边同时取自然对数,得ln y=ln(aebx+1)=ln a+bx+1,令z=ln y,则z=bx+ln a+1,所以解得所以=2.故选D.
1.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2如下表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
则回归模型拟合效果最好的是( )
A.甲 B.乙 C.丙 D.丁
解析:A 决定系数R2越大,表示回归模型的拟合效果越好.
2.某样本点(xi,yi)(i=1,2,…,n)的经验回归方程为=0.5x+0.7,当x=8时,y的实际值为4.5,则当x=8时,预测值与实际值的差值为( )
A.0.1 B.0.2
C.0.3 D.0.4
解析:B 当x=8时,y的预测值=4.7,4.7-4.5=0.2.故选B.
3.已知变量y关于变量x的经验回归方程为=bln x+0.24,其一组数据如表所示:
x
e
e3
e4
e6
e7
y
1
2
3
4
5
若x=e10,则y的值大约为( )
A.4.94 B.5.74
C.6.81 D.8.04
解析:C 令t=ln x,则=bt+0.24.由题意得,=4.2,=3,由线性经验回归直线过样本的中心点,有b=,所以=ln x+0.24,将x=e10代入得≈6.81.故选C.
4.如图是一组实验数据的散点图,拟合方程为y=+c(x>0),令t=,则y关于t的经验回归直线过点(2,5),(12,25),则当y∈(1.01,1.02)时,x的取值范围是( )
A.(0.01,0.02) B.(50,100)
C.(0.02,0.04) D.(100,200)
解析:D 根据题意可得y=bt+c(t>0),由y关于t的经验回归直线过点(2,5),(12,25)可得:解得所以y=2t+1,由y∈(1.01,1.02)可得1.01<2t+1<1.02,所以0.005<t<0.01,所以0.005<<0.01,所以100<x<200,故选D.
5.〔多选〕某研究小组采集了5组数据,作出如图所示的散点图.若去掉D(3,10)后,下列说法正确的是( )
A.样本相关系数r变小
B.决定系数R2变大
C.残差平方和变大
D.自变量x与因变量y的相关性变强
解析:BD 根据散点图可知,去掉点D(3,10)后,y与x的线性相关性加强,且为正相关,样本相关系数r变大,则A错,D对;去掉点D(3,10)后,残差平方和变小,则R2变大,B对,C错.故选B、D.
6.〔多选〕某种商品的价格x(单位:元/kg)与日需求量y(单位:kg)之间的对应数据如下表所示:
x
10
15
20
25
30
y
11
10
8
6
5
根据表中的数据可得经验回归方程=x+14.4,则以下说法正确的是( )
A.样本相关系数r>0
B.=-0.32
C.若该商品的价格为35元/kg,则日需求量大约为3.2 kg
D.第四个样本点对应的残差为-0.4
解析:BCD 对于A、B,由题表中的数据,得==20,==8,将,代入=x+14.4得=-0.32,所以A选项说法错误,B选项说法正确;对于C,将x=35代入=-0.32x+14.4,得=3.2,所以日需求量大约为3.2 kg,所以C选项说法正确;对于D,第四个样本点对应的残差为y4-=6-(-0.32×25+14.4)=-0.4,所以D选项说法正确.故选B、C、D.
7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=ln y,求得经验回归方程为=0.25x-2.58,则该模型的回归方程为=e0.25x-2.58.
解析:由z=ln y,=0.25x-2.58,得ln =0.25x-2.58,所以=e0.25x-2.58.故该模型的回归方程为=e0.25x-2.58.
8.某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如下表所示,根据表中数据,得出y关于x的经验回归方程为=0.6x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m=4.8.
x
3
4
5
6
y
2
3
4
m
解析:∵样本(4,3)处的残差为-0.15,且y关于x的经验回归方程为=0.6x+,∴3-(0.6×4+)=-0.15,解得=0.75,故经验回归方程为=0.6x+0.75,∵==4.5,==,∴=0.6×4.5+0.75,解得m=4.8.
9.“绿水青山就是金山银山”的理念推动了新能源汽车产业的迅速发展.以下表格和散点图反映了近几年我国某新能源汽车的年销售量情况.
年份
2020
2021
2022
2023
2024
年份代码x
1
2
3
4
5
某新能源汽车
年销售量y/万辆
1.5
5.9
17.7
32.9
55.6
(1)请根据散点图判断,y=bx+a与y=cx2+d中哪一个更适宜作为年销售量y关于年份代码x的回归方程类型.(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2025年我国该新能源汽车的年销售量.(精确到0.1)
参考数据:=22.72,(wi-)2=374,(wi-)(yi-)=851.2(其中wi=).
解:(1)根据散点图可知,y=cx2+d更适宜作为年销售量y关于年份代码x的回归方程类型.
(2)令w=x2,则=w+.
易知=11,==≈2.28,
=-≈22.72-2.28×11=-2.36,
所以=2.28w-2.36,
所以y关于x的回归方程为=2.28x2-2.36.
令x=6,得=79.72≈79.7.
故预测2025年我国该新能源汽车的年销售量为79.7万辆.
10.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
若由最小二乘法计算得经验回归方程=0.29x+34.7.
(1)计算各组残差,并计算残差平方和;
(2)求R2,并说明回归模型拟合效果的好坏.
解:(1)由=xi+,可以算得=yi-.
分别为=0.35,=0.718,=-0.5,=-2.214,=1.624,
所以残差平方和为()2≈8.43.
(2)由表中数据得=43.5,(yi-)2=50.18,
故R2=1-≈1-≈0.832.
所以回归模型的拟合效果较好.
11.某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(单位:t)与相应的生产总成本y(单位:万元)的五组对照数据.
产量x/t
1
2
3
4
5
生产总成本y/万元
3
7
8
10
12
(1)根据上表数据,若用最小二乘法进行线性模拟,试求y关于x的经验回归方程=x+.
(2)记第(1)问中所求y与x的经验回归方程=x+为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的回归模型②:=x2+1.其中模型②的残差图(残差=实际值-估计值)如图所示.
请完成模型①的残差表与残差图,并根据残差图,判断哪一个模型更适宜作为y关于x的回归方程,并说明理由.
(3)根据模型①中y与x的经验回归方程,预测产量为6 t时生产总成本为多少万元.
解:(1)计算=(1+2+3+4+5)=3,
=(3+7+8+10+12)=8,
=12+22+32+42+52=55,
xiyi=1×3+2×7+3×8+4×10+5×12=141,
===2.1,
=-=8-2.1×3=1.7,
因此,经验回归方程为=2.1x+1.7.
(2)模型①的残差表为
x
1
2
3
4
5
y
3
7
8
10
12
3.8
5.9
8
10.1
12.2
-0.8
1.1
0
-0.1
-0.2
画出残差图,如图所示:
结论:模型①更适宜作为y关于x的回归方程,理由1:模型①的5个样本点的残差点落在的带状区域比模型②的带状区域更窄;
理由2:模型①的5个样本点的残差点比模型②的残差点更贴近x轴.(写出一个理由即可)
(3)根据模型①中y与x的经验回归方程,计算x=6时,=2.1×6+1.7=14.3,
所以预测产量为6吨时生产总成本为14.3万元.
1 / 2
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。