8.2 第2课时 回归分析及非线性回归模型(Word教参)-【学霸笔记·同步精讲】2025-2026学年高中数学选择性必修第三册(人教A版)
2026-05-01
|
10页
|
48人阅读
|
4人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.2 一元线性回归模型及其应用 |
| 类型 | 教案-讲义 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 810 KB |
| 发布时间 | 2026-05-01 |
| 更新时间 | 2026-05-01 |
| 作者 | 高智传媒科技中心 |
| 品牌系列 | 学霸笔记·高中同步精讲 |
| 审核时间 | 2026-04-01 |
| 下载链接 | https://m.zxxk.com/soft/57119106.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
本高中数学讲义聚焦回归分析及非线性回归模型核心知识点,系统梳理残差及残差分析、残差平方和与决定系数R²、非线性回归模型转化等内容,构建从线性回归模型评估到非线性模型处理的完整学习支架。
该资料以问题链引导学生用数学眼光观察数据关系,通过毛绒玩具质量分析、扫码支付人次预测等实例培养数学思维,借助残差图、R²等数学语言表达拟合效果。课中例题与跟踪训练助力教师高效授课,课后练习题与知识梳理帮助学生查漏补缺,提升数据分析与模型应用能力。
内容正文:
第2课时 回归分析及非线性回归模型
一 残差及残差分析
已知具有相关关系的两个变量的经验回归方程为=x+.
思考1 预测值与观测值y一定一样吗?
提示:不一定.
思考2 预测值与观测值y之间误差大了好还是小了好?
提示:越小越好.
思考3 对于响应变量Y的观测值yi与预测值i,定义残差i=yi-i.若|i|比较小,回归模型拟合的精度有什么特点?
提示:拟合精度越高,回归模型越好.
[知识梳理]
1.残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值所得的差称为残差.
2.残差分析:残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
3.残差图与拟合效果的关系:在残图中,若残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,则带状区域越窄,说明拟合效果越好.
[例1] (1)对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
(2)色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品并将测得的数据列于表中.已知该产品的色度y和色差x之间满足线性相关关系,且=0.8x+,现有一对测量数据为(30,m),若该数据的残差为0.6,则m=( )
色差x
21
23
25
27
色度y
15
18
19
20
A.23.4 B.23.6
C.23.8 D.24.0
【解析】 (1)用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.
(2)由题意可知,==24,==18,将(24,18)代入=0.8x+,即18=0.8×24+,解得=-1.2,所以=0.8x-1.2,当x=30时,=0.8×30-1.2=22.8,则m=22.8+0.6=23.4.
【答案】 (1)A (2)A
(1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预测精度越高.
(2)残差是随机误差的估计值,即i=yi-i.
[跟踪训练1] 某工厂为研究某种产品的产量x(单位:吨)与所需某种原材料的质量y(单位:吨)的相关性,在生产过程中收集5组对应数据(x,y),如下表所示.
x
3
4
5
6
7
y
4.0
2.5
-0.5
0.5
m
根据表中数据,得出y关于x的经验回归方程为=-1.4x+.据此计算出在样本(4,2.5)处的残差为-0.5,则表中m的值为( )
A.1.5 B.1.2
C.-1.2 D.-1.5
解析:选A.因为在样本(4,2.5)处的残差为-0.5,即y-=2.5-(-1.4×4+)=-0.5,所以=8.6,所以经验回归方程为=-1.4x+8.6,
因为==5,
==,
因为样本点的中心(,)在经验回归直线上,所以=-1.4×5+8.6,解得m=1.5.
二 残差平方和与决定系数R2
[知识梳理]
1.残差平方和法
残差平方和(yi-i)2越小,模型的拟合效果越好,残差平方和越大,模型的拟合效果越差.
2.利用决定系数R2刻画回归效果
R2=1-,R2越大,模型的拟合效果越好;R2越小,模型的拟合效果越差.
[例2] 已知某商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
(1)求y关于x的经验回归方程=x+;
(2)借助残差平方和与R2说明回归模型拟合效果的好坏.
参考公式及数据:=,
=-,=1 660,iyi=620,(yi-)2=53.2.
【解】 (1)=×(14+16+18+20+22)=18,
=×(12+10+7+5+3)=7.4,
所以===-1.15,
=7.4+1.15×18=28.1,
所以所求经验回归方程是=-1.15x+28.1.
(2)列出残差表为:
yi-i
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以(yi-i)2=0.3,且(yi-)2=53.2,
所以回归模型的拟合效果很好。
判断回归模型拟合效果的三种方法
(1)残差图法:残差点比较均匀地落在水平的带状区域内,带状区域越窄,模型的拟合效果越好.
(2)残差平方和法:残差平方和越小,模型的拟合效果越好.
(3)决定系数法:R2越接近1,模型的拟合效果越好.
[跟踪训练2] 如图,5个样本数据,去掉D(3,10)后,下列说法错误的是( )
A.样本相关系数r变大
B.决定系数R2变大
C.残差平方和变大
D.解释变量x与响应变量y的相关程度变强
解析:选C.由散点图知,去掉离群点D后,x与y的线性相关程度变强,且为正相关,所以样本相关系数r的值变大,故A正确;决定系数R2的值变大,残差平方和变小,故B正确,C错误;解释变量x与响应变量y的相关程度变强,故D正确.
应用点 非线性经验回归方程
[例3] 某公交公司推出扫码支付优惠乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次(单位:十人次),用x表示推出的天数,y表示每天使用扫码支付的人次,统计数据如下表:
x
1
2
3
4
5
6
7
y
6
11
21
34
66
101
196
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内,y=bx+a与y=c·dx(c,d均为大于零的常数)哪一个更适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,求y关于x的经验回归方程,并预测活动推出后第8天使用扫码支付的人次.
参考数据:
iyi
ivi
100.54
62.14
1.54
2 535
50.12
3.47
其中vi=lg yi,=i.
【解】 (1)根据题中散点图可判定y=c·dx更适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程模型.
(2)y=c·dx两边同时取常用对数得lg y=lg (c·dx)=lg c+x lg d.
因为lg y=v,设m=lg c,n=lg d,
所以v=m+nx.
由题易知=4,=1.54,=140,
所以====0.25,
=-=1.54-0.25×4=0.54,
所以lg =0.54+0.25x.
所以y关于x的经验回归方程为
=100.54+0.25x=100.54×100.25x≈3.47×100.25x.
把x=8代入,得≈3.47×102=347.
故预测活动推出后第8天使用扫码支付的人次为3 470.
解决非线性回归问题的方法及步骤
[跟踪训练3] 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:吨)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)的数据进行了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)·(yi-)
(wi-)·(yi-)
46.6
563
6.8
289.8
1.6
1 469
108.8
表中wi=,=i.
(1)根据散点图判断y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归模型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程.
解:(1)根据题中散点图判断y=c+d适宜作为年销售量y关于年宣传费x的回归模型.
(2)因为w=,所以y=c+dw,
由题表可知==68,
=-=100.6,
所以y关于x的经验回归方程为=100.6+68.
1.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的R2如下,其中拟合效果最好的模型是( )
模型
模型1
模型2
模型3
模型4
R2
0.98
0.80
0.50
0.25
A.模型1 B.模型2
C.模型3 D.模型4
解析:选A.决定系数R2=0.98最大,拟合效果最好.
2.(多选)关于残差图的描述正确的是( )
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或响应变量
C.残差点分布的带状区域的宽度越窄R2越小
D.残差点分布的带状区域的宽度越窄残差平方和越小
解析:选ABD.残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,R2的值越大,C错误,其余正确.
3.两个线性相关变量x与y的统计数据如表所示:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其经验回归方程是=x+40,则相对应于点(11,5)的残差为________.
解析:由于经验回归直线=x+40过样本点的中心(10,8),
所以8=10 +40,则=-3.2,
因此=-3.2x+40.
当x=11时,=-3.2×11+40=4.8,
所以残差为5-=5-4.8=0.2.
答案:0.2
4.已知y关于x的经验回归方程为=2x+1,且试验中的三组数据是(2,5.1),(3,6.9),(4,8.9),则由这三组数据得到的残差平方和为________.
解析:当x=2时,=5,当x=3时,=7,当x=4时,=9,所以残差平方和为(5.1-5)2+(6.9-7)2+(8.9-9)2=0.03.
答案:0.03
1.已学习:(1)残差的概念与残差图;(2)残差平方和及决定系数R2;(3)非线性经验回归方程.
2.须贯通:回归分析时,必须先画散点图,确定两个变量是否有关系,有什么样的关系,然后确定是哪种回归模型才能进一步求解.
3.应注意:混淆残差图法、残差平方和法和R2法的概念,导致刻画回归效果出错.
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。