8.2 第2课时 回归分析及非线性回归模型(Word教参)-【学霸笔记·同步精讲】2024-2025学年高中数学选择性必修第三册(人教A版)

2026-01-27
| 14页
| 45人阅读
| 3人下载
教辅
高智传媒科技中心
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版选择性必修第三册
年级 高二
章节 8.2 一元线性回归模型及其应用
类型 教案-讲义
知识点 -
使用场景 同步教学-新授课
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 DOCX
文件大小 408 KB
发布时间 2026-01-27
更新时间 2026-01-27
作者 高智传媒科技中心
品牌系列 学霸笔记·高中同步精讲
审核时间 2026-01-27
下载链接 https://m.zxxk.com/soft/56151875.html
价格 2.00储值(1储值=1元)
来源 学科网

摘要:

本讲义聚焦回归分析及非线性回归模型核心知识点,从线性回归预测误差引入残差概念,通过残差图分析拟合效果,再到非线性模型的变量代换转化,最后用残差平方和与R²量化评估,构建完整学习支架。 资料以父亲儿子身高、茶水温度等实例驱动,通过思考问题引导学生用数学眼光发现变量关系,借助变量代换培养数学思维,用残差图和R²训练数学语言表达。课中例题与跟踪训练助力教师高效授课,课后练习题与总结帮助学生查漏补缺,强化知识应用。

内容正文:

第2课时 回归分析及非线性回归模型 学习目标 1.结合实例,了解随机误差、残差、残差图的概念. 2.对回归模型会进行残差分析. 3.了解非线性回归模型的基本思想方法,能转化为一元线性回归模型解决实际问题. 4.能利用R2判断回归模型的拟合效果. 思考1 对于教材P105表8.2-1中的数据,由最小二乘法得儿子身高y关于父亲身高x的经验回归方程为=0.839x+28.957,那么当x=172时,=0.839×172+28.957=173.265(cm),如果一位父亲的身高为172 cm,他儿子长大成人后的身高一定是173 cm吗?为什么? 提示:不一定,因为还有其他影响他儿子身高的因素,父亲的身高不能完全决定儿子的身高. 思考2 对于教材P105表8.2-1中的第6个数据,我们发现当父亲身高为172 cm时,儿子的身高实际为176 cm,实际身高与预测的身高相差了多少? 提示:176-173.265=2.735(cm). 思考3 只要给出一组成对样本数据,利用最小二乘法就可求出经验回归方程吗? 提示:不一定,成对样本数据除了线性相关,还有非线性相关. 一 残差及残差分析 1.残差的概念 对于响应变量Y,通过观测得到的数据称为____________,通过经验回归方程得到的称为____________,观测值减去预测值所得的差称为________.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为____________. 2.残差分析 作图时__________为残差,____________可以选为样本编号,或身高数据等,这样作出的图形称为残差图.若残差点比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,带状区域越窄,则说明拟合效果越好. [答案自填] 观测值 预测值 残差 残差分析 纵坐标 横坐标  (1)下列四幅残差分析图中,与一元线性回归模型拟合精度最高的是(  ) (2)已知变量x和y的统计数据如下表: x -2 -1 0 1 2 y 5 ? 2 2 1 由表中的数据得到经验回归方程=-x+2.6,那么当x=-1时残差为________.(注:残差=观测值-预测值) 【解析】 (1)用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高,显然D选项的拟合精度最高.故选D. (2)由题表知,==0,则=-+2.6=2.6,因此x=-1时的观测值为5-(5+2+2+1)=3,而x=-1时的预测值为-(-1)+2.6=3.6,所以当x=-1时残差为3-3.6=-0.6. 【答案】 (1)D (2)-0.6 (1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预测精度越高. (2)残差是随机误差的估计值,i=yi-i. [跟踪训练1] (1)已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第(  ) A.4个 B.5个 C.6个 D.7个 解析:选C.原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大. (2)某工厂为研究某种产品的产量x(单位:吨)与所需某种原材料的质量y(单位:吨)的相关性,在生产过程中收集4组对应数据(x,y),如表所示.(残差=观测值-预测值) x 3 4 5 6 y 2.5 3 4 m 根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为________. 解析:由题意可得x=4时的预测值为3-(-0.15)=3.15, 则有3.15=0.7×4+,所以=0.35,即=0.7x+0.35, 又==4.5, ==, 故=0.7×4.5+0.35, 所以m=4.5. 答案:4.5 二 非线性经验回归方程 1.非线性回归分析的思想 研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系. 2.非线性经验回归方程 当回归方程不是形如=x+(,∈R)时,称之为非线性经验回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性经验回归方程.  (对接教材P115问题)中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:℃)关于时间x(单位:min)的回归模型,通过实验收集在25 ℃室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据及相应散点图,并对数据做初步处理,如下表: (xi-)(yi-) (xi-)(wi-) 73.5 3.85 -95 -2.24 表中:wi=ln (yi-25),=i, 假如该茶水温度y关于时间x的回归方程为y=d·cx+25,请求出此回归方程. 附:(1)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=+x的斜率和截距的最小二乘估计分别为=,=-; (2)参考数据:e-0.08≈0.92,e4.09≈60. 【解】 由y=d·cx+25,得y-25=d·cx,两边取自然对数,得ln (y-25)=ln d+x ln c,令w=ln (y-25),则w=ln d+x ln c, =i==3,(xi-)2=(-3)2+(-2)2+(-1)2+12+22+32=28,结合题表数据, 得ln c===-0.08, 结合参考数据可得c=e-0.08≈0.92,由ln d=-ln c=3.85-3×(-0.08)=4.09,得d=e4.09≈60, 所以茶水温度y关于时间x的回归方程为=60×0.92x+25. 解决非线性回归问题的方法及步骤 [跟踪训练2] (1)如图是一组实验数据的散点图,拟合方程y=+c(x>0),令t=,则y关于t的经验回归直线过点(2,5),(12,25),则当y∈(1.01,1.02)时,x的取值范围是(  ) A.(0.01,0.02)      B.(50,100) C.(0.02,0.04) D.(100,200) 解析:选D.根据题意可得y=bt+c(t>0),由y关于t的经验回归直线过点(2,5),(12,25)可得解得 所以y=2t+1,由y∈(1.01,1.02)可得1.01<2t+1<1.02, 所以0.005<t<0.01,所以0.005<<0.01,所以100<x<200.故选D. (2)已知变量y关于x的回归方程为=ebx-0.5,若对=ebx-0.5两边取自然对数,可以发现ln 与x线性相关,现有一组数据如下表所示,当x=5时,预测的值为________. x 1 2 3 4 y e e3 e4 e6 解析:对=ebx-0.5两边取对数, 得ln =bx-0.5令z=ln =bx-0.5,则 x 1 2 3 4 y e e3 e4 e6 z 1 3 4 6 ==2.5,==3.5,代入= -0.5得3.5=·2.5-0.5, 故=1.6,故z=1.6x-0.5,=e1.6x-0.5.  当x=5时,=e1.6×5-0.5=e7.5. 答案:e7.5 三 残差平方和与决定系数R2 1.残差平方和法 残差平方和(yi-i)2________,模型的拟合效果越好,残差平方和________,模型的拟合效果越差. 2.利用决定系数R2刻画回归效果 R2=1-,R2越______,模型的拟合效果越好;R2越______,模型的拟合效果越差. [答案自填] 越小 越大 大 小  已知某种汽车新购入价格为14万元,但随着使用年限增加汽车会贬值.通过调查发现使用年限 x(单位:年)与出售价y(单位:万元)之间的关系有如下一组数据: x 1 2 4 8 10 y 12 10 7 6 5 (1)求y关于x的经验回归方程; (2)已知R2=1-,当R2≥0.9时,经验回归方程的拟合效果非常好;当0.8<R2<0.9时,经验回归方程的拟合效果良好.试问该经验回归方程的拟合效果是非常好还是良好?说明你的理由.(结果保留三位小数) (附:用最小二乘法求经验回归方程=x+的系数公式==;=-) 【解】 (1)由题意,得=×(1+2+4+8+10)=5,=×(12+10+7+6+5)=8, iyi-5=1×12+2×10+4×7+8×6+10×5-200=-42, (xi-)2=(1-5)2+(2-5)2+(4-5)2+(8-5)2+(10-5)2=60, ===-0.7, 则=-=8+0.7×5=11.5, 所以y关于x的经验回归方程是=-0.7x+11.5. (2)列出残差表: xi 1 2 4 8 10 yi 12 10 7 6 5 i 10.8 10.1 8.7 5.9 4.5 yi-i 1.2 -0.1 -1.7 0.1 0.5 yi- 4 2 -1 -2 -3 所以(yi-i)2=1.22+(-0.1)2+(-1.7)2+0.12+0.52=4.6,(yi-)2=42+22+(-1)2+(-2)2+(-3)2=34, 所以R2=1-=1-≈0.865,则0.8<R2<0.9,所以该经验回归方程的拟合效果良好. (1)回归模型拟合效果的好坏可以通过计算决定系数R2来判断,其值越大,说明拟合效果越好. (2)在含有一个解释变量的线性回归模型中,决定系数R2恰好等于样本相关系数r的平方.在线性回归模型中有0≤R2≤1,因此R2和两个变量的样本相关系数r都能刻画用线性回归模型拟合数据的效果.|r|越大,R2就越大,线性回归模型拟合数据的效果就越好. [跟踪训练3] (1)通过对两个具有线性相关关系的变量x和y,利用两组不同的统计数据建立了模型:①=7.5x+2;②=6.8x+2.5.对这两个模型进行了残差分析发现:第①个线性回归模型比第②个线性回归模型拟合效果好.若用R,R,Q1,Q2分别表示模型①与模型②的决定系数与残差平方和,则下列结论正确的是(  ) A.R>R,Q1<Q2 B.R>R,Q1>Q2 C.R<R,Q1<Q2 D.R<R,Q1>Q2 解析:选A.用决定系数R2的值判断模型的拟合效果,R2越大,说明残差平方和越小,模型的拟合效果越好,因为第①个线性回归模型比第②个线性回归模型拟合效果好,所以R>R,Q1<Q2.故选A. (2)甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和(yi-i)2如下表: 甲 乙 丙 丁 散点图 残差平方和 115 106 124 103 则试验结果体现拟合A,B两变量关系的模型拟合精度最高的同学是________. 解析:对于已经获取的样本数据,R2表达式中(yi-i)2为确定的数,则残差平方和越小,R2越大,由此知丁同学的回归模型的拟合精度最高. 答案:丁 1.为研究某航空公司最近一段时间的正点率,用模型①和模型②模拟正点率y(单位:%)与时间x(x的取值为5,10,15,20,25,30天)的回归关系:模型①y=a+bx,模型②y=ec+dx,设两模型的决定系数依次为R和R.若两模型的残差图分别如下图所示,则(  ) A.R<R       B.R=R C.R>R       D.R,R关系不能确定 解析:选A.根据题图知,模型②残差点比较均匀地落在水平的带状区域中,带状区域宽度窄,拟合精度较高,所以R<R.故选A. 2.(多选)(教材P116思考改编)某研究小组采集了5组数据,作出如图所示的散点图.若去掉D(3,10)后,下列说法正确的是(  ) A.样本相关系数r变小 B.决定系数R2变大 C.残差平方和变大 D.解释变量x与响应变量y的线性相关程度变强 解析:选BD.根据题图可知,去掉点D(3,10)后,y与x的线性相关程度加强,且为正相关,样本相关系数r变大,则A错误,D正确;去掉点D(3,10)后,残差平方和变小,则R2变大,B正确,C错误.故选BD. 3.已知变量x和y的统计数据如下表: x 6 7 8 9 10 y 3.5 4 5 6 6.5 若由表中数据得到经验回归方程为=0.8x+,则当x=10时的残差为________. 解析:==8,==5,故5=0.8×8+,解得=-1.4,则当x=10时,=0.8×10-1.4=6.6,故残差为6.5-6.6=-0.1. 答案:-0.1 4.(教材P120练习T2改编)数据显示,近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模保持稳定增长,下表为2018-2023年某市夜间经济的市场发展规模(单位:亿元),其中2018-2023年对应的年份代码依次为1~6. 年份代码x 1 2 3 4 5 6 某市夜间经济的市场发展规模y/亿元 20.5 22.9 26.4 30.9 36.4 42.4 (1)已知可用函数模型y=a·bx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.001); (2)现用(1)中求得的回归方程预测2025年该市夜间经济的市场规模. 参考数据: ivi e2.848 e0.148 1.167 1.168 3.366 73.282 17.25 1.16 2.83 3.28 其中vi=ln yi. 参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为=,=-. 解:(1)将y=a·bx的等号左右两边同时取自然对数得ln y=ln (a·bx)=ln a+x ln b, 所以v=ln a+x ln b. ==3.5, 而=12+22+32+42+52+62=91, 所以== = =≈0.148, ln ≈3.366-0.148×3.5=2.848. 所以=2.848+0.148x, 即ln =2.848+0.148x, 所以=e2.848+0.148x=17.25×1.16x. (2)2025年对应的年份代码为8, 当x=8时,=17.25×1.168≈17.25×3.28=56.58(亿元), 即2025年该市夜间经济的市场规模约为56.58亿元. 1.已学习:(1)残差的概念与残差图;(2)残差平方和及决定系数R2;(3)非线性经验回归方程. 2.须贯通:回归分析时,必须先画散点图,确定两个变量是否有关系,有什么样的关系,然后确定是哪种回归模型才能进一步求解. 3.应注意:混淆残差图法、残差平方和法和R2法的概念,导致刻画回归效果出错. 学科网(北京)股份有限公司 $

资源预览图

8.2 第2课时 回归分析及非线性回归模型(Word教参)-【学霸笔记·同步精讲】2024-2025学年高中数学选择性必修第三册(人教A版)
1
8.2 第2课时 回归分析及非线性回归模型(Word教参)-【学霸笔记·同步精讲】2024-2025学年高中数学选择性必修第三册(人教A版)
2
8.2 第2课时 回归分析及非线性回归模型(Word教参)-【学霸笔记·同步精讲】2024-2025学年高中数学选择性必修第三册(人教A版)
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。