内容正文:
课程基本信息
学科
数学
年级
高二
学期
春季
课题
一元线性回归模型参数的最小二乘估计(第2课时)
教科书
书 名:选择性必修第三册教材
出版社:人民教育出版社 出版日期:2020年3月
教学目标
1.进一步掌握一元线性回归模型参数的统计意义,会用相关统计软件.
2.了解非线性回归模型.
3.会通过分析残差和利用R2判断回归模型的拟合效果.
教学内容
教学重点:一元线性回归模型的含义。最小二乘估计的原理与方法。残差分析。
教学难点:一元线性回归模型参数最小二乘估计的推导,解释预测值的含义。理解刻画模型拟合效果的指标。
教学过程
(一)教材分析
1. 教材来源 本节课选自《2019人教A版高中数学选择性必修第三册》,第八章《成对数据的统计相关性》
2. 地位与作用 建立一元线性回归模型过程中,方程的建立、参数的估计、模型有效性分析等都是培养学生数据分析、数学建模、逻辑推理、数学抽象的重要素材,也是加强学生“四基”,提高“四能”的重要内容。
(二)学情分析
1.认知基础:通过散点图判断成对数据的相关性已经很熟练。
2.认知障碍:线性回归模型中随机误差的假设、最小二乘原理和方法等存在理解困难。
(三)教学目标
1. 知识目标:.通过用教学方法刻画散点与直线接近的程度,体会一元线性回归模型参数的最小二乘估计原理
2. 能力目标:通过对残差和残差图分析,用残差判断一元线性回归模型的有效性,发展数据分析能力
3. 素养目标:培养学生数学运算与数据分析素养
新知探究
在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要运用散点图选择适当的函数模型来拟合观测数据,然后通过适当的变量代换,把非线性问题转化为线性问题,从而确定未知参数,建立相应的线性回归方程.
问题 具有相关关系的两个变量的线性回归方程为=x+.预测值与真实值y一样吗?预测值与真实值y之间误差大了好还是小了好?
提示 不一定;越小越好.
1.残差的概念
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
2.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(2)残差平方和法
残差平方和 (yi-i)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(3)利用R2刻画回归效果
决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
R2=1-,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
拓展深化
[微判断]
1.残差平方和越接近0, 线性回归模型的拟合效果越好.(√)
2.在画两个变量的散点图时, 响应变量在x轴上,解释变量在y轴上.(×)
提示 在画两个变量的散点图时, 响应变量在y轴上,解释变量在x轴上.
3.R2越小, 线性回归模型的拟合效果越好.(×)
提示 R2越大, 线性回归模型的拟合效果越好.
[微训练]
1.在残差分析中, 残差图的纵坐标为__________.
答案 残差
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2分别如下表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好?
解 R2越大,表示回归模型的拟合效果越好,故甲同学建立的回归模型拟合效果最好.
[微思考]
在使用经验回归方程进行预测时,需要注意哪些问题?
提示 (1)经验回归方程只适用于所研究的样本的总体;(2)所建立的经验回归方程一般都有时效性;(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果好,超出这个范围越远,预报的效果越差;(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.
题型一 线性回归分析
【例1】 已知某种商品的价格x(单位:元/件)与需求量y(单位:件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.
解 =(14+16+18+20+22)=18,
=(12+10+7+5+3)=7.4,
x=142+162+182+202+222=1 660,
xi yi=14×12+1