8.2.2 一元线性回归模型参数的最小二乘估计 课件-2025-2026学年高二下学期数学人教A版选择性必修第三册
2026-06-23
|
35页
|
170人阅读
|
0人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.2.2 一元线性回归模型参数的最小二乘估计 |
| 类型 | 课件 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 5.92 MB |
| 发布时间 | 2026-06-23 |
| 更新时间 | 2026-06-23 |
| 作者 | xkw_085046600 |
| 品牌系列 | - |
| 审核时间 | 2026-06-23 |
| 下载链接 | https://m.zxxk.com/soft/58466517.html |
| 价格 | 2.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学课件聚焦一元线性回归模型参数的最小二乘估计,先复习回归模型概念,通过问题链引导学生从直观接近度思考过渡到残差平方和,再推导最小二乘法公式,构建知识支架。
其亮点是以问题驱动培养数学眼光,通过残差分析和决定系数R²发展数学思维,结合体重与身高关系等典例用数据表达现实问题。学生提升建模与分析能力,教师获得系统教学资源。
内容正文:
8.2.2 一元线性回归模型参数的最小二乘估计
第八章 成对数据的统计分析
作者编号:32100
1
复习回顾
Y 称为因变量或响应变量;
x 称为自变量或解释变量
e 是 Y 与 bx+a 之间的随机误差;
a 称为截距参数,
b 称为斜率参数
一元线性回归模型: 各个参数分别表示什么?
作者编号:32100
新知学习
与函数模型不同,回归模型的参数一般是无法精确求出的,只能通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.
问题1 为了研究两个变量之间的相关关系,我们建立了一元线性回归模型表达式
刻画的是变量 Y 与变量 x 之间的线性相关关系,其中参数 a 和 b 未知,
作者编号:32100
新知学习
问题2:该怎样寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”?
(1)
(2)
(3)
与直线距离和最小
直线两侧点数量相等
求斜率、截距平均数
比较难操作,需另辟蹊径.
作者编号:32100
新知学习
设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),
…,(xn,yn)
由 yi=bxi+a+ei,得|yi-(bxi+a)|=|ei|.
显然|ei|越小,表示点(xi,yi)与点(xi,bxi+a)的“距离”越小,即样本数据点离直线y=bx+a的竖直距离越小.
特别地,当ei=0时,表示点(xi,yi)
在这条直线上.
y=bx+a
作者编号:32100
新知学习
因此,可以用 来刻画各样本观测数据与直线 y=bx+a的整体接近程度.
残差平方和:
求a,b的值,使Q(a,b)最小
作者编号:32100
概念生成
我们将 称为 Y 关于 x 的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中求参数,的公式:
这种求经验回归方程的方法叫最小二乘法.
作者编号:32100
新知学习
经验回归直线的性质
② >0时,y 与 x 正相关, <0时,y 与 x负相关;
③方程中的表示:x 每增加 1 个单位,y平均增加(>0)或减少(<0)
|b|个单位.
① 经验回归方程一定过样本的中心点 .
、都是估计值;
⑤利用经验回归方程可以预测在 x 取某值时,y 的估计值.
作者编号:32100
新知学习
思考1 当 x=176 时, ,
根据经验回归方程 ,
如果一位父亲身高为176cm,他儿子长大后身高一定能长到177cm吗?
儿子的身高不一定会是177cm. 这是因为还有其他影响儿子身高的因素,
回归模型中的随机误差清楚地表达了这种影响,父亲的身高不能完全决定儿子的身高,不过我们可以作出推测,当父亲的身高为176cm时,儿子身高一般在177cm左右.
作者编号:32100
新知学习
思考2
经验回归方程 中0.839的实际意义是什么?
斜率0.839可以解释为:父亲身高每增加1 cm,其儿子身高平均增加0.839 cm.
思考3 根据方程,父亲身高为多少时,儿子的平均身高和父亲的一样?
通过经验回归方程=0.839x+28.957,令=x,得x≈179.733,即当父亲身高为179.733cm左右时,儿子的平均身高与父亲一样.
作者编号:32100
新知学习
思考4 高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?
高个子父亲有生高个子儿子的趋势,但一群高个子父亲的儿子们的平均身高要低于父亲们的平均身高,例如:x=187 cm时,=185.850cm;
矮个子父亲有生矮个子儿子的趋势,但一群矮个子父亲的儿子们的平均身高要高于父亲们的平均身高,例如:x=167 cm时,=169.070cm。
儿子身高有向平均身高回归的趋势
作者编号:32100
新知学习
英国著名统计学家高尔顿把这种后代的身高向中间值靠近的趋势称为“回归现象”。后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.
一元线性回归模型中“回归”的含义:
作者编号:32100
典例剖析
例1 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中正确的是( )(多选)
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心( )
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
ABC
变式训练
练习1 已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为( )
A. =1.5x+2 B. =-1.5x+2
C. =1.5x-2 D. =-1.5x-2
B
典例剖析
例2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x 6 8 10 12
y 2 3 5 6
(1)请画出上表数据的散点图;
解析:
(1)作出散点图如图所示.
典例剖析
x 6 8 10 12
y 2 3 5 6
(2)请根据右表提供的数据,用最小
二乘法求出y关于x的经验回归方程;
(2)由题知, , ,
则
故所求的经验回归方程为
解析:
典例剖析
例2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x 6 8 10 12
y 2 3 5 6
(3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力.
解析:
(3)由(2)中的经验回归方程 知,
当x=9时,
故预测记忆力为 9 的同学的判断力为 4
方法归纳
(1)作出散点图,从直观上分析数据间是否存在线性相关关系;
(4)写出经验回归方程并对实际问题作出估计.
求经验回归方程的基本步骤
(2)计算: , , ;
(3)代入公式求出 中参数 的值;
作者编号:32100
变式训练
练习2 某单位为了了解用电量 y (单位:度)与气温 x (单位:°C )之间的关系,随机统计了4天的用电量与当天气温,并制作了如右对照表.
气温x(°C ) 18 13 10 -1
用电量y (度) 24 34 38 64
由表中数据得经验回归方程 中的 ,预测当气温为-4°C 时,用电量约为_____度.
68
解析:
由表中数据可得 ,
∵经验回归直线过点 ,∴ ,
∴ ,∴
令 ,得
变式训练
练习3 恩格尔系数法是国际上常用的一种测定贫困线的方法,是指居民家庭年人均食物支出占年人均消费总支出的比重,它随家庭收入的增加而下降,即恩格尔系数越大,生活越贫困.某调研小组通过调查得到了某地年人均消费总支出 x (万元)与恩格尔系数 y 的五组数据如下表:
x 1 1.5 2 2.5 3
y 0.9 0.7 0.5 0.3 0.2
(1)请根据上表数据,用最小二乘法求出y关于x的经验回归方程;
(2)若该地某居民家庭年人均消费总支出为2.6万元,估计该居民家庭的恩
格尔系数.
=-0.36x+1.24.
(2)0.304
新知学习
对于响应变量Y,通过观测得到的数据 y 称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差,即
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
一元线性回归模型:Y=bx+a+e
经验回归方程:
作者编号:32100
新知学习
例如,对于下表中的第6个观测,父亲身高为172cm,其儿子身高的观测值为176(cm),预测值为173.265(cm),残差为176-173.265=2.735(cm).
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
父亲身高/cm 174 170 173 169 182 172 180 172 168 166 182 173 164 180
儿子身高/cm 176 176 170 170 185 176 178 174 170 168 178 172 165 182
类似地,我们还可以得到其他的残差,如下表所示.
作者编号:32100
-
作者编号:32100
新知学习
为了使数据更加直观,用父亲身高作为横坐标,残差作为纵坐标,这样作出的图形称为残差图,如图下所示:
刻画回归效果的方式(1) —— 残差图
作者编号:32100
新知学习
从残差图可以看出,残差有正有负,
比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型假定。
好的回归方程对应的残差散点图应是均匀地分布在横轴两侧的带状区域内,且带状区域越窄,说明模型拟合效果越好.
越窄越好
作者编号:32100
新知学习
(1)
(2)
(3)
(4)
思考:观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?
只有图(4)满足一元线性回归模型对随机误差的假设.
作者编号:32100
典例剖析
例3 某厂经过节能降耗技术改造后,生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗 y (单位:吨标准煤)的几组对应数据如表所示.
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
(1)由题设所给数据可得散点图,如图.
解析:
典例剖析
x 3 4 5 6
y 2.5 3 4 4.5
(2)请根据右表提供的数据,用最小二乘法
求出y关于x的经验回归方程 ;<m>
解析:
(2)由题中数据计算得 , ,
又 ,所以
所以
因此所求的经验回归方程为
典例剖析
(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤,试根据(2)中求出的经验回归方程,预测技改后生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.
解析:
(3)由(2)中的经验回归方程 得,技改后生产100吨
比技改前降低 吨标准煤.
甲产品的生产能耗为
总结提升
2. 残差的平方和越小,拟合效果越好;
3. 原始数据中的可疑数据往往是残差绝对值过大的数据;
4. 对数据刻画效果比较好的残差图特征:残差点比较均匀的集中在
水平带状区域内.
1. 残差等于观测值减预测值:
残差的性质
作者编号:32100
变式训练
10
练习4 某种产品的广告支出费用x(单位:万元)与销售额Y(单位: 万元)的数据如表.已知Y关于x的经验回归方程为 =6.5x+17.5,则当广告支出费用为5万元时,残差为 .
当x=5时, =6.5×5+17.5=50,表格中对应y=60,
解析:
于是残差为60-50=10.
新知学习
刻画回归效果的方式(2)—— 决定系数R2法
R2越大,表示残差平方和越小,即模型的拟合效果越好;
R2越小,表示残差平方和越大,即模型的拟合效果越差.
我们可以用决定系数R2来验证模型的拟合效果.
决定系数R2的计算公式为
作者编号:32100
典例剖析
例4 已知某种商品的单价x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x 14 16 18 20 22
y 12 10 7 5 3
求 y 关于 x 的经验回归方程,并说明回归模型拟合效果的好坏.
解析:
典例剖析
x 14 16 18 20 22
y 12 10 7 5 3
解析:
列残差表如下:
y 12 10 7 5 3
12 9.7 7.4 5.1 2.8
0 0.3 -0.4 -0.1 0.2
4.6 2.6 -0.4 -2.4 -4.4
故回归模型的拟合效果很好.
课堂总结
根据今天所学,回答下列问题:
1. 什么是一元线性回归模型参数的最小二乘估计?利用最小二乘得到的参数估计公式是什么?
2. 经验回归直线 有什么性质?
3. 如何用残差分析一元线性回归模型的有效性?
4. 如何利用残差分析修正回归模型?
作者编号:32100
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。