内容正文:
8.2.2
一元线性回归模型
参数的最小二乘估计
高二数学选择性必修 第三册 第八章 成对数据的统计分析
学习目标
1.通过用数学方法刻画散点与直线接近的程度,体会一元线性回归模型参数的最小二乘估计原理,能推导参数估计公式;
2.通过对残差和残差图的分析,能用残差判断一元线性回归模型的有效性.
3.核心素养: 直观想象、数据分析、数学运算.
一、回顾旧知
1.一元线性回归模型
2.一元线性回归模型与函数模型的区别
Y称为因变量或响应变量
x称为自变量或解释变量
e是Y与bx+a之间的随机误差.
a称为截距参数
b称为斜率参数
二、探究新知
1.问题1.为了研究两个变量之间的相关关系, 我们
建立了一元线性回归模型表达式
刻画的是变量Y与变量x之间的线性相关关系,其中参数a和b未知,我们能否通过样本数据估计参数a和b?
与函数不同,回归模型的参数一般是无法精确求出的,只能通过成对样本数据估计这两个参数.
参数a和b刻画了变量Y与变量x的线性关系,因此通过成对样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.
2问题2.我们怎样寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”?
从成对样本数据出发,用数学的方法刻画
“从整体上看,各散点与直线最接近”
利用点到直线y=bx+a的“距离”来刻画散点与该直线的接近程度,然后用所有“距离”之和刻画所有样本观测数据与该直线的接近程度.
父亲身高/cm
180
175
170
165
160
160
165
170
175
180
185
190
·
·
·
·
·
·
·
儿子身高/cm
·
·
·
·
·
·
·
185
父亲身高/cm
180
175
170
165
160
160
165
170
175
180
185
190
·
·
·
·
·
·
·
儿子身高/cm
·
·
·
·
·
·
·
185
我们设满足一元线性回归模型的两个变量的n对样本数据为(x1,y1),(x2,y2),…,(xn,yn)
父亲身高/cm
180
175
170
165
160
160
165
170
175
180
185