内容正文:
8.2.2一元线性回归模型参数的
最小二乘估计
情境导入
在一元线性回归模型中,表达式 刻画了变量Y与x之间的线性相关关系,其中参数a和b未知,那么我们如何来确定参数a和b的值呢?
学科网原创
情境导入
问题1:确定参数a和b的原则是什么?
答案:使各散点在整体上与一条适当的直线尽可能地接近.
问题2:下列确定直线的方法是否可行?
方法1:先画出一条直线,测量出各点到直线的距离,然后移动直线,到达一个是距离和最小的位置,测量出此时的斜率和截距,就得到一条直线.
方法2:可以在散点图中选两点画一条直线,使得直线两侧点的个数基本相同,把这条直线作为所求直线.
方法3:在散点图中多取几对点,确定出几条直线,再分别求出这些直线的斜率截距的平均数作为所求直线的斜率和截距.
方法4:我们可以考虑使各组数据的随机误差e的和最小的角度确定直线的斜率和截距.
知识海洋
我们将 称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫最小二乘法.
对于一组具有线性相关关系的数据(x1 ,y1 ) ,(x2 , y2),···, (xn ,yn),
记 ,其回归直线Y=bx+a的斜率和截距的最小二乘估计分
别为
b>0时,Y与x正相关;b<0,Y与x负相关。
知识海洋
思考:经验回归方程中的参数b与线性相关关系有什么联系?
其中 , 称为样本点的中心.
经验回归直线必过点 .
应用探究
【例】如图是我国2008年至2014年生活垃圾无害化处理量(单位:
亿吨)的折线图.
(1)由折线图可以看出,可用线性回归模型拟合y与t的关系,请用
相关系数加以说明.
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活
垃圾无害化处理量.
应用探究
附:
参考公式:相关系数 ,
经验回归方程 中斜率和截距的最小二乘估计分别为
解:(1)由折线图中数据和附注中参考数据得t=4,
因为y与t的相关系数近似为0.99,所以y与t的线性相关程度相当高,从而可以用
经验回归模型拟合y与t的关系.
(2)由