内容正文:
第八章 成对数据的统计分析
8.2一元线性回归模型及其应用
知识点1-----一元线性回归模型
我们称该式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.
知识点2-----一元线性回归模型参数的最小二乘估计
1.线性回归方程与最小二乘法
回归直线方程过样本点的中心(x,y),是回归直线方程最常用的一个特征
我们将称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(lastsqures estimate),
其中
2.残差的概念
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差,残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
3.残差与残差分析
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分差.
4.刻画回归效果的方式
⑴残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(2)残差平方和法
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(3)利用R2刻画回归效果
决定系数R是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.,R2越大,即拟合效果越好,R2越小,模型拟合效果越差
注意
残差图是以残差为纵坐标,以其他有关量为横坐标的散点图.根据一元线性回归模型中对随机误差的假定,残差应是均值为0、方差为σ²的随机变量的观测值,其残差图中的点应大致均匀地分布在某一水平带状区域内,没有任何明显的趋势.
经典例题
例题1.给出下列说法:
①回归直线 恒过样本点的中