内容正文:
8.2 一元线性回归模型及其应用
1、将
称为
关于
的经验回归方程,也称为经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,
,
叫做
,
的最小二乘估计。其中
,
2、通过观测得到的数据称为观测值,通过经验回归方程得到的
称为预测值,观测值减去预测值称为残差。残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析
3、模型的拟合效果用相关指数
来表示,
,表达式中,
与经验回归方程无关,残差平方和
与经验回归方程有关,因此,
越大,意味着残差平方和
越小,即模型的拟合效果越好;
越小,残差平方和越大,即模型的拟合效果越差
SHAPE \* MERGEFORMAT
题型一 线性回归方程
例 1 (多选)有关线性回归的说法,正确的是( )
A.相关关系的两个变量不是因果关系
B.散点图能直接反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任意一组数据都有回归方程
【答案】ABC
【分析】
根据线性回归方程的意义即可得出结果.
【详解】
并不是每一组数据都有回归方程.
故D不正确,其余均正确.
故选:ABC
SHAPE \* MERGEFORMAT
已知变量x,y的关系可以用模型
拟合,设
,其变换后得到一组数据下:
16
17
18
19
50
34
41
31
由上表可得线性回归方程
,则c=( )
A.
B.
C.109
D.
【答案】D
【分析】
根据表格数据求
,代入回归方程求参数a,结合
得
,由方程的形式可知
,即可求c.
【详解】
由表格数据知:
.
由
,得
,则
.
∴
,
由
,得
,
∴
,即
.
故选:D.
题型二 残差
例 2 下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于1
B.设
,且
,则
C.线性回归直线
一定经过样本点的中心
D.在残差图中,残差点分布的带状区域的宽带越狭窄,其模型拟合的精度越高
【答案】B
【分析】
利用相关关系判断A;由正态分布的性质判断B;由线性回归直线的性质判断C;由残差的性质判断D.
【详解】
对于A,根据相关系数的意义可知,A正确;
对于B,由
,知
,即概率密度函数的图像关于