内容正文:
第02讲 一元线性回归模型及其应用
(
目标导航
)
课程标准
课标解读
1. 了解一元线性回归模型的含义,理解两
个变量之间随机关系的一元线性回归模型的作用与意义;
2. 了解残差在线性回归与非线性回归问
题的作用及意义;
3. 了解一元线性回归模型参数与最小二
乘估计的推导过程,理解最小二乘估计的原理;
4. 会结合题意求一元线性回归方程;
5. 会用相关指数进行分析模型拟合的效
果情况.
通过本节课的学习,要求会求一元线性回归方程,会进行残差分析,能判断回归模型的拟合效果,能利用样本数据建立统计模型并能进行预测.
(
知识
精讲
)
知识点
1.一元线性回归模型
用表示父亲身高,表示儿子身高,表示随机误差,假定随机误差的均值为,方差为与父亲身高无关的定值,则它们之间的关系可以表示为
我们称它为关于的一元线性回归模型.
2. 线性回归方程
对于变量和变量,设经过随机抽样获得的成对样本数据为,其中和的均值分别为和,其中
我们将称为关于的经验回归方程,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法.
备注 线性回归直线经过定点.
3. 线性回归分析
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
残差平方和(yi-i)2,残差平方和越小,模型拟合效果越好.
(2)用R2刻画回归效果
在回归分析中,可以用来刻画回归的效果,它表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.
4.残差分析
通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测量,观测值减去预测值称为残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判定原始数据是否存在可疑数据,这方面的工作称为残差分析.
通过观察残差图可以直观判断模型是否满足一元线性回归模型中对随机误差的假设,那残差应是均值为,方差为的随机变量的观测值.
5. 模型的拟合效果用相关指数来表示,,表达式中,与经验回归方程无关,残差平方和与经验回归方程有关,因此,越大,意味着残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差
【微点拨】在回归模型中,y的值由x和随机因素e共同确定,即x只能解释部分y的变化,x称为解释变量,y称为预报变量,e称为随机误差,它的均值E(e)=0,方差D(e)=σ2>0.
【即学即练1】已知变量x,y之间有线性相关关系,其回归直线方程为=-3+x,若i=17,i=4,则的值为( )
A.1 B.2
C.-1 D.-2
【即学即练2】某工厂的每月各项开支与毛利润(单位:万元)之间有如下关系,与的线性回归方程是,则( )
A. B. C. D.
【即学即练3】登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温x(℃)
18
13
10
-1
y(km)
2.4
3.4
3.8
6.4
由表中数据,得到线性回归方程,由此估计山高为7.2km处气温的度数为( )
A.10℃ B.8℃ C.4℃ D.6℃
【即学即练4】某公司生产某种婴幼儿纸尿裤的产量x与相应的生产能耗y有如下样本数据:
x
3
4
5
6
y
2.4
3.1
4
4.5
已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )
A. B.
C. D.
【即学即练5】在疫情冲击下,地摊经济有利于缓解部分失业人群的燃眉之急.已知某地摊的日盈利(单位:百元)与当天的平均气温(单位:)之间的数据如下表所示:
百元
由表中数据,得回归直线,则直线必过的点为( )
A. B. C. D.
【即学即练6】设有一个回归方程为,则变量增加一个单位时( )
A.平均增加1.5个单位 B.平均增加2个单位
C.平均减少1.5个单位 D.平均减少2个单位
【即学即练7】甲、乙、丙、丁四位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和如下表:
甲
乙
丙
丁
散点图
残差平方和
115
106
124
103
哪位同学的实验结果体现拟合A,B两变量关系的模型拟合精度高?( )
A.甲 B.乙
C.丙 D.丁
【即学