内容正文:
第十讲 回归分析的基本思想及其初步应用
1.线性回归模型
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
(3)对于一组具有线性相关关系的数据,回归直线的斜率和截距的最小二乘估计公式分别为 ,,其中称为样本点的中心.
(4)线性回归模型,其中称为随机误差,和是模型的未知参数,自变量称为解释变量,因变量称为预报变量.
2.线性回归分析
(1)残差的概念:对于样本点而言,它们的随机误差为其估计值为称为相应于点的残差.
类别
残差图法
残差平方和法
R2法
特点
残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高
残差平方和越小,模型的拟合效果越好
表示解释变量对于预报变量变化的贡献率,越接近于1,表示回归的效果越好
(2)回归模型拟合效果的刻画
(3)建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程x+).
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等
题型1 求线性回归方程
例1.根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种疫苗的情况,得如下统计表:
第天
1
2
3
4
5
新接种人数
10
15
19
23
28
(1)建立关于的线性回归方程;
(2)预测该村居民接种新冠疫苗需要几天?
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为: ,.
例2.自从新型冠状病毒肺炎疫情暴发以来,有关部门在全国范围