内容正文:
8.2一元线性回归模型及其应用
第八章 成对数据的统计分析
课时2 一元线性回归模型及其应用
新知探究
探究一:残差
情境设置
小明:还有什么方法能刻画回归效果呢?
小明同桌:作残差图.
问题1: 如何作残差图?
问题2: 刻画𝑦与𝑥 之间的关系?
【解析】纵坐标为残差,横坐标可以为样本编号或身高数据或体重的估计值等,这样作
出的图形就是残差图了.
【解析】残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的
带状区域的宽度越窄,说明模型拟合精度越高.
2
新知生成
知识点一 残差
1.观测值
对于响应变量𝑌,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值.
2.残差
观测值减去预测值所得的差称为残差.
3.残差分析
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
4.残差的应用
一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.
3
一、残差
例题1 随着生活水平的逐步提高,人们对文娱活动的需求与日俱增,其中观看电视就是一种老少皆宜的娱乐活动.但是我们在观看电视娱乐身心的同时,也要注意把握好观看时长.近期研究显示,一项久坐的生活指标——看电视时长,是导致视力下降的重要因素,即看电视的时间越长,视力下降的风险越大.研究者在某小区统计的每天看电视时长𝑥(单位:小时)与视力下降人数𝑦 的相关数据如下:
(1)请根据上面的数据求𝑦关于𝑥 的经验回归方程.
(2)我们用第(1)问求出的经验回归方程中的估计 ,因为随机误
差,所以是的估计值,称为点 的残差.
①填写下面的残差表,并绘制残差图;
编号 1 2 3 4 5
1 1.5 2 2.5 3
12 16 22 24 26
编号 1 2 3 4 5
1 1.5 2 2.5 3
12 16 22 24 26
4
一、残差
②若残差图所在带状区域宽度不超过4,则我们认为该模型拟合精度比较高,经验回归方程的预报精度较高,试根据①中绘制的残差图分析该模型拟合精度是否比较高.
附:经验回归方程 中, .
【解析】(1),, , ,
则, ,
故关于的经验回归方程为 .
(2)①残差表:
②残差图所在带状区域的宽度为2−(−1.2)=3.2.因为3.2<4 ,所以我们认为该模型
拟合精度比较高.
编号 1 2 3 4 5
x 1 1.5 2 2.5 3
y 12 16 22 24 26
-0.8 -0.4 2 0.4 -1.2
5
反思感悟
方法总结
作残差分析时,一般从以下几个方面予以说明:
(1)散点图;
(2)决定系数;
(3)残差图中的异常点和残差点所在的水平带状分布区域的宽窄.
6
新知运用
跟踪训练1 两个线性相关变量𝑥与𝑦 的统计数据如表所示:
其经验回归方程是,则相对应于点的残差为( ).
A.0.1 B.0.4 C.0.3 D.0.2
【解析】由题意得, ,则样本点的中心为
.因为经验回归方程为,
所以,解得 ,所以 ,
当时,,则相对应于点的残差为 .
9 9.5 10 10.5 11
11 10 8 6 5
D
7
新知探究
探究二:的计算和非线性经验回归方程
情境设置
变量关于的非线性经验回归方程为 ,其一组数据如表所示:
问题:如何求非线性经验回归方程中的 ?
1 2 3 4
【解析】将式子两边取自然对数,得到,令,则 ,根据题中所给的表格,列出𝑥,𝑧的取值对应的表格,求得, ,利用经验回归直线过样本点的中心,列出等量关系式,求得 . 由,得,令,则 ., .
经验回归直线过点, ,
,解得 .
由上可知,
8
新知生成
知识点二 的计算和非线性经验回归方程
1.的计算公式为
.
2.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非
线性相关或曲线相关.
9
二、 的计算和非线性经验回归方程
例2 下表为收集到的一组数据:
(1)作出𝑦与𝑥的散点图,并猜测𝑦与𝑥 之间的关系;
(2)建立𝑥与𝑦 的关系,预报回归模型并计算残差(精确到小数点后3位);
(3) 利用所得模型,预测当时,的值.附:经验回归方程
中, .
21 23 25 27 29 32 35
7 11 21 24 66 115 325
【解析】(1)作出散点图,如图所示,从散点图可以看出𝑦与𝑥 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线𝑦的周围,其中
, 为待定的参数.
(2) 对的两边取自然对数,把指数关系变为线性关系,令 ,则变换
后的样本点应分布在直线的周围,这样就可以利用经验
回归模型来建立𝑦与𝑥 之间的非线性经验回归方程了,数据可以转化为
10
二、 的计算和非线性经验回归方程
【解析】(2) 则,,, ,
,
,求得经验回归方程为
, .
残差表如下
(3) 当时, .
21 23 25 27 29 32 35
1.946 2.398 3.045 3.178 4.190 4.745 5.784
7 11 21 24 66 115 325
6.404 11.056 19.087 32.950 56.883 129.024 292.657
0.596 1.913 9.117 32.343
11
反思感悟
方法总结
非线性回归问题的处理方法
(1)指数函数模型,其图象如图所示.
处理方法:两边取自然对数得,即.令 ,把原
始数据转化为,再根据线性回归模型的方法求出, .
(2)对数函数模型𝑦=𝑏ln 𝑥+𝑎 ,其图象如图所示.
处理方法:设,原方程可化为 ,
再根据线性回归模型的方法求出𝑎,𝑏 .
(3)二次函数模型
处理方法:设,原方程可化为 ,再根据线性回归模型的方法求
出𝑎,𝑏 .
12
新知运用
跟踪训练2 某公司研制了一种对人畜无害的灭草剂,为了解其效果,通过实验,收集
到其不同浓度𝑥(单位:mol/L)与灭死率𝑦 的数据,得下表:
(1) 以为解释变量,为响应变量,在和中选一个作为灭
死率𝑦关于浓度𝑥(单位:mol/L )的经验回归方程,不用说明理由.
(2) ①根据(1)的选择结果及表中数据,求出所选经验回归方程.
②依据①中所求的经验回归方程,要使灭死率不低于 ,估计该灭草剂的浓度至少要
达到多少.参考公式:对于一组数据,, , ,其经验回归方程
中, .
浓度
灭死率 0.1 0.24 0.46 0.76 0.94
13
二、 的计算和非线性经验回归方程
【解析】(1)根据表格中数据可知解释变量𝑥呈现指数增长,而响应变量𝑦 增长幅度不大,
故选 .
(2)①令,则 ,所以可得如下数据:
则 ,
,
, ,
所以, ,
所以,即 .
②依题意,,即,即 ,
所以,即要使灭死率不低于0.8 ,则估计该灭草剂的浓度至少要达到
.
0.1 0.24 0.46 0.76 0.94
14
随堂检测
1.已知某校一个课外学习小组为研究某作物种子的
发芽率𝑦和温度𝑥 (单位:℃ )之间的关系,在20个不
同的温度条件下进行种子发芽实验,由实验数据
得到下面的散点图:由此散点图,在
至之间,下面四个回归方程类型中最适宜作为发芽率𝑦 和温度𝑥 的回归方程类型的是( ).
A. B. C. D.
2.下列有关线性回归的说法,不正确的是( ).
A.当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相
关关系
B.在平面直角坐标系中用描点的方法得到的两个变量的一组数据的图形叫作散点图
C.经验回归方程最能代表观测值𝑥,𝑦 之间的线性关系
D.任何一组观测值都能得到具有代表意义的经验回归方程
3.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数的图象附近,令 ,则可通过转换得到经验回归方程为_________________.
D
D
15
随堂检测
4.某个服装店经营某种服装,某周内获得的纯利润𝑦 (单位:元)与该周每天销售这种
服装件数𝑥 (单位:件)之间的一组数据如表所示:
已知,, .
(1)求,的值(精确到小数点后两位);
(2)已知纯利润𝑦与每天销售件数𝑥之间线性相关,求出𝑦关于𝑥 的经验回归方程(精确到小数点后两位);
(3)求残差平方和、决定系数(精确到小数点后四位).
【解析】(1) , .
(2)因为与具有线性相关关系,所以可设经验回归方程为 ,
则, ,
所以关于的经验回归方程为 .36.
件 3 4 5 6 7 8 9
元 66 69 73 81 89 90 91
16
随堂检测
【解析】(3)列出残差表:
所以残差的平方和为
,
决定系数 .
3 4 5 6 7 8 9
66 69 73 81 89 90 91
65.61 70.36 75.11 79.86 84.61 89.36 94.11
0.39 1.14 4.39 0.64
17
课堂小结
1.知识清单:
(1)残差;
(2) 的计算和非线性经验回归方程.
18
$$