内容正文:
1.3 可线性化的回归分析
●趣味导入
混凝土的抗压强度X较易测定,其抗剪强度Y不易测定.工程中希望由X估算出Y,以便应用.现测得一批对应数据如下:
X
141
152
168
182
195
204
223
254
277
Y
23.1
25.3
27.9
29.8[来源:学科网]
31.1
31.8
32.5
34.8
35.2
其中X——抗压强度,Y——抗剪强度.
问:如何求出X与Y的关系式?
●学案导引
知识点
非线性回归方程
了解
1.在具体问题中,我们首先应该作出原始数据(xi,yi)的散点图,从散点图中看出数据的大致规律,再根据这个规律选择适当的函数进行拟合.
2.对于非线性回归模型一般可转化为线性函数,从而得到相应的回归方程.
3.几种常见模型
(1)幂函数曲线y=axb,其散点图在形如下列曲线附近:
设u=ln y,v=ln_x,c=ln_a,则转化为线性关系:u=c+bv.
(2)指数曲线y=aebx,其散点图在形如下列曲线附近:
设u=ln_y,c=ln_a,则转化为线性关系:u=c+bx.
(3)倒指数曲线y=ae,其散点图在如下曲线附近:
设u=ln_y,c=ln_a,v=,则转化为线性关系:u=c+bv.
(4)对数曲线y=a+bln x,其散点图在如下曲线附近:
设v=ln_x,则转化为线性关系:y=a+bv.
●思考探究
如果原始数据的散点图近似一个指数函数的图像,如何进行回归分析?
提示 可以考虑用函数y=aebx来拟合数据的变化关系.首先将其转化成线性函数.对y=aebx两边取对数,得ln y=ln a+bx.作变换u=ln y,c=ln a,则上式变为u=c+bx,然后对原始数据作转换,转换成(x1,u1),(x2,u2),…,(xn,un),接着用最小二乘法计算出b,c,得到线性回归方程,最后再把线性回归方程转回到y=aebx的形式,即y=eu=ec+bx.
类型一 判断两变量是否线性相关
[例1] 下列是水稻产量与施化肥量的一组观测数据:
施化肥量
15
20
25
30
35
40
45
水稻产量
320
330
360
410
460
470
480
(1)将上表中的数据制成散点图,并计算相关系数r;
(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?该结论与相关系数r的计算一致吗?
[思路点拨] 由题目可获取以下主要信息:
①表中数据是水稻产量与施化肥量的观测数据;
②根据表中数据可得出散点图及相关系数r的值,从而初步判断两变量的相关性,并近似解决施化肥量与水稻产量之间的数量关系.
[自主解答] (1)散点图如下:
列表:
i
xi
yi
x
y
xiyi
1
15
320
225
102 400
4 800
2
20
330
400
108 900
6 600
3
25
360
625
129 600
9 000
4
30
410
900
168 100
12 300
5
35
460
1 225
211 600
16 100
6
40[来源:学科网]
470
1 600
220 900
18 800
7
45
480
2 025
230 400
21 600
210
2 830
7 000
1 171 900
89 200
=30,=404.285 7
r=
≈0.975.
(2)从散点图发现施化肥量与水稻产量近似成线性关系,与相关系数r计算一致.
[方法探究]
判断变量的相关性通常有两种方式:一是散点图,二是相关系数r.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.
●变式训练
1.下表表示的是某地降雨量与平均气温,判断两者具有线性相关关系吗?求回归直线方程有意义吗?
年平均气温/℃
12.51
12.84
12.85
13.69
13.33
12.74
13.05
年降雨量/mm
748
542
507
813
574
701
432
解析 以x轴为年平均气温,y轴为年降雨量可得相应的散点图,如图所示.因为图中各点并不在一条直线附近,则两者不具有线性相关关系,没必要用回归直线进行拟合,求回归直线方程没有意义.
类型二 可线性化的回归分析
[例2] 我国1950~1959年人口数据资料为:
年份
1950
1951
1952
1953
1954
t
0
1
2
3
4
人口y/万
55 196
56 300
57 482
58 796
60 266
年份
1955
19