内容正文:
1.2 回归分析
互动课堂
疏导引导
1.回归分析的基本思想
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本思想是通过散点图直观地了解两个变量的关系,然后通过最小二乘法建立回归模型,最后通过分析相关指数、随机误差等评价模型的好坏.
疑难疏引理解两个变量之间的线性关系要注意下面的几个问题:
(1)相关关系是非随机变量与随机变量之间的关系,而函数关系是两个非随机变量间的关系;(2)函数关系是一种因果关系,而相关关系不一定有因果关系,也可能是伴随关系.(3)现实生活中存在大量的相关关系,相关关系是进行回归分析的基础.
2.非线性回归问题
两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型.如y=,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.(如例2)
3.如何评判回归模型的好坏
可以通过比较两个模型的残差平方和的大小来判断拟合效果,残差平方和越小的模型,拟合的效果越好.类似地,还可以用相关指数R2来比较两个模型的拟合效果,R2越大,模型的拟合效果越好.
例如例2中,可以认为样本点集中在某二次曲线y=bx2+a附近,可令t=x2.
t=x2
3 600
4 900
6 400
8 100
10 0020
12 100
y
6.13
7.90
9.99
12.15
15.02
17.50
t=x2
14 400
16 900
19 600
22 500
25 600
28 900
y
20.92
26.86
31.11
38.85
47.25
55.05
由上表数据可得y与t的线性回归方程:
=1.899×10-3t-3.322,
即=1.899×10-3x2-3.322. ②
下面分析一下这两种函数模型,哪一种拟合效果较好?
分别求出两种模型的残差平方和和相关指数,通过比较残差平方和或相关指数来判定,模型①的残差平方和与相关指数在例2中已求,下面求模型②的残差平方和与相关指数.
x
60
70
80
90
100
110
y
6.13
7.90