内容正文:
§3.1 回归分析的基本思想及初步应用
[课标解读]
1.了解随机误差、残差、残差图的概念.
2.会通过分析残差判断线性回归模型的拟合效果.(难点)
3.掌握建立回归模型的步骤.(重点)
4.通过对典型案例的探究,了解回归分析的基本思想和初步应用.
1.线性回归模型
(1)回归方程的相关计算:
对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn).设其回归直线方程为=x+,其中,是待定参数,由最小二乘法得
(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.
(3)R2=,R2越接近于1,表示回归效果越好.
知识点 线性回归模型
探究1:结合线性回归模型y=bx+a+e,回答下面几个问题,了解与回归模型相关的概念.
(1)现实生活中的两个变量有哪些关系?线性回归模型是用来刻画哪类变量间的模型?
提示 现实生活中的两个变量关系主要有确定性关系与非确定性关系,线性回归模型是用来刻画非确定性关系的模型.
(2)回归分析中,利用线性回归方程求出的函数值是否一定为真实值?
提示 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值.例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.
(3)线性回归方程能否用散点图中的某两点来确定?
提示 不能用散点图中过某两点的直线方程来作为线性回归方程.由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数y=bx+a描述它们之间的关系,因此用线性回归模型y=bx+a+e来表示,其中a,b可以由最小二乘法估计,,就是a,b的估计值.
探究2:完成下列问题,总结回归分析的几种方法.
(1)有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义,用残差能否判断建立的回归模型是否合理?
提示 残差能对x,y的线性相关性进行检验.残差可以发现原始数据中的可疑数据,如果残差点比较均匀地落在水平的带状区域中说明选用的模型较为合适.
(2)残差分析只是从直观上对模型的模拟效果进行判断,哪些量能从数据角度对模型的模拟效果进行精确预报?
提示 R2=1-可对模型的模拟效果进行精确预报,R2表示解释变量对于预报变量变化的贡献率,如R2≈0.72则表示解释变量解释了72%的预报变量.
(1)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据测算的线性回归方程可能是
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
(2)某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
6
8
10
12
y
2
3
5
6
①请画出上表数据的散点图(要求:点要描粗);
②请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
③试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
[来源:Zxxk.Com]
②=6×2+8×3+10×5+12×6=158,
==9,
==4,
=62+82+102+122=344,
===0.7,
=-=4-0.7×9=-2.3,
故线性回归方程为=0.7x-2.3.
③由②中线性回归方程当x=9时,=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.
【答案】 (1)A (2)见自主解答
●规律总结
求线性回归方程的三个步骤
(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.
(2)求回归系数:若存在线性相关关系,则求回归系数.
(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.
1.某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据:
x/百万元
2
4
5
6
8
y/百万元
30
40
60
50
70
(1)画出散点图;
(2)求线性回归方程;
(3)试预测广告费用支出为10百万元时,销售额多大?
解析 (1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:
i
1
2
3
4
5
合计
xi
2
4
5
6
8
25
yi
30
40
60
50
70
250
xiyi
60
160
300
300
560
1 380
x
4
16
25
36
64
145
=-=50-6.5×5=17.5.
所以所求的线性回归方程为=6.5x+17.5.
(3)根据上面求得的线性回归方程,当广告费用