内容正文:
9.1.2 线性回归方程(1)
问题1:既然我国城镇居民人均年支出与人均年可支配收入之间具有线性相关关系,那么,能否根据这种关系由人均年可支配收人预测对应的人均年支出呢?
情境问题
问题2:怎样选择恰当的直线反映两个变量之间的线性相关关系呢?
学生活动
从图上可以看出,这些点在一条直线附近,但并不都在同条直线上.也就是说,上述直线并不能精确地反映x与y之间的关系,y的值不能由x确定.
在此,我们将两者之间的关系表示为y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差(random error).
数学建构
我们将y=a+bx+ε称为线性回归模型(linear regression model).
对于这样的线性回归模型,我们需要考虑下面两个问题:
Ⅰ 模型是否合理;
Ⅱ 在模型合理的情况下,如何估计a,b.
数学建构
数学应用
数学应用
例2 20个工业企业某年的平均固定资产价值与总产值(单位:百万元)如表所示:
设年平均固定资产价值为x,年总产值为y,单位均为百万元,求x,y的线性回归方程.
数学应用
数学应用
课堂练习
1.本节课学习了哪些新的知识和方法?
2.学习本节课的感受是什么?
回顾小结
我们把
称为n对数据的回归直线,此直线方程称为线性回归方程(equation of linear regression).
(1)
其中
称为回归截距,
称为回归系数,
称为回归值.
例1 全国城镇居民人均年可支配收入与人均年支出(单位:元)的部分数据(来源:《中国统计年鉴(2016)》)如下表所示:
年份
1990
2000
2010
2011
2012
2013
2014
2015
人均可支配收入
1510
6280
19109
21810
24565
26467
28844
31195
人均年支出
1279
4998
13471
15161
16674
18488
19968
21392
可以求得我国城镇居民人均年可支配收入与人均年支出的线性回归方程中的
,
,故线性回归方程为
.
下表是我国城镇居民人均年支出的实际观测值与由线性回归方程求出的估计值的对照表:
年份
1990
2000
2010
2011
2012
2013
2014
2015
观测值
1279
4998
13471
15161
16674
18488
19968
21392
估计值
1518
4724
13348
15164
17015
18294
19892
21472
可以看出,由回归方程得到的估计值与实际观测值差异较小,比较可靠.因此,我们可以用该回归方程根据城镇居民人均年可支配收入来对城镇居民人均年支出进行估计.
解:由表中数据可得
,
,
,
,
代入公式(1),求得回归系数
≈0.8443.
≈4.8753.
因此,线性回归方程为
.
1.某工厂在某年里每月产品的总成本y(单位:万元)与月产量x(单位:万件)之间有如下一组数据:
x/万件
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
y/万元
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
(1)画出散点图;
(2)求相关系数;
(3)求线性回归方程.
$$