内容正文:
8.2.1一元线性回归模型
情境导入
通过前面的学习我们已经知道,根据成对样本数据的散点图和相关系数,可以判断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.
思考:是否可以通过建立适当的统计模型来刻画两个变量之间的相关关系?
知识海洋
生活经验告诉我们,儿子的身高与父亲的身高具有正相关的关系,为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表所示:
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
父亲
身高 174 170 173 169 182 172 180 172 168 166 182 173 164 180
儿子
身高 176 176 170 170 185 176 178 174 170 168 178 172 165 182
一元线性回归模型
知识海洋
根据我们学过的整理数据的方法:相关系数r=0.886.
问题1:可以得到什么结论?
问题2:是否可以用函数模型来刻画?
回答1:由散点图的分布趋势表明儿子的身高与父亲的身高线性相关,通过相关系数可知儿子的身高与父亲的身高正线性相关,且相关程度较高.
回答2:不能.因为不符合函数的定义.
知识海洋
用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值 ,则它们之间的关系可以表示为
我们称上式为Y关于x的一元线性回归方程.其中, Y称为因变量或响应变量, x称为自变量或解释变量.a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
思考:为什么E(e)=0?
一元线性回归模型
知识海洋
问题:产生随机误差e的原因有哪些?
回答:(1)其它可能影响儿子身高的因素,如母亲的身高、生活环境、饮食习惯及锻炼时间等;
(2)在测量儿子身高时,由于测量工具、测量精度等所产生的测量误差;
(3)实际问题中,我们不知道儿子的身高与父亲的身高的相关关系是什么,可以用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.
应用探究
【例】判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?为什么?函数模型与回归模型有什么区别?
(1)某公司的销售收入和广告支出;
(2)某城市写字楼的出租