内容正文:
8.2.2 一元线性回归模型参数的最小二乘估计
第2课时
例 经验表明,一般树的胸径 (树的主干在地面以上1.3m处的直径)越大, 树就越高 . 由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高 . 在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表,试根据这些数据建立树高关于胸径的经验回归方程.
编号 1 2 3 4 5 6
胸径/cm 18.1 20.1 22.2 24.4 26.0 28.3
树高/m 18.8 19.2 21.0 21.0 22.1 22.1
编号 7 8 9 10 11 12
胸径/cm 29.6 32.4 33.7 35.7 38.3 40.2
树高/m 22.4 22.6 23.0 24.3 23.9 24.7
例 根据下面数据建立树高关于胸径的经验回归方程.
编号 1 2 3 4 5 6
胸径/cm 18.1 20.1 22.2 24.4 26.0 28.3
树高/m 18.8 19.2 21.0 21.0 22.1 22.1
编号 7 8 9 10 11 12
胸径/cm 29.6 32.4 33.7 35.7 38.3 40.2
树高/m 22.4 22.6 23.0 24.3 23.9 24.7
分析:因为要由胸径预测树高,所以要以成对样本数据的胸径为横坐标、树高为纵坐标描出散点,进而得到散点图,再根据散点图推断树高与胸径是否线性相关 . 如果是,再利用公式计算出,即可.
解: 以胸径为横坐标,树高为纵坐标作散点图如下:
在右图中,散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系.
用d表示胸径 , h表示树高 , 根据据最小二乘法 , 计算可得经验回归方程为
相应的经验回归直线如图所示.
编号 胸径/cm 树高观测值/m 树高预测值/m 残差/m
1 18.1 18.8 19.4 -0.6
2 20.1 19.2 19.9 -0.7
3 22.2 21.0 20.4 0.6
4 24.4 21.0 20.9 0.1
5 26.0 22.1 21.3 0.8
6 28.3 22.1 21.9 0.2
7 29.6 22.4 22.2 0.2
8 32.4 22.6 22.9 -0.3
9 33.7 23.0 23.2 -0.2
10 35.7 24.3 23.7 0.6
11 38.3 23.9 24.4 -0.5
12 40.2 24.7 24.9 -0.2
根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,如下表所示.
以胸径为横坐标, 残差为纵坐标, 作残差图, 得到下图.
观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内 . 可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高.
编号 1 2 3 4 5 6 7 8
年份 1896 1912 1921 1930 1936 1956 1960 1968
记录/s 11.80 10.60 10.40 10.30 10.20 10.10 10.00 9.95
问题 人们常将男子短跑100m的高水平运动员称为百米飞人 . 下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据 . 试依据这些成对数据, 建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程.
以成对数据中的世界纪录产生年份为横坐标 , 世界纪录为纵坐标作散点图 , 得到下图.
在上图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.
用Y表示男子短跑100m的世界纪录 , t表示纪录产生的年份 , 利用一元线性回归模型来刻画世界纪录和世界纪录产生年份之间的关系 .
根据最小二乘法 , 由表中的数据得到经验回归方程为:
将经验回归直线叠加到散点图,得到下图:
观察! 从图中可以看到 , 经验回归方程较好地刻画了散点的变化趋 , 请再仔细观察图形 , 你能看出其中存在的问题吗?
以经验回归直线为参照,可以发现经验回归方程的不足之处,以及散点的更为精细的分布特征.
例如,第一个世界纪录所对应的散点远离经验回归直线