内容正文:
书书书
要点精析
(一)回归分析的基本思想及其初步应用
1.线性回归分析
利用回归分析的方法对两个具有线性相关关系的
变量进行研究的步骤为:①画出两个变量的散点图;②
求回归直线方程;③用回归直线方程进行预报.其中求
回归直线方程是关键.而对于线性回归模型 y^=bx+a
来说,估计模型中的未知参数a和b的最好方法就是利
用最小二乘法.
2.比较两个不同回归模型的拟合效果
在回归分析中,通常是通过残差分析来判断回归
模型的拟合效果.残差分析的基本方法是由回归方程
作出残差图,以分析和发现观测数据中可能出现的错
误以及所选用的回归模型是否恰当;在残差图中,残差
点比较均匀地落在水平的带状区域中,说明选用的模
型比较合适,这样的带状区域的宽度越窄,说明模型的
拟合精度越高,回归方程的预报精度越高.也可以进一
步通过相关指数R2来衡量回归模型的拟合效果,一般
规律是R2越大,残差平方和就越小,从而回归模型的拟
合效果越好.
(二)独立性检验的基本思想及其初步应用
在日常生活中,经常会面临一些需要推断的问题.
在对这些问题作出推断时,我们不能仅凭主观意愿作
出结论,需要通过试验来收集数据,并依独立性检验的
原理作出合理的推断,这就是独立性检验的基本思想.
依据这一思想,我们可以考察两个分类变量X和Y是否
有关系,并且能给出这种判断的可靠程度.其具体做法
是:先利用三维柱形图或二维条形图粗略地判断两个
分类变量是否有关系,再利用公式计算K2的值,比较与
临界值的大小关系来判定变量 X与 Y是否有关.当 K2
的值很大时,就认为两个变量有关系;否则就认为两个
变量没有关系.
题型解析
类型一:回归直线方程的求解
例1观察两个相关变量的如下数据:
x -9 -6.99-5.01-2.98 -5 5 4.98 4
y -9 -7 -5 -3 -5.024.99 5 4.03
则两变量间的回归直线方程为 ( )
(A)y^=0.5x+1 (B)y^=x
(C)y^=2x+0.3 (D)y^=x+1
解析:因为x=-1.875,y=-1.875,
又因为回归直线经过点(x,y),验证知选(B).
点评:(x,y)称为样本点的中心,回归直线一定过
此点.
类型二:线性相关关系强弱的判断
例2关于两个变量x和y的7组数据如下表所示:
x 21 23 25 27 29 32 35
y 7 11 21 24 66 115 325
试判断x与y之间是否有线性相关关系?
解析:计算得 x≈ 27.43,y≈ 81.29,∑
7
i=1
x2i =
5414,∑
7
i=1
xiyi=18542,∑
7
i=1
y2i =124393,
则r=
∑
7
i=1
xiyi-7xy
(∑
7
i=1
x2i-7x
2)(∑
7
i=1
y2i-7y
2
槡
)
= 18542-7×27.43×81.29
(5414-7×27.432)×(124393-7×81.292槡 )
≈0.86>0.75,
所以x与y具有线性相关关系.
点评:如果|r|大于0.75,我们认为x与y有很强
的线性相关关系,这时求回归直线方程有必要也有意
义,否则,在|r|<0.75时,寻找到的回归直线方程就
没有意义.
类型三:线性回归问题
例3某工业部门进行一项研究,分析该部门的产
量与生产费用之间的关系,从该部门内随机抽选了10
个企业为样本,有如下资料:
x 40 42 48 55 65 79 88100120140
y 150140160170150162185165190185
其中x为产量(千件),y为生产费用(千元).
(1)y与x是否具有相关关系?
(2)如果y与x具有相关关系,求回归直线方程.
解析:(1)计算得r=
∑
n
i=1
(xi-x)(yi-y)
∑
n
i=1
(xi-x)
2∑
n
i=1
(yi-y)槡
2
≈0.808>0.75.
说明y与x具有较强的线性相关关系.
(2)由(1)知y与x具有线性相关关系,设回归直
线方程为 y^=b^x+a^.
利用计算器进行计算得:x=77.7,y=165.7,
b^=
∑
10
i=1
(xi-x)(yi-y)
∑
10
i=1
(xi-x)
2
≈0.398,
a^=y-b^x≈134.8.
所以回归直线方程为 y^=0.398x+134.8.
点评:解决本题首先要判断两变量是否具有线性
相关关系,然后再求回归直线方程.
类型四:非线性回归分析
例4下表是1957年美国旧轿车价格的调查资料,
今以x表示轿车的使用年数,y表示相应的平均价格,求
y关于x的回归方程.
使用年数x 1 2 3 4 5 6 7 8 9 10
平均价格
y(美元) 2651194314941087765538484290226