内容正文:
书书书
要点精析
一、回归分析
1.回归分析是处理变量之间相关关系的一种统计
方法,若两个变量之间具有线性相关关系,则称相应的
回归分析为线性回归分析.
2.样本相关系数
具有相关关系的两个变量之间关系的强弱是通过
相关系数r来衡量的,当 r>0时,表明两个变量正相
关;当r<0时,表明两个变量负相关.|r|越接近于1,
表明两个变量的线性相关性越强;|r|越接近于0,表
明两个变量之间几乎不存在线性相关关系.
3.线性回归方程 y= bx+a,其中 b =
∑
n
i=1
(xi-x)(yi-y)
∑
n
i=1
(xi-x)
2
,a=y-bx.回归直线经过样本点
的中心(x,y).
二、独立性检验
1.独立性检验的思想
独立性检验的基本思想类似于数学上的反证法,
要确认“两个分类变量有关系”这个结论的可信程度,
首先要假设该结论不成立,即假设结论“两个分类变量
没有关系”成立,在该假设下构造的随机变量χ2应该很
小,如果由观测数据求得χ2的值很大,则在一定程度上
说明假设不合理,然后根据随机变量χ2的含义,通过查
阅临界值的估计来评价假设不合理即“两个分类变量
有关系”成立的可信程度.
2.独立性检验的操作步骤
(1)找相关数据,作列联表;(2)求 χ2 =
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)(n=a+b+c+d);
(3)判断可能性,根据观测数据计算出的 χ2的值进行
判断.
题型解析
类型一:回归直线方程的求解
例1观察两个相关变量的如下数据:
x -9 -6.99-5.01-2.98 -5 5 4.98 4
y -9 -7 -5 -3 -5.024.99 5 4.03
则两变量间的回归直线方程为 ( )
(A)y=0.5x+1 (B)y=x
(C)y=2x+0.3 (D)y=x+1
解析:因为x=-1.875,y=-1.875,
又因为回归直线经过点(x,y),验证知选(B).
点评:(x,y)称为样本点的中心,回归直线一定过
此点.
类型二:线性相关关系强弱的判断
例2关于两个变量x和y的7组数据如下表所示:
x 21 23 25 27 29 32 35
y 7 11 21 24 66 115 325
试判断x与y之间是否有线性相关关系?
解析:计算得 x≈ 27.43,y≈ 81.29,∑
7
i=1
x2i =
5414,∑
7
i=1
xiyi=18542,∑
7
i=1
y2i =124393,
则r=
∑
7
i=1
xiyi-7xy
(∑
7
i=1
x2i-7x
2)(∑
7
i=1
y2i-7y
2
槡
)
= 18542-7×27.43×81.29
(5414-7×27.432)×(124393-7×81.292槡 )
≈0.86>0.75,
所以x与y具有线性相关关系.
点评:如果|r|大于0.75,我们认为x与y有很强
的线性相关关系,这时求回归直线方程有必要也有意
义,否则,在|r|<0.75时,寻找到的回归直线方程就
没有意义.
类型三:线性回归问题
例3某工业部门进行一项研究,分析该部门的产
量与生产费用之间的关系,从该部门内随机抽选了10
个企业为样本,有如下资料:
x 40 42 48 55 65 79 88100120140
y 150140160170150162185165190185
其中x为产量(千件),y为生产费用(千元).
(1)y与x是否具有相关关系?
(2)如果y与x具有相关关系,求回归直线方程.
解析:(1)计算得r=
∑
n
i=1
(xi-x)(yi-y)
∑
n
i=1
(xi-x)
2∑
n
i=1
(yi-y)槡
2
≈0.808>0.75.
说明y与x具有较强的线性相关关系.
(2)由(1)知y与x具有线性相关关系,设回归直
线方程为y=bx+a.
利用计算器进行计算得:x=77.7,y=165.7,
b=
∑
10
i=1
(xi-x)(yi-y)
∑
10
i=1
(xi-x)
2
≈0.398,
a=y-bx≈134.8.
所以回归直线方程为y=0.398x+134.8.
点评:解决本题首先要判断两变量是否具有线性
相关关系,然后再求回归直线方程.
类型四:非线性回归分析
例4下表是1957年美国旧轿车价格的调查资料,
今以x表示轿车的使用年数,y表示相应的平均价格,求
y关于x的回归方程.
使用年数x 1 2 3 4 5 6 7 8 9 10
平均价格
y(美元) 2651194314941087765538484290226204
解析:由图1的散点图可看出y与x呈指数关系,于
是令z=lny,变换后得数据:
x 1 2 3 4 5 6 7 8 9 10
z788375727309699166