内容正文:
专题一 回归分析问题
对所抽取的样本的数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.回归分析的过程就是建立回归模型的过程.具体步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画出散点图,观察它们是线性相关的,还是符合哪一种函数模型;③由经验确定回归方程的类型(如线性回归方程、反比例函数模型、指数函数模型、对数函数模型等);④用最小二乘法求回归方程;⑤检查回归模型的拟合程度,用相关系数r分析.
[例1] 在五块田地里,进行了小麦的对比试验.在同样的施肥和管理水平下,给出了小麦的基本苗数x和成熟期小麦的有效穗数y的数据如下:
基本苗数x
/(万株/亩)
15
25.5
30.0
36.6
44.4
有效穗数y
/(万株/亩)
39.4
42.9
41.0
43.1
49.2
求y对x的线性回归方程.
[解析] 制表:
i
1
2
3
4
5
合计
基本苗数x
15
25.5
30.0
36.6
44.4
151.5
有效穗数y
39.4
42.9
41.0
43.1
49.2
215.6
x
225
650.25
900
1 339.56
1 971.36
5 086.17
y
1 552.36
1 840.41
1 681
1 857.61
2 420.64
9 352.02
xiyi
591
1 093.95
1 230
1 577.46
2 184.48
6 676.89
=30.3,=43.12,
=5 086.17,=9 352.02,iyi=6 676.89
于是有b=
=≈0.29,
a=-b=43.12-0.29×30.3≈34.33.
线性回归方程为y=34.33+0.29x.
专题二 可线性化的回归分析
形如幂函数曲线y=axb,指数曲线y=aebx,倒指数曲线y=ae,对数曲线y=a+bln x等都可通过换元转化为线性回归方程,从而求出回归方程.
[例2] 某种书每册的成本费y(单位:元)与印刷册数x(单位:千册)有关,经统计得到数据如下:
x
1
2
3
5
10
y
10.15
5.52
4.08
2.85
2.11
x
20
30
50
100
200
y
1.62
1.41
1.30
1.21
1.15
检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系?如有,求出y对x的回归方程.
[解析] 首先作变量置换u=,题目所给数据变成如下表所示的10对数据:
u
1
0.5
0.2
0.1
0.05
0.02
0.01
0.005
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
然后作相关性检验,经计算得r≈0.999 8,从而认为u与y之间具有较强的线性相关关系.由计算器可得b≈8.973,a≈1.125,所以y=1.125+8.973u,最后回代u=,可得y=1.125+.
这就是题目要求的y对x的回归曲线方程.
专题三 独立性检验
独立性检验的一般步骤:
(1)根据样本数据列2×2列联表;
(2)根据公式计算χ2=;
(3)比较χ2与临界值的大小并作出判断.
[例3] 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如表所示:
积极支持
企业改革
不太赞成
企业改革
总计
工作积极
54
40
94
工作一般
32
63
95
总计
86
103
189[来源:Zxxk.Com]
对于人力资源部的研究项目进行分析,根据上述数据能否在犯错误的概率不超过0.005的前提下,认为对待企业改革的态度与其工作的积极性有关.
[解析] 由公式χ2=≈10.76.因为10.76>7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”有关,可以在犯错误的概率不超过0.005的前提下认为企业的全体员工对待企业改革的态度与其工作的积极性是有关的.
$