内容正文:
§1 回归分析
1.1~1.2 回归分析 相关系数
●趣味导入
据报道,2017年8月8日21时19分四川省阿坝州九寨沟县发生7.0级地震,震源深度20 km.截止到2017年8月18日09时00分,共记录地震总数为5 020个.其中7.0~7.9级地震1个,6.0~6.9级地震0个,5.0~5.9级地震3个,3.0~3.9级地震28个.
问:你知道地震的震级与地震次数之间有什么关系吗?
●学案导引
知识点一
回归分析的思想
了解
1.如果我们把n个样本数据(x1,y1),(x2,y2),…,(xn,yn),以x为横坐标,y为纵坐标,在xOy平面上描成点,就构成了散点图.那么回归方程y=bx+a代表的直线f(x)=bx+a和观测数据点的偏差yi-(bxi+a)]2是xOy平面上所有直线和观测数据点的偏差中最小的.回归直线经过点(,),=i,=i.
2.回归分析的基本步骤是画散点图,求回归直线方程,并用回归直线方程进行预报.
3.对于一组具有线性相关关系的数据(xi,yi)(i=1,2,…,n),回归方程为y=bx+a,其中b==,a=-b.
●思考探究
相关关系与函数关系有何异同?
提示 (1)不同点:①函数关系是一种确定性关系,相关关系是一种非确定性关系;
②函数关系是两个随机变量间的关系,相关关系是非随机变量与随机变量间的关系;
③函数关系是一种因果关系,相关关系不一定是因果关系,也可能是伴随关系.
(2)相同点:两者均是指两个变量间的关系.
知识点二
相关系数
理解
样本相关系数的具体计算公式为:
r==,
r的取值在[-1,1]之间,|r|越接近于1,误差Q越小,两个变量的线性相关性越强;|r|越接近于0,Q越大,变量之间的线性相关程度越低.当r>0时,两个变量的值总体上呈现出同时增加的趋势,此时称两个变量正相关;当r<0,称两个变量负相关;当r=0时,称两个变量线性不相关.
●思考探究
如何由样本的相关系数:
r=,判定两变量的相关性?
提示 当r>0时, 表明两个变量正相关;当r<0时,表明两个变量负相关;r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.
类型一 利用散点图分析相关性
[例1] 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如下表所示:
x/秒
5
10
15
20
30
40
50
60
y/微米
6
10
11
13
16
17
19
23
(1)画出数据的散点图;
(2)根据散点图,你能得出什么结论?
[思路点拨] 先建系,再根据列表描点,最后判断这些散点是否分布在某条直线附近,得出结论.
[自主解答] (1)如下图所示:
(2)结论:设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表变量x与y之间的关系.
[方法探究]
散点图能帮助我们发现变量之间的线性关系,直观地反映了数据的变化规律.
●变式训练
1.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽取10个企业的产量与生产费用作样本,有如下资料:
产量x/千件
生产费用y/千元
产量x/千件
生产费用y/千元
40
150
79
162
42
140
88
185
48
160
100
165
55
170
120
190
65
150
140
185
对这两个变量之间是否线性相关进行相关性检验.
解析
i
xi
yi
x
y
xiyi
1
40
150
1 600
22 500
6 000
2
42
140
1 764
19 600
5 880
3
48
160
2 304
25 600
7 680
4
55
170
3 025
28 900
9 350
5
65[来源:学科网]
150
4 225
22 500
9 750
6
79
162
6 241
26 244
12 798
7
88
185
7 744
34 225
16 280
8
100
165
10 000
27 225
16 500
9
120
190
14 400
36 100
22 800
10
140
185
19 600
34 225
25 900
∑
777
1 657
70 903
277 119
132 938
=77.7,=165.7,x=70 903,
y=277 119,xiyi=13