内容正文:
第八章成对数据的统计分析
第凡章
成对数据的统计分析
8.1成对数据的统计相关性
课程标准
素养解读
1.了解变量间的相关关系
1.通过相关关系的判断,提升数学建模与直观
2.会根据散点图判断数据是否具有相关关系
想象素养
3.能利用相关系数r判断两个变量线性相关程度的大小,
2.通过学习相关系数,培养数学运算的素养
从而判断回归直线方程拟合的效果
课前。预习学案
对应学生用书P88
[情境引入]
4.线性相关:如果两个变量的取值呈现正相关或负相
在中学校园里,有这样一种说法:“如果你的数学
关,而且散点落在一条直线附近,则称这两个变量
成绩好,那么你的物理学习就不会有什么大问题.”按
线性相关.
照这种说法,似乎学生的物理成绩与数学成绩之间存
2思考1,相关关系与函数关系有什么区别和联系?
在着某种关系.我们把数学成绩和物理成绩看成是两
提示:相关关系与函数关系辨析
个变量,那么这两个变量之间的关系是函数关系吗?
这两个变量之间相关关系如何?
分类
函数关系
相关关系
问题:什么是相关系数,如何计算,它有什么作用?
变量之间的关系
变量之间确实有一定
[知识梳理]
具有确定性,当
的关系,但没有达到
[知识点一]变量的相关关系
特征
一个变量确定
可以互相决定的程
1.两个变量的关系
后,另一个变量
度,它们之间的关系
分类
函数关系
相关关系
就确定了
带有一定的随机性
2.正相关与负相关是对所有具有相关关系的两个变
两个变量有关系,但又没有
量而言的,对吗?
两变量有
特征
确切到可由其中一个去精
提示:不对,正相关与负相关是针对线性相关关系
确定的关系
确地决定另一个的程度
而言的.
[知识点二]样本的相关系数
2.散点图:将样本中的每一个序号下的成对数据用直
1.相关系数:统计学里一般用
角坐标系中的点表示出来得到的统计图.
2(x,-x)(y,一y)
=1
3.正相关与负相关
正相关
负相关
xy:一y
=1
二来衡量y与x的线性
当一个变量的值增加
当一个变量的值增加时,
时,另一个变量的相应
另一个变量的相应值呈
√②x-)2-w
值也呈现增加的趋势
现减少的趋势
相关程度的强弱,这里的x称为样本相关系数(简
称相关系数).
·119
数学·选择性必修第三册
2.相关系数的性质
提示:(1)×两个变量的相关关系不是一种确定
(1)r>0时,成对数据正相关;r<0时,成对数据负相
的关系,是一种随机关系
关,-1≤r≤1.
(2)×相关系数r越接近1,线性相关程度越强;
(2)x越小,两个变量之间的线性相关程度越弱,r
r越接近0,线性相关程度越弱
越大,两个变量之间的线性相关程度越强,
(3)×存在相关关系的两个变量,当一个变量增
(3)=1时,成对数据构成的点都在一条确定的直
加时,另一个变量的相应值呈减少的趋势,则称这
线上
两个变量负相关
(4)/
?思考3.r的大小有何实际意义?
2.根据一组数据判断两个变量是否线性相关时,应选
提示:越小,两个变量之间的线性相关性越
弱;r越大,两个变量之间的线性相关性越强
A.茎叶图
B.频率分布直方图
[预习自测]
C.散点图
D.频率分布折线图
1.判断正误(正确的打“√”,错误的打“×”)。
解析:C[判断两个变量是否有线性相关关系时,
(1)两个变量的相关关系是一种确定的关系.
应先画出散,点图.若这些点大体分布在一条直线附
近则具有线性相关关系.]
(2)两个变量的相关系数越大,它们的相关程度
3.已知两个变量负相关,且相关程度很强,则它们的
越强。
)
相关系数的大小可能是
)
(3)当一个变量的值增加时,另一个变量的值随之
A.-0.95
B.-0.13
减少,则称这两个变量负相关
C.0.15
D.0.96
(4)一般地,样本容量越大,用样本相关系数估计两
解析:A[相关系数r<0时,成对数据负相关,且
个变量的相关系数的效果越好,
(
越大,两个变量之间的线性相关程度越强.]
●
课堂。
互动学案
对应学生课时P89
题型一
变量间相关关系的判断
[思路点拨]画出散点图进行判断
[例1](1)下列关系中,属于相关关系的是
解:①散点图如图
(填序号)
+水稻产量
①扇形的半径与面积之间的关系;
500
400
②农作物的产量与施肥量之间的关系;
300
●
③出租车费与行驶的里程;
200
④降雪量与交通事故的发生率之间的关系
100
[思路点拔依据相关关系的概念判断
05101520253035404550施化肥量
解析:在①中,扇形的半径与面积之间的关系是函
②从图中可以发现当施化肥量由小到大变化时,水
数关系;在②中,农作物的产量与施肥量之间不具
稻产量由小变大,图中的散点大致分布在一条直线
有严格的函数关系,但具有相关关系:③为确定的
的附近,因此施化肥量和水稻产量近似成线性相关
函数关系;在④中,降雪量与交通事故的发生率之
关系.结合实际可知,水稻产量只是在一定范围内
间具有相关关系。
随着施化肥量的增加而增长。
答案:②④
规律方法……
(2)下面是水稻产量与施化肥量的一组观测数据:
两个变量是否相关的两种判断方法
施化肥量
15
20
25
30
35
40
45
1.根据实际经验:借助积累的经验进行分析判断
水稻产量
320330360410460470480
2.利用散点图:通过散点图,观察它们的分布是
①将上述数据制成散点图,
否存在一定的规律,直观地进行判断.如果发
②你能从散点图中发现施化肥量与水稻产量具有
现点的分布从整体上看大致在一条直线附近,
什么关系吗?水稻产量会一直随施化肥量的增加
那么这两个变量就是线性相关的,注意不要受个
而增长吗?
别点的位置的影响
·120·
第八章成对数据的统计分析
◇[变式训练]
线,即它们线性相关,
1.1)下列两个变量之间,是相关关系的有(
(2)根据以上数据可由计算器计算得x=174.8,y
①角度与它的余弦值;②人的体重与视力;③正n
边形的边数和它的内角度数之和;④圆心角的大小
=21.7,x=805780,27=4729.5,,
与所对的圆弧长;⑤光照时间和果树亩产量;⑥收
2xy:-
10x y
入水平与购买能力;⑦正方体的棱长与体积.
37986.r
=1
A.①④⑥
B.②⑤⑥⑦
2x-10x2)(2y-10y2)
C.⑤⑥
D.③⑤⑦
37986-10×174.8×21.7
解析:C[①③④⑦是函数关系;②没有关系;⑤⑥
√/(305730-10×174.8)(4729.5-10×21.7)
是相关关系.]
54.4
(2)10对中国父子的身高(英寸)如下:
≈0.9,
√/179.6×20.6
父亲
故两者有很强的线性相关关系.
身高
60
62
64
66
66
67
68
70
72
74
规律方法
(x)
相关系数的关注点
1.相关系数可以反映两个变量之间的线性相关
儿子
身高63.665.2
66
65.566.967.167.468.370.170
程度,即散点集中于一条直线的程度,其符号
(y)
反映了相关关系的正负性.
2.变量间是否具有线性相关关系,可通过散点图
试根据上述资料:
①画出散点图;
或相关系数作出判断,散点图只是粗略作出判
②变量x和y之间是否具有线性关系?
断,用相关系数能够较准确的判断相关的程
③人们常说,父亲高,儿子肯定不矮,你赞成这种说
度
法吗?
◇[变式训练]
解:①图略,②由散点图可知,变量x和y之间有
2.关于两个变量x和y的7组数据如表所示:
线性相关关系
③不赞成.父亲的身高与儿子的身高是相关关系,
21
23
25
27
29
32
35
不是确定关系
7
11
21
24
66115325
题型二“相关系数与相关程度的判断
试判断y与x是否线性相关,并刻画它们的相关
[例2]一般来说,一个人的身高越高,他的手就越大,
程度
为调查这一问题,对某校10名高一男生的身高与
右手长度进行测量得到如下数据(单位:cm):
解:画散点图(图略),观察散点图,可以看出样本点
都集中在一条直线附近,由此判断y与x线性
身高168170171172174176178178180
181
相关。
右手
长度
19.020.021.021.521.022.023.024.022.523.0
d-号×(21+23+25+27+29+32+35)≈27.4
(1)判断两者有无线性相关关系;
(2)如果具有线性相关关系,判断相关性的强弱,
y=7×(7+11+21+24+66+115+325)≈81.3,
[思路点拨了作出散点图,判断线性相关性;根
=212+232+252+27+292+32+352=5414,
据公式求出相关系数,结论:
i=]
解:(1)散点图如图所示:
2x0,=21X7+23X11+25X21+27×24+29×
t右手长度(cm)
66+32×115+35×325=18542.
4
23
2y=7+112+212+24+66+152+325
xy.-7正y
0
124393.所以r
三1
19
2-7)(y-7)
0168170172174176178180182身高(cm)
18542-7×27.4×81.3
可见,身高与右手长度之间的总体趋势为一条直
W(5414-7×27.4)×(124393-7×81.3)
·121·
数学·选择性必修第三册
≈2948.66
3520.92≈0.8375.
03,10)
·E10,12)
所以y与x具有很强的线性相关关系.
C4,5)
[当堂达标]
.B2,4)
1.(多选)在下列各变量之间的关系中,属于相关关系
A(1,3)
x
的是
解析:当散点图中的点分布在一条直线附近时,样
A.汽车的重量和百公里耗油量
本数据有较强的线性相关关系,可知应去掉D组
B.正n边形的边数与内角度数之和
数据.
C.一块农田的小麦产量与施肥量
答案:D
D.家庭的经济条件与学生的学习成绩
5.现随机抽取某中学高一10名在校学生,他们入学
解析:AC[汽车的重量越大,百公里耗油量会越
时的数学成绩x与人学后第一次考试的数学成绩
多.在合适的范围内,农田的施肥量越大,小麦产量
一般会越多.A、C是相关关系.B是函数关系.D中
y如下表所示
家庭经济条件与学生的学习成绩之间不是相关关
学生号
2
3
4
5
6
8
9
10
系,也不是函数关系.门
12010811710410311010410599
108
2.甲、乙、丙、丁四位同学各自对A,B两变量的线性
相关性做试验,并用回归分析的方法分别求得相关
y
84
64
84
68
69
68
69
46
57
71
系数r如下表:
请问:这10名学生的两次数学成绩是否具有较强
甲
乙
丙
丁
的线性相关关系?
0.82
0.78
0.69
0.85
B(c,-x)(y,-y)
则
同学的试验结果体现A,B两变量有更
注:r
强的线性相关性
A.甲
B.乙
C.丙
D.丁
立xy:-nxy
解析:D[r的绝对值越接近1,相关性越强,故
选D.]
若r>0.75,则我们可以认为y与x之间具有较
3.变量X与Y相对应的一组数据为(10,1),(11.3,
强的线性相关关系,
2),(11.8,3),(12.5,4),(13,5);变量U与V相对
应的一组数据为(10,5),(11.3,4),(11.8,3),
解:由题意知,利用计算工具可得亚=0×(120十
(12.5,2),(13,1).r1表示变量Y与X之间的样本
108+117+104+103+110+104+105+99+108)
相关系数,r2表示变量V与U之间的样本相关系
数,则
(
)
=107.8y=0×(84+64+84+68+69+68+69
A.r2<r1<0
B.0<r2<r
+46+57+71)=68,=116584,2¥=47
C.r,<0<r
D.r2=r
解析:C[对变量X与Y而言,Y随X的增大而增
384,5y,=73796。
大,故变量Y与X正相关,即r1>0;对变量U与V
所以样本相关系数
而言,V随U的增大而减小,故变量V与U负相
73796-10×107.8×68
≈0.7506.
关,即r2<0.故r2<0<r1.]
√116584-10×107.8√/47384-10×68
4.如图所示,有A,B,C,D,E共5组数据,去掉
r>0.75,故我们可以认为y与x之间具有较强
组数据后,剩下的4组数据具有较强的线
的线性相关关系.
性相关关系.
即这10名学生的两次数学成绩具有较强的线性相关」
·122·
第八章成对数据的统计分析
课后。素养提升
对应学生课时P200
[基础过关]
A.变量x与y正相关,变量u与v负相关,变量x
1.下面变量之间是相关关系的是
与y的线性相关性较强
A.出租车费与行驶的里程
B.变量x与y负相关,变量u与v正相关,变量x
B.房屋面积与房屋价格
与y的线性相关性较强
C.人的身高与体重
C.变量x与y正相关,变量u与v负相关,变量u
D.铁的体积与质量
与ⅴ的线性相关性较强
解析:C[C是相关关系,A,B,D是函数关系.]
D.变量x与y负相关,变量u与v正相关,变量u
2.某校学生科研兴趣小组为了解1~12岁儿童的体
与v的线性相关性较强
质健康情况,随机调查了20名儿童的相关数据,分
解析:C[由线性相关系数r1=0.7859>0知x
别制作了肺活量、视力、肢体柔韧度、BMI指数和身
与y正相关,由线性相关系数r2=一0.9568<0知
高之间的散点图,则与身高之间具有正相关关系
u,o负相关,又r<r2|,所以变量u与v的线性
的是
(
)
相关性比x与y的线性相关性强,]
觉
视
5.(多选)以下各对变量成正相关的是
A.学生的学籍号与学生的数学成绩
.tgondddad
B.坚持每天吃早餐的人数与患胃病的人数
C.气温与冷饮销售量
身高
身高
D.电瓶车的质量和行驶每千米的耗电量
BMI
体柔韧度
otso
蝮
解析:CD[对于A,学生的学籍号与学生的数学
。
成绩没有相关关系;对于B,一般情况下,坚持每天
吃早餐的人数与患胃病的人数成负相关关系;对于
身高
0
身高
C,一般情况下,气温与冷饮销售量成正相关关系;
A.肺活量
B.视力
对于D,一般情况下,电瓶车的质量和行驶每千米
C.肢体柔韧度
D.BMI指数
的耗电量成正相关关系.]
解析:A[对于A,儿童的身高越高,其肺活量越
6.(多选)下列关于相关系数r的说法正确的是
大,肺活量与身高具有正相关关系,A正确;
(
对于B,儿童的视力随身高的增大先增大,后减小,
A.相关系数r越大两个变量间相关性越强
视力与身高不具有正相关关系,B错误;
B.相关系数r的取值范围为[一1,1]
对于C,肢体柔韧度随身高增大而减小,肢体柔韧
C.相关系数r>0时两个变量正相关,r<0时两个
度与身高不具有正相关关系,C错误;
变量负相关
对于D,BMI指数与身高的相关性很弱,不具有正
D.相关系数r=1时,样本点在同一直线上
相关关系,D错误.]
解析:BCD[根据相关系数的意义对每个结论进
3.两个变量负相关时,散点图的特征是
(
)
行分析、判断可得错误的结论.
A.点散布在从左下角到右上角的区域内
对于相关系数r,有以下结论:①当r>0时,表明两
B.点散布在某带形区域内
个变量正相关;当r<0时,表明两个变量负相关
C.点散布在某圆形区域内
②r的绝对值越接近于1,表明两个变量的线性相
D.点散布在从左上角到右下角的区域内
关性越强;r的绝对值越接近于0,表明两个变量之
解析:D[有负相关关系的各,点整体呈递减趋势,
间几乎不存在线性相关关系.
因此点应该散布在从左上角到右下角的区域内,]
对于A,当r<0时此结论不成立,所以A不正确.
4.对两个变量x,y进行线性相关检验,得到线性相关
对于B,由相关系数的性质可得一1≤r≤1,所以B
系数r1=0.7859,对两个变量u,v进行线性相关检
正确
验,得线性相关系数r2=一0.9568,则下列判断正确
对于C,由相关系数的性质可得正确】
的是
对于D,由相关系数的性质可得正确.故选BCD.]
·123·
数学·选择性必修第三册
7.下列两个变量之间具有相关关系的是
.(填
解析由已知得元=4十6十2十8+5=5,
序号)
5
①正方形的边长a和面积S;
4+4什3十5+4=4,文=3+6十2+5+4=4,将题
②一个人的身高h和右手一柞长x:
5
5
③真空中的自由落体运动其下落的距离h和下落
表中x,y,之的相关数据分别减去x,y,z,记a=
的时间t;
(2x1-x,x2-x,x3-x,x4一x,2x-x),b=(y1-
④一个的身高h和他的体重x
y,y:-y,ys-y,y-y,y5-y),c=(z-z,22-
解析:对于①,正方形的边长a和面积S是函数关
2,23-2,24-2,2-2).则a=(-1,1,-3,3,0),
系,不是相关关系;对于②,一般情况下,一个人的
b=(0,0,-1,1,0),c=(-1,2,-2,1,0).于是
身高五和右手一柞长x是正相关关系;对于③,真
cosa,b)
空中的自由落体运动其下落的距离五和下落的时
-1×0+1×0+(-3)×(-1)+3×1+0×0
间t是函数关系,不是相关关系;对于④,一般情况
√-1)+12+(-3)2+32+02×√02+0+(-1)+1+0
下,一个人的身高h和他的体重x是正相关关系.
答案:②④
25×50.9≈0.95,
8.已知求得甲、乙、丙3组不同数据的线性相关系数
-1×(-1D+1×2+(-3)×(-2)+3×1+0×0
c0sa,c〉
√-1y+P+(一3y++0×√-1)2+2+(-2y2+1+0
分别为0.81,-0.98,0.63,其中
(填甲、
12
乙、丙中的一个)组数据的线性相关性最强.
2√5×w10
32≈0.85,所以y与xx与x正
解析:两个变量y与x的相关系数的绝对值越接近
于1,它的线性相关性越强.在甲、乙、丙中,所给的
相关,又cos(a,b)>cos(a,c),则y与x之间的相
数值中|一0.98是最大的值,即乙的线性相关性
关性比之与x之间的相关性强,
最强
11.某厂的生产原料耗费x(单位:百万元)与销售额
答案:乙
y(单位:百万元)之间有如下的对应关系:
9.在一次试验中,测得(x,y)的四组值分别为(1,2),
(2,0),(4,一4),(一1,6),则y与x的相关系数为
y
30
40
50
解:法-:x=1.5,y=1,2x=22,=56,
=1
x与y之间是否具有线性相关关系?若有,判断
享y=一20,相关系数,
-20-4×1.5×1
相关性的强弱,
√/(22-4×1.5)(56-4×1)
=一1.
解:画出散点图如图所示,由图可知x,y有线性相
法二:观察四个点,发现其在一条单调递减的直线
关关系
上,故y与x的相关系数为一1.
10.近年来,“共享汽车”在我国各城市迅猛发展,为人
70
们的出行提供了便利,但也给城市交通管理带来
50
40
了一些困难.为了解“共享汽车”在M省的发展情
30
况,M省某调查机构从该省随机抽取了5个城市,
02468元
分别收集和分析了“共享汽车”的A,B,C三项指
x=5,y=47.5,2x2=120,2y=9900,
标数据xy之,(i=1,2,3,4,5),数据如表所示:
城市编号i
3
5
含=1080,
A指标x
8
5
立xy,-4y
i=1
B指标y
(2x-4)(2y-4y2)
C指标之
36
1080-4×5×47.5
≈0.9827.
利用向量夹角来分析y与x之间及之与x之间的
√/(120-4×5)(9900-4×47.5)
相关关系
故x与y之间具有很强的正相关关系.
·124
第八章成对数据的统计分析
[能力提升]
面积差异很大,从而各地块间这种鸟数量差异也
12.广阳岛,作为长江上游最大的江心岛,其面积在枯
很大,采用分层抽样的方法较好地保持了样本结
水期约为10平方公里.自2017年起,重庆市开始
构与总体结构的一致性,提高了样本的代表性,从
对广阳岛进行系统的生态修复,摒弃了曾经的商
而可以获得广阳岛这种鸟数量更准确的估计
业开发计划,转而建设“长江风景眼,重庆生态
答案:(1)700
岛”.经过数年的努力,广阳岛的生态得到了显著
(2)0.94
的改善,不仅植被丰富,生物多样性也得到了极大
(3)分层抽样:根据植物覆盖面积的大小对地块分
的提升.据监测,岛上的鸟类从生态修复前的124
层,再对50个地块进行分层抽样,理由见解析
种增加到213种,其中包括中华秋沙鸭、游隼、白
13.现随机抽取了某校10名学生在人学考试中的数
琵鹭等珍稀鸟类.为调查广阳岛某种鸟的数量,将
学成绩(x)与入学后的第一次考试数学成绩(y),
其分成面积相近的50个地块,从这些地块中用简
数据如表:
单随机抽样的方法抽取5个作为样区,调查得到
学生号12345678910
样本数据(xy:)(i=1,2,…,5),其中x和y:分
x
12010811710410311010410599108
别表示第i个样区的植被覆盖面积(单位:平方公
y84648468696869465771
里)和这种鸟的数量.
请问:这10名学生的两次数学考试成绩是否具有
1
2
3
4
5
显著的线性相关关系?
0.1710.152
0.1920.1890.196
解2=0120+108+…十9+108)=107.8
12
10
16
14
18
y=10(84+64+…+57+71)=68,
1
(1)求广阳岛这种鸟数量的估计值(这种鸟数量的
估计值等于样区这种鸟数量的平均数乘以地块数);
21202+108牛…+992+108=116
(2)求样本(x,y,)(i=1,2,…,5)的相关系数(精
=842+64++57+712=47384,
确到0.01);
=1
(3)根据统计资料,各地块间植物覆盖面积差异较
2xy,=120×84+108×64+…+108×71=
大.为提高样本的代表性以获得广阳岛这种鸟数
73796,
量更准确的估计,请给出一种你认为更合理的抽
所以,相关系数为
样方法,并说明理由。
73796-10×107.8×68
附:相关系数,r=
√/116584-10×107.82)(47384-10×682)
2(,-x)(y一)
≈0.7506,
=,2x=0.18,
故两次数学考试成绩有显著的线性相关关系.
[素养培优]
√2(,-2)2含0y-)≈0.232
14.为了监控某种医疗物资的一条生产线的生产过
程,检验员每隔30min从该生产线上随机抽取一
解析:(1)由已知得样本平均数y=
个医疗物资,并测量其尺寸(单位:cm).下面是检
12+10十16十14十18-14,从而广阳岛这种鸟数量
5
验员在一天内依次抽取的16个医疗物资的尺寸:
的估计值为14×50=700.
抽取
4
(2)z=0.18,y=14,(a,-7)(y-y)=0.009×
次数
医疗物
9.9510.129.969.9610.019.929.9810.04
2+0.028×4+0.012×2+0.016×4=0.218,
资尺寸
故祥本的相关系敦,≈028≈0.94
抽取
0.232
10
13
可
15
次数
(3)分层抽样:根据植物覆盖面积的大小对地块分
医疗物
层,再对50个地块进行分层抽样.
10.269.9110.1310.029.22
10.0410.059.95
资尺寸
理由如下:由(2)知各样区的这种鸟数量与植物覆
盖面积有很强的正相关,由于各地块间植物覆盖
经计算得x=
1
x:=9.97,
16=1
·125
数学·选择性必修第三册
s√2,2-1
2(x,-x)(y-
≈0.212,(i-8.5)≈18.439,
解:(1)由样本数据得(x,i)(i=1,2,3,…,16)的
总i≈1591.137,2(,-7)i-85)=-2.78,
相关系数为
其中x,为抽取的第i个医疗物资的尺寸,i=1,2,
3,…,16.
(x,-x)(i-8.5)
7
(1)求(x,i)(i=1,2,…,16)的相关系数r,并回
答是否可以认为这一天生产的医疗物资尺寸不随
-2.78
生产过程的进行而系统地变大或变小(若|r<0.
≈-0.18;
0.212×√16×18.439
25,则可以认为医疗物资尺寸不随生产过程的进
由于|r<0.25,因此可以认为这一天生产的医疗
行而系统地变大或变小).
物资尺寸不随生产过程的进行而系统地变大或
(2)一天内抽检医疗物资中,如果出现了尺寸在(x
变小
一3s,x十3s)之外的医疗物资,就认为这条生产线
在这一天的生产过程中可能出现了异常情况,需
(2)由于x=9.97,s≈0.212,
对当天的生产过程进行检查.从这一天抽检的结
由样本数据可以看出抽取的第13个零件的尺寸
果看,是否需对当天的生产过程进行检查?
在(x一3,十3s)以外,因此需对当天的生产过程
附:样本(x,y:)(i=1,2,…,n)的相关系数r
进行检查.
8.2一元线性回恒模型及其应用
课程标准
素养解读
1.结合具体实例,了解一元线性回归模型的含义,了解模
1.通过一元线性回归模型的分析,培养数学抽象,
型参数的统计意义,了解最小二乘原理,掌握一元线性
逻辑推理素养
回归模型参数的最小二乘估计方法,会使用相关的统
2.通过求经验回归方程、残差和决定系数,提升数
计软件。
学运算,数据分析素养」
2.针对实际问题,会用一元线性回归模型进行预测
课前。预习学案
对应学生用书P92
[情境引入]
2思考1.具有相关关系的两个变量,其样本点散布
如果刑警在案发现场提取到罪
在某一条直线y=b.x十a的附近,可以用一次函数
犯的脚印,那将获得一条重要的破
案线索,你能说明一下其中的原
y=bx十a来描述这两个变量之间的关系吗?
因吗?
提示:不能
[知识梳理]
[知识点二]最小二乘法与经验回归方程
[知识点一]一元线性回归模型
1.最小二乘法
一元线性回归模型的完整表达式为
y=ix十a称为y关于x的经验回归方程,也称经
Y=bx+ate,
其中Y称为因变量或响应变量,
验回归函数或经验回归公式,其图形称为经验回归
E(e)=0,D(e)=o2,
x称为自变量或解释变量;a,b为模型的未知参数,e
直线.这种求经验回归方程的方法叫做最小二乘
是Y与bx十a之间的随机误差,
法,求得的i,a叫做b,a的最小二乘估计.
·126·