内容正文:
8.2.2 一元线性回归模型参数的最小二乘估计(第2课时)
教学设计
1、 教学目标
1. 进一步掌握一元线性回归模型参数的统计意义,会用相关统计软件.
2. 了解非线性回归模型.
3. 会通过分析残差和利用R2判断回归模型的拟合效果.
2、 教学重难点
重点:(1)进一步掌握一元线性回归模型参数的统计意义,会用相关统计软件;
(2)会通过分析残差和利用R2判断回归模型的拟合效果
难点:了解非线性回归模型.
3、 学情分析与教材分析
1. 学情分析:
学生已经具备了一定的数学基础,包括概率论的基本概念、离散型随机变量的分布以及初步的统计分析能力.他们之前已经学习了一元线性回归模型的基本概念,理解了模型参数的统计意义,并掌握了如何通过散点图判断两个变量之间的线性相关关系.
然而,学生在面对具体的一元线性回归模型参数估计时,可能会遇到一些挑战.一方面,最小二乘估计的原理和计算过程相对复杂,需要学生具备较强的数学运算能力和逻辑推理能力.另一方面,学生可能难以将理论知识与实际应用相结合,不知道如何运用最小二乘法解决实际问题.
针对这些学情特点,教师在教学过程中应注重以下几点:一是通过实例引入,帮助学生直观理解最小二乘估计的原理和计算过程;二是结合实际问题,引导学生运用所学知识进行模型构建和分析;三是注重课堂互动,鼓励学生积极参与讨论和提问,以提高他们的学习兴趣和动力.同时,教师还应关注学生的个体差异,针对不同层次的学生给予个性化指导,确保每位学生都能跟上教学进度,并能在实践中灵活运用所学知识.
.
2. 教材分析:
本节课选自《2019人教A版高中数学选择性必修第三册》第八章《成对数据的统计分析》,本节课主要学习《一元线性回归模型参数的最小二乘估计(第2课时)》.
本节内容在一元线性回归模型的基础上,深入探讨了如何通过最小二乘法估计模型参数,旨在提升学生的数据处理与分析能力.
教材首先通过回顾一元线性回归模型的基本概念,引导学生理解模型参数(截距和斜率)的统计意义.随后,教材详细介绍了最小二乘法的原理,即通过最小化误差平方和来找到最佳拟合直线,这一方法体现了统计思想中的优化原则.
在内容编排上,教材注重理论与实践的结合.通过具体案例,教材展示了如何利用最小二乘法进行参数估计,并强调了这一方法在实际问题中的应用价值.同时,教材还通过残差分析等手段,帮助学生评估模型的拟合效果,进一步加深对最小二乘法的理解.
此外,教材还注重培养学生的数学核心素养,如数据分析、逻辑推理和数学建模等.通过本节课的学习,学生不仅能够掌握最小二乘估计的方法,还能提升从数据中提取信息、建立模型并进行预测的能力,为后续学习更复杂的统计模型打下坚实的基础.
总体而言,本节教材内容设计合理,逻辑清晰,既注重理论知识的讲解,又强调实践应用的培养,有助于提升学生的数学素养和解决实际问题的能力.
4、 教学过程
1.复习回顾,引入新知
1. 经验回归方程:
我们将称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线. 这种求经验回归方程的方法叫做最小二乘法.
2. 最小二乘估计:经验回归方程中的参数计算公式为:
2.探究新知
例题:经验表明,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高,在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据(表8.2-3),试根据这些数据建立树高关于胸径的经验回归方程.
师生:共同分析,因为要由胸径预测树高,所以要以成对样本数据的胸径为横坐标、树高为纵坐标描出散点,进而得到散点图,再根据散点图推断树高与胸径是否线性相关.如果是,再利用公式(2)计算出,即可.
要求:以胸径为横坐标、树高为纵坐标,画出散点图
学生:根据表格数据,画出散点图
预设:
要求:用d表示胸径,表示树高,借助计算器,利用最小二乘法,计算出经验回归方程
学生:根据上节课所学内容, 求得经验回归方程:,相应的经验回归直线如下图所示
要求:根据经验回归方程,借助计算器,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,列出表格.
学生:按要求完成表格;
预设:
要求:以胸径为横坐标,残差为纵坐标,作出残差图.并观察残差图,得出怎样的结论
学生:按要求做出额残差图.并观察分析残差图得出结论.
预设:
观察残差表和残差图,可以看到,残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高.
跟踪练习:某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:
单价𝑥(元)
8
8.2
8.4
8.6
8.8
9
销量𝑦(件)
90
84
83
80
75
68
(1)求经验回归方程 ̂,其中,
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入−成本)
学生:独立思考,并完成跟踪练习,做好分享答案的准备.
教师:巡视,查看学生做跟踪练习的情况,典型答案和错误拍照展示
预设:(1)据题意,得:
,所以经验回归方程为.
(2)工厂获得的利润,
由二次函数知识可知当时,(元).故该产品的单价应定为8.25元.
教师:研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系.
当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性经验回归方程.
问题:人们常将男子短跑100 m的高水平运动员称为“百米飞人”.表8.2-5给出了1968年之前男子短跑100 m世界纪录产生的年份和世界纪录的数据,试依据这些成对数据,建立男子短跑100 m世界纪录关于纪录产生年份的经验回归方程.
编号
1
2
3
4
5
6
7
8
年份
1896
1912
1921
1930
1936
1956
1960
1968
记录/s
11.80
10.60
10.40
10.30
10.20
10.10
10.00
9.95
要求:以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,并观察散点图的特点.
学生:根据要求作好散点图,并观察散点图,得出散点图的特点.
预设:
在图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.
要求:根据经验回归方程公式,借助计算器,求出经验回归方程.
学生:求得经验回归方程
预设: ①
要求:将以上回归方程对应的图象, 画入以上散点图中.
预设:将经验回归直线叠加到散点图,得到下图.
观察:从图8.2-13中可以看到,经验回归方程①较好地刻画了散点的变化趋势,请再仔细观察图形,你能看出其中存在的问题吗?
预设:由图形可知,第一点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方. 这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.
思考:如何修改模型,以使其更好地反映散点的分布特征吗?
预设:仔细观察图8.2-12,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近.回顾已有的函数知识,可以发现函数的图象具有类似的形状特征.注意到100 m短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线的周围,其中,为未知的参数,且.
教师:用上述函数刻画数据变化的趋势,这是一个非线性经验回归函数,其中,是待定系数.现在问题转化为如何利用成对数据估计参数和.
为了利用一元线性回归模型估计参数和,我们引进一个中间变量x,令.通过,将年份变量数据进行变换,得到新的成对数据:
编号
1
2
3
4
5
6
7
8
x
0.00
2.83
3.26
3.56
3.71
4.11
4.17
4.29
Y/s
11.80
10.60
10.40
10.30
10.20
10.10
10.00
9.95
要求:通过换元,得到新的线性回归模型:,利用以上数据表,求出参数和..
学生:借助计算器,求得新的经验回归方程.
预设:
要求:将代入式,得到由创纪录年份预报世界纪录的经验回归方程
预设: ②
教师:借助计算机,在同一坐标系中画出成对数据散点图、非线性经验回归方程②的图象(蓝色)以及经验回归方程①的图象(红色),如下图所示,观察新的图象得出结论.
结论:表明非线性经验回归方程②对于原始数据的拟合效果远远好于经验回归方程①.
要求:通过残差来比较这两个经验回归方程对数据刻画的好坏.计算两个方程对应残差表
预设:
编号
1
2
3
4
5
6
7
8
t
1896
1912
1921
1930
1936
1956
1960
1968
0.591
-0.284
-0.301
-0.218
-0.196
0.111
0.092
0.205
-0.001
0.007
-0.012
0.015
-0.018
0.052
-0.021
-0.022
要求:计算残差平方和,并且比较大小,
学生:借助计算器,计算两个方程的残差平方和.
预设:,.
结论:可知小于.因此在残差平方和最小的标准下,非线性回归模型
的拟合效果要优于一元线性回归模型的拟合效果.
教师:也可以用决定系数来比较两个模型的拟合效果,的计算公式为
在表达式中,与经验回归方程无关,残差平方和与经验回归方程有关.因此越大,表示残差平方和越小,即模型的拟合效果越好;越小,表示残差平方和越大,即模型的拟合效果越差.
要求:根据决定系数的定义,求得以上两个回归方程的决定系数.比较大小得出结论.
学生:借助计算器计算得出结果,并比较大小得出结论.
预设:由表8.2-7容易算出经验回归方程①和②的分别约为0.7325和0.9983,因此经验回归方程②的刻画效果比经验回归方程①的好很多.
总结:在使用经验回归方程进行预测时,需注意以下问题
1.回归方程只适用于我们所研究的样本的总体;
2.我们所建立的回归方程一般都有时间性;
3.样本采集的范围会影响回归方程的适用范围;
4.不能期望回归方程得到的预报值就是预报变量的精确值. 事实上, 它是预报变量的可能取值的平均值.
3.能力提升
类型一: 利用决定系数R2刻画回归效果
例题1 已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求y对x的回归直线方程,并说明回归模型拟合效果的好坏. (若R2>0.9,则认为回归模型拟合效果很好)
预设:(14+16+18+20+22)=18,(12+10+7+5+3)=7.4,
=142+162+182+202+222=1660,=14×12+16×10+18×7+20×5+22×3=620,
所以,=7.4+1.15×18=28.1,
所以所求回归直线方程是=-1.15x+28.1.
列出残差表:
yi-
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以,,=53.2,R2=1-≈0.994>0.9,
所以回归模型的拟合效果很好.
总结:“R2、残差图”在回归分析中的作用
(1)R2是用来刻画回归模型拟合效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.
(2)残差图也是用来刻画回归模型拟合效果的,判断依据是残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.
题型二:非线性回归分析
例题2红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度的8组观测数据,制成图l所示的散点图,现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:表中;;;
25
2.9
646
168
422688
50.4
70308
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)求出关于的回归方程.附:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计分别为,,
预设:(1)模型①更合适.
模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,
所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适.
(2)令与温度x可以用线性回归方程来拟合,则.
于是, ,
因此关于的线性回归方程为,即,
所以产卵数y关于温度x的回归方程为
归纳总结:解决非线性经验回归问题的方法及步骤
(1)确定变量:确定解释变量为x,响应变量为y;
(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数、反比例函数等)作比较,选取拟合效果好的函数模型;
(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;
(4)分析拟合效果:通过计算决定系数来判断拟合效果;
(5)写出非线性经验回归方程.
4.课堂小结
设计意图:通过总结,让学生进一步巩固本节所学内容,提高概括能力.
5.随堂限时小练
1.下列说法中正确的是( )
①相关系数用来衡量两个变量之间线性关系的强弱, 越接近于,相关性越弱;
②回归直线一定经过样本点的中心;
③随机误差满足,其方差的大小用来衡量预报的精确度;
④相关指数用来刻画回归的效果,越小,说明模型的拟合效果越好.
A.①② B.③④ C.①④ D.②③
【详解】①相关系数用来衡量两个变量之间线性关系的强弱,越接近于,相关性越强,故错误
②回归直线一定经过样本点的中心,故正确
③随机误差满足,其方差的大小用来衡量预报的精确度,故正确
④相关指数用来刻画回归的效果,越大,说明模型的拟合效果越好,故错误
综上,说法正确的是②③. 故选:D.
2.甲、乙、丙、丁四位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和如下表:
甲
乙
丙
丁
散点图
残差平方和
115
106
124
103
哪位同学的实验结果体现拟合A,B两变量关系的模型拟合精度高?( )
A.甲 B.乙 C.丙 D.丁
【详解】根据散点图中各样本点条状分布越均匀,同时保持残差平方和越小,其线性回归模型的拟合效果就越好;(对于已经获取的样本数据,表达式中为确定的数,则残差平方和越小,越大),由此知丁同学的线性回归模型的拟合效果最好.
故选:D.
3.
在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得线性回归方程为,则该模型的非线性回归方程为 .
【详解】由回归直线方程,得:,
整理得:,所以该模型的回归方程为. 故答案为: .
4.
假定小麦基本苗数与成熟期有效穗之间存在相关关系,今测得5组数据如下:
x
15.0
25.58
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
(1)以 为解释变量,为预报变量,作出散点图;
(2)求与之间的回归直线方程,对于基本苗数56.7预报其有效穗;
(3)计算各组残差,并计算残差平方和;
(4)求,并说明残差变量对有效穗的影响占百分之几.
【详解】(1)建立坐标系轴为小麦基本苗数, 轴为成熟期有效穗.
根据各组值点出每个点,如图所示:
(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
设回归方程为,
由图表得,,
,,,,
则,,故所求的线性回归方程为.
当时,. 所以预报成熟期有效穗为51.151.
(3)由(2)得,因为,可以算得解得, ,,,.
残差平方和:.
(4)总偏差平方和:,回归平方和:,所以.
所以解释变量小麦基本苗数对总效应贡献了约. 残差变量贡献了约.
5.某企业为确定下一年投入某种产品的研发费用,需了解年研发费用(单位:千万元)对年销售量(单位:千万件)的影响,统计了近10年投入的年研发费用与年销售量的数据,得到散点图如图所示.
(1)利用散点图判断和(其中均为大于0的常数)哪一个更适合作为年销售量和年研发费用的回归方程类型(只要给出判断即可,不必说明理由);
(2)对数据作出如下处理,令,得到相关统计量的值如表:根据第(1)问的判断结果及表中数据,求关于的回归方程;
15
15
28.25
56.5
【详解】(1)由散点图可知,选择回归类型更合适;
(2)对两边取对数,得,即.
由表中数据求得,.
令,则,即.
∴年销售量与年研发费用的回归方程为
6.课后作业布置
作业1:完成教材: 第121页 习题8.2第4题
作业2:配套辅导资料对应的《一元线性回归模型参数的最小二乘估计》.
7.课后作业答案
练习(第120页)
1.在回归分析中,分析残差能够帮助我们解决哪些问题?
1.【解析】分析残差可以帮助我们解决以下几个问题:
(1)寻找残差明显比其他残差大很多的异常点,如果有,检查相应的样本数据是否有错.
(2)分析残差图可以诊断选择的模型是否合适,如果不合适,可以参考残差图提出修改模型的思路.
2.1997-2006年我国的国内生产总值(GDP)的数据如下:
年份
GDP/亿元
年份
GDP/亿元
1997
79 715. 0
2002
121 717.4
1998
85 195.5
2003.
137 422. 0
1999
90 564.4
2004
161 840. 2
2000
100 280.1
2005
187 318. 9
2001
110 863.1
2006
219 438.5
(1)作GDP和年份的散点图,根据该图猜想它们之间的关系可以用什么模型描述;
(2)建立年份为解释变量,GDP为响应变量的一元线性回归模型,并计算残差;
(3)根据你得到的一元线性回归模型,预测2017年的GDP,看看你的预测值与实际的GDP的误差是多少;
(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由
(5)随着时间的发展,又收集到2007—2016年的GDP数据如下:
年份
GDP/亿元
年份
GDP/亿元
2007
270 232. 3
2012
540 367. 4
2008
319 515. 5
2013
595 244.4
2009
349 081.4
2014
643 974. 0
2010
413 030. 3
2015
689 052.1
2011
489 300. 6
2016
744 127. 2
建立年份(1997-2016)为解释变量,GDP为响应变量的经验回归方程,并预测2017年的GDP,与实际的GDP误差是多少?你能发现什么?
2.【解析】(1)画GDP与年份的散点图,如图所示,可以观察到随着年份的增加GDP也随之增加,GDP值与年份呈现近似线性关系,可以用一元线性回归模型刻画.
(2)用表示GDP的值,表示年份,用一元线性回归模型拟合数据,用统计软件计算,得到经验回归方程为,残差的计算结果见下表.
年份
1997
1998
1999
2000
2001
残差
17 126
7 752
-1 734
-6 873
-11 145
年份
2002
2003
2004
2005
2006
残差
-15 145
-14 296
-4 732
5 892
23 157
(3)2017年的GDP预报值为359684亿元,2017年的实际的GDP为820754亿元,预测值比实际值少461070亿元.
(4)上面建立的回归方程的,说明在1997-2006年内,该模型年份能够解释92.13%的GDP值变化,因此所建立的模型较好地刻画了GDP和年份的关系.但因为残差呈现一定的规律性,中间是负数,两边是正数,所以可以考虑用非线性回归模型拟合数据.
(5)仍用表示GDP的值,表示年份,用一元线性回归模型拟合1997-2016年的数据,用统计软件计算,得到经验回归方程为.利用上述模型,预测2017年的GDP值为704025亿元,而2017年GDP的实际值820754亿元,预测值比实际值少116729亿元.
通过两个模型预测2017年的GDP值,发现第2个模型预测的更准确,说明建立的模型自变量的取值范围决定了模型的适用范围,通常不能超出太多,否则会出现较大的误差.
习题8.2(第120页)
1.如果散点图中所有的散点都落在一条斜率为非0的直线上,请回答下列问题:
(1)解释变量和响应变量的关系是什么?
(2)是多少?
1.【解析】(1)解释变量和响应变量是线性函数关系.
(2).
2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如表所示.
零件数/个
10
20
30
40
50
60
70
80
90
100
加工时间/min
62
68
75
81
89
95
102
108
115
122
(1)画出散点图;
(2)建立加工时间关于零件数的一元线性回归模型;
(3)关于加工零件的个数与加工时间,你能得出什么结论?
2.(1)散点图如图所示.
(2)用表示零件加工时间,表示零件数.利用统计软件计算,得到经验回归方程为
.
(3)零件数每增加一个,加工时间平均增加.
3.根据8.1.2节例2中某城市居民年收入与A商品销售额的数据:
(1)建立A商品销售额关于居民年收入的一元线性回归模型;
(2)如果这座城市居民的年收入达到40亿元,估计A商品的销售额是多少.
3.(1)先画A商品销售额与居民年收入的散点图,如图所示.用表示A商品销售额,x表示居民年收入,利用统计软件计算,得到经验回归方程为.
(2)如果这座城市居民年收入达到40亿元,估计A商品的销售额约为万元.
4.人口问题是关乎国计民生的大问题.下表是1949—2016年我国的人口总数(摘自中国统计年鉴—2017)
年份
总人口 /万人
年份
总人口 /万人
年份
总人口 /万人
1949
54 167
1982
101 654
2000
126 743
1950
55 196
1983
103 008
2001
127 627
1951
56 300
1984
104 357
2002
128 453
1955
61 465
1985
105 851
2003
129 227
1960
66 207
1986
107 507
2004
129 988
1965
72 538
1987
109 300
2005
130 756
1970
82 992
1988
111 026
2006
131 448
1971
85 229
1989
112 704
2007
132 129
1972
87 177
1990
114 333
2008
132 802
1973
89 211
1991
115 823
2009
133 450
1974
90 859
1992
117 171
2010
134 091
1975
92 420
1993
118 517
2011
134 735
1976
93 717
1994
119 850
2012
135 404
1977
94 974
1995
121 121
2013
136 072
1978
96 259
1996
122 389
2014
136 782
1979
97 542
1997
123 626
2015
137 462
1980
98 705
1998
124 761
2016
138 271
1981
100 072
1999
125 786
(1)画出散点图;
(2)建立总人口数关于年份的一元线性回归模型;
(3)直接用上面建立的回归模型预测2020年的我国人口总数,得到的结果合理吗?为什么?
4.(1)画人口总数与年份的散点图,如图所示.
(2)用表示人口总数,表示年份.利用统计软件计算,得到经验回归方程.
(3)利用经验回归方程得到2020年我国人口总数的预测值为149850万人.得到的这个预测结果不合理.将拟合直线画在散点图上,可以看到,2000年以后,我国人口总数的增长速度逐渐平稳且呈下降趋势,因此运用上述经验回归模型预测2020年我国的人口总数会出现高估.也可以通过观察残差图,看到残差具有中间为正,两边为负的特点.可以考虑用其他统计模型拟合数据.
5.在某地区的一段时间内观测到的不小于某震级x的地震数N的数据如下表:
震级x
3.0
3.2
3.4
3.6
3.8
4.0
4.2
4.4
4.6
4.8
5.0
地震数N
28 381
20 380
14 795
10 695
7 641
5 502
3 842
2 698
1 919
1 356
973
震级x
5.2
5.4
5. 6
5.8
6.0
6.2
6.4
6.6
6.8
7.0
地震数N
746
604
435
274
206
148
98
57
41
25
试建立经验回归方程表示二者之间的关系,该模型对预测地震有帮助吗?
5.先画地震数与震级的散点图,如图(1)所示.
从散点图可以看出,震级与不小于该震级的地震数之间不线性相关.从图中可以看出,随着的增加,所考察的地震数近似地以指数形式衰减.作变换,得到的数据见下表.
震级x
3.0
3.2
3.4
3.6
3.8
4.0 4.2
4.2
4.4
4.6
4.8
5.0
y
4.453
4.309
4.170
4.029
3.883
3.741
3.585
3.431
3.283
3.132
2.988
震级x
5.2
5.4
5.6
5.8
6.0
6.2
6.4
6.6
6.8
7.0
—
y
2.873
2.781
2.638
2.438
2.314
2.170
1.991
1.756
1.613
1.398
一
和的散点图如图(2)所示.从这个散点图中可以看出和之间有很强的线性相关性,因此可以用一元线性回归模型拟合它们之间的关系.
利用统计软件计算,可得模型参数的最小二乘估计,,从而经验回归方程为.其决定系数,说明可以解释的99.73%的变化.因此可以用经验回归方程描述和之间的关系.该模型不能直接用于预报地震,因为它不能预报何时发生地震,震级是多少.
6.生活中有许多变量之间的关系是值得我们去研究的.例如,数学成绩、物理成绩和化学成绩两两之间是相关的吗?哪两个学科成绩之间相关性更大,你能解释其中的原因吗?语文成绩对数学成绩有影响吗?等等,请用你们班的某次考试成绩,研究它们之间的关系如果它们之间有关系,请建立统计模型进行分析.
2 / 2
学科网(北京)股份有限公司
$$