内容正文:
9.1 线性回归分析
9.1.2 线性回归方程
1
【课标要求】
1.了解随机误差,并能分析判断线性回归模型的拟合效果.
2.结合实例,根据散点图,判断两个变量是否具有相关关系;
3.了解最小二乘法原理,会求线性回归方程,并能根据线性回归方程进行预测.
2
要点深化·核心知识提炼
3
知识点1.线性回归问题
1.随机误差
具有线性相关关系的两个变量的取值,,的值不能由完全确定,将, 之间的关
系表示为,其中是确定性函数, 称为随机误差.
称为线性回归模型.
2.回归直线和线性回归方程
直线 称为回归直线,此直线方程即为线性回归方程.
其中称为回归截距,称为回归系数, 称为回归值.
4
名师点睛
1.随机误差产生的主要原因
(1)所用的确定性函数不恰当引起的误差;
(2)忽略了某些因素的影响;
(3)存在观测误差.
2.线性回归模型中, 值的求法
(1),的估计值为,,则, .
(2)线性回归方程必经过样本点的中心 .
5
知识点2.非线性回归问题
解非线性回归分析问题的一般步骤
有些非线性回归分析问题并不给出函数,这
时我们可以根据已知数据画出散点图,把它与学
过的各种函数(幂函数、指数函数、对数函数
等)的图象进行比较,挑选一种跟这些散点拟合
得最好的函数,然后用适当的变量进行变换,把
问题转化为线性回归分析问题,使之得到解决.
一般步骤为
6
名师点睛
由于涉及的数据比较多,考虑可操作性,相关题目往往会给出散点图,或将画散点图这
一步骤省略,只需要选一些数据,画一下草图,作出判断即可,并且相关数据都会直接给出.
7
题型分析·能力素养提升
8
【题型一】求线性回归方程
例1 某研究机构对高三学生的记忆力和判断力 进行统计分析,得下表数据:
6 8 10 12
2 3 5 6
9
(1)请根据上表数据画出散点图;
解 散点图如图:
10
(2)请根据上表提供的数据,建立关于 的线性回归方程.
相关公式:, )
解 由(1)中散点图可推断出与 线性相关.
因为,, ,
,代入公式,求得回归系数
, ,
所以线性回归方程为 .
11
规律方法 (1)求线性回归方程:
①利用公式,求出,的最小二乘估计, .
②待定系数法:利用线性回归直线过求, .
(2)利用线性回归方程进行预测:把线性回归方程看作一次函数,求函数值.
(3)利用线性回归直线判断正、负相关:决定正相关还是负相关的是 的值.
12
跟踪训练1 为缓解医疗用品的短缺,各医疗单
位都加紧了医疗用品的生产.某医疗器械厂统计
了口罩生产车间每名工人的生产速度,并将所得
数据分成五组,绘制出如图所示的频率直方图.
13
(1)估计口罩生产车间工人生产速度的中位数(结果写成分数的形式);
解 由频率直方图可知, ,
解得 .
, ,
中位数位于 之间.
设中位数为 ,
则,解得 .
14
(2)为了解该车间工人的生产速度是否与他们的工作年限有关,现从车间所有工人中
随机调查了5名工人的生产速度以及他们的工龄(参加工作的年限),所得数据如下:
工龄 年 4 6 8 10 12
生产速度 (件/小时) 42 57 62 62 67
根据上表数据求每名工人的生产速度关于他的工龄的线性回归方程 .
附:, .
15
解 由题意得 ,
,
, ,
关于的线性回归方程为 .
【题型二】利用线性回归方程对总体进行估计
例2 某市从2017年起每年在国庆期间都举办一届国际水上狂欢节,该市旅游部门将前
五届水上狂欢节期间外地游客到该市旅游的人数统计如下表:
年份 2017 2018 2019 2020 2021
水上狂欢节编号 1 2 3 4 5
外地游客人数 (单位:十万) 0.6 0.8 0.9 1.2 1.5
17
(1)求关于的线性回归方程 ;
解 因为,,, ,所以
, .
综上,线性回归方程为 .
18
(2)该市旅游部门估计,每位外地游客可为该市增加100元旅游收入,请利用(1)
的线性回归方程,预测2023年第七届国际水上狂欢节期间外地游客可为该市增加多少
旅游收入.
参考公式:,,, 为样本平均值.
解 由(1)中线性回归方程可知,当时, ,即增
加18.8万人,所以2023年第七届国际水上狂欢节期间外地游客可为该市增加的旅游收
入为1 880万元.
规律方法(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图.
(2)求线性回归方程,注意运算的正确性.
(3)根据线性回归方程进行预测估计:估计值不是实际值,两者会有一定的误差.
19
跟踪训练2 假设关于某种设备的使用年限(单位:年)与所支出的维修费用
(单位:万元)有如下统计资料:
2 3 4 5 6
2.2 3.8 5.5 6.5 7.0
已知,,,, .
20
(1)计算与之间的相关系数(精确到 ),并求出线性回归方程;
解 由题知,,,,, ,
根据相关系数 的计算公式,得
.
又 ,
,
所以线性回归方程为 .
21
(2)根据线性回归方程,预测假设使用年限为10年时,维修费用约是多少万元?
解 由(1)中线性回归方程可知,当时,
(万元),
即假设使用10年时,维修费用约为12.38万元.
【题型三】非线性回归分析
例3 某公司近5年产品研发年投资额(单位:百万元)与年销售量 (单位:千件)
的数据统计表如下:
年投资额 1 2 3 4 5
年销售量 0.5 1 1.5 3 5.5
23
(1)根据上表数据画出年投资额与年销售量 的散点图;
解 散点图如下:
24
(2)该公司计划用非线性经验回归方程作为年销售量关于年投资额 的
回归分析模型,并对年销售量取对数,得到如下数据表:
年销售量 0.5 1 1.5 3 5.5
0 0.4 1.1 1.7
请根据表格数据、参考数据和公式,求出该非线性经验回归方程.
25
解 由得,由于令,即 ,
由已知得 ,
,
则 ,
,
所以,即 ,
故年销售量关于年投资额的非线性经验回归方程为 .
26
规律方法 非线性回归问题的处理方法
(1)指数函数型<m></m>
①函数<m></m>的图象如图所示.
②处理方法:两边取对数得,即.令 ,把原始数据
转化为,再根据线性回归模型的方法求出, 的值.
27
(2)对数函数型
①函数 的图象如图所示.
②处理方法:设,原方程可化为 ,再根据线性回归模型的方法求
出, 的值.
型
处理方法:设,原方程可化为,再根据线性回归模型的方法求出 ,
的值.
28
跟踪训练3 某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件
产品的非原料成本(单位:元)与生产该产品的数量 (单位:千件)有关,经统计
得到如下数据:
1 2 3 4 5 6 7 8
112 61 44.5 35 30.5 28 25 24
根据以上数据,绘制了如下散点图.
29
观察散点图,两个变量之间不具有线性相关关系,现考虑用反比例函数模型 和
指数函数模型 分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的
回归方程为,与的相关系数 .
参考数据其中 :
183.4 2.72 1.53 360 489.47 0.135
30
(1)用反比例函数模型求关于 的回归方程;
解 令 ,
则可转化为 ,
因为 ,
所以
,
则 ,
所以 ,
所以关于的回归方程为
31
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到 ),并用其估计
产量为10千件时每件产品的非原料成本.
参考公式:对于一组数据,, ,,其回归直线 的斜率和截
距的最小二乘估计分别为, ,相关系数
.
32
解 与 的相关系数为
.
因为 ,所以用反比例函数模型拟合效果更好,
由(1)中线性回归方程可知,当时, (元),
所以当产量为10千件时,每件产品的非原料成本为21.1元.
33
$