内容正文:
8.2一元线性回归模型及其应用
第八章 成对数据的统计分析
课时1 一元线性回归模型
新知探究
探究一:一元线性回归模型
情境设置
根据统计,某蔬菜基地西红柿亩产量的增加量𝑦 (单位:百千克)与某种液体肥料每亩使用量𝑥 (单位:千克)之间的对应数据的散点图如图所示.
问题1: 依据数据的散点图,计算样本相关系数𝑟 .
问题2: 用什么模型来刻画𝑦与𝑥 之间的关系?
2
新知生成
知识点一 一元线性回归模型
1.一元线性回归模型的相关概念
(1)一元线性回归模型:我们称为𝑌关于𝑥 的一元线性回归模型.
(2)因变量和自变量:𝑌称为因变量或响应变量,𝑥 称为自变量或解释变量.
(3)参数:𝑎和𝑏为模型的未知参数,𝑎称为截距参数,𝑏 称为斜率参数.
(4)随机误差:𝑒是𝑌与𝑏𝑥+𝑎 之间的随机误差.
3
新知生成
知识点一 一元线性回归模型
2.模型中的𝑌也是随机变量,其值虽然不能由变量𝑥的值确定,却能表示为𝑏𝑥+𝑎与𝑒 的
和(叠加),前一部分由𝑥所确定,后一部分是随机的.如果𝑒=0,那么𝑌与𝑥 之间的关系就可以用一元线性函数模型来描述.
3.在一元线性回归模型𝑌=𝑏𝑥+𝑎+𝑒中,𝑒 产生的原因主要有以下几种:
(1)所用的确定性函数不恰当引起的误差;
(2)忽略了某些因素的影响;
(3)存在观测误差.
4
一、一元线性回归模型
例题1 (多选题)在一元线性回归模型𝑌=𝑏𝑥+𝑎+𝑒 中,下列说法错误的是( ).
A.𝑌=𝑏𝑥+𝑎+𝑒 是一次函数
B.响应变量𝑌是由解释变量𝑥 唯一确定的
C.响应变量𝑌除了受解释变量𝑥 的影响外,可能还受到其他因素的影响,这些因素会导
致随机误差𝑒 的产生
D.随机误差𝑒是计算不准确造成的,可通过精确计算避免随机误差𝑒 的产生
【解析】对于A,在一元线性回归模型𝑌=𝑏𝑥+𝑎+𝑒 中,方程表示的不是确定性关系,
因此𝑌=𝑏𝑥+𝑎+𝑒 不是一次函数,所以A错误;
对于B,响应变量𝑌不是由解释变量𝑥 唯一确定的,所以B错误;
对于C,响应变量𝑌除了受解释变量𝑥 的影响外,可能还受到其他因素的影响,这些因
素会导致随机误差𝑒 的产生,所以C正确;
对于D,随机误差是不能避免的,只能将误差缩小,所以D错误.
故选ABD .
ABD
5
反思感悟
方法总结
明确一元线性回归模型的含义是解题的关键,其中𝑎和𝑏为模型的未知参数,𝑎称为截距参数,𝑏称为斜率参数,𝑒是𝑌与𝑏𝑥+𝑎之间的随机误差.
6
新知运用
跟踪训练1 关于一元线性回归模型给出下列说法:
①表达式𝑌=𝑏𝑥+𝑎+𝑒刻画的是变量𝑌与变量𝑥 之间的线性相关关系;
②𝑏𝑥+𝑎反映了由于𝑥的变化而引起的𝑌 的变化;
③误差项𝑒是一个期望值为0的随机变量,即𝐸(𝑒)=0 ;
④对于所有的𝑥值,𝑒的方差都相同.
以上说法正确的是__________.(填序号)
【解析】根据一元线性回归模型的含义可知,以上说法均正确.
①②③④
7
新知探究
探究二:最小二乘法
情境设置
雾霾天气影响了人们的生活,对雾霾天气的研究也渐渐多了起来,某研究机构对
某地春节燃放烟花爆竹的天数𝑥与雾霾天数𝑦 进行统计分析,得出下表数据:
问题1:能用一元线性回归模型表示𝑦与𝑥 的关系吗?
问题2:如何求出一元线性回归模型的方程呢?
4 5 7 8
2 3 5 6
8
新知生成
知识点二 最小二乘法
1.经验回归方程(直线)
我们将称为关于的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
2.最小二乘法
求经验回归方程的方法叫作最小二乘法,求得的,叫作,的最小二乘估计.
3.方程是两个具有线性相关关系的变量的一组数据,, ,
的回归方程,其中,是待定参数,其最小二乘估计分别为
,,
其中,,,称为样本点的中心.
9
新知生成
知识点二 最小二乘法
4.经验回归方程与直线方程的区别:经验回归方程中𝑦 的上方加记号“^ ”是为了与实
际值𝑦相区别,因为经验回归方程中“ ”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,的值只是比较接近,但存在一定的误差,即(其中为随机变量),预测值与实际值的接近程度由随机变量𝑒 的标准差决定.
10
二、 最小二乘法
例2 大学生小敏利用寒假参加社会实践,对机械销售公司7月份至12月份某种机械配
件的销售量及销售单价进行了调查,销售单价𝑥和销售量𝑦 之间的一组数据如表所示:
(1)根据7月份至11月份的数据,求出𝑦关于𝑥 的经验回归方程.
(2)若由经验回归方程得到的估计数据与剩下的检验数据的误差不超过0.5件,则认为所得到的经验回归方程是理想的,试问(1)中所得到的经验回归方程是否理想?
(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机械
配件的成本是2.5元/件,则该配件的销售单价应定为多少元才能获得最大利润?
(注:利润= 销售收入-成本)参考公式:在经验回归方程中,, .参考数据:, .
月份 7 8 9 10 11 12
销售单价 元 9 9.5 10 10.5 11 8
销售量 件 11 10 8 6 5 14
11
二、 最小二乘法
【解析】(1)因为 ,
,
所以,则 ,
于是关于的经验回归方程为 .
(2)当时,,则 ,
所以可以认为所得到的经验回归方程是理想的.
(3)令销售利润为 ,则
,
所以当时, 取得最大值.
故当该配件的销售单价定为7.5元时,获得的利润最大.
12
反思感悟
方法总结
用经验回归方程估计总体的一般步骤:
(1)作出散点图,判断散点是否在一条直线附近;
(2)若散点在一条直线附近,则用公式求出,,并写出经验回归方程,否则求出的经验回归方程是没有意义的;
(3)根据经验回归方程对总体进行估计.
13
新知运用
跟踪训练2 某医疗器械厂统计了口罩生产车间每名工人的生产速度,将所得数据分成
[20,30),[30,40),[40,50),[50,60),[60,70] ,共五组,并绘制出如图所示的频率分布直方图.已知前四组的频率成等差数列,第五组与第二组的频率相等.
(1)估计口罩生产车间工人生产速度的中位数.
(2)为了了解该车间工人的生产速度是否与他们的工作经验有关,现从车间所有工人中随机抽样调查了5名工人的生产速度以及他们的工龄(参加工作的年限),数据如下表:
根据上述数据求每名工人的生产速度关于他的工龄的经验回归方程 ,并
据此估计该车间某位有18年工龄的工人的生产速度.
经验回归方程中, .
工龄 年 6 8 12 10 14
生产速度 (件/小时) 40 55 60 60 65
14
二、 最小二乘法
【解析】(1) 设前四组的频率分别为,,,,公差为 ,由题意知
,
故 ,联立解得
, .故各组频率分别为,,,, .
又 ,所以中位数为 .
(2) 由题意得,, , ,
则 , ,
故经验回归方程为 .
当时, ,故估计该车间某位有18年工龄的工人的生产速度为78件/小时.
15
随堂检测
1. 已知变量𝑦与𝑥正线性相关,且由观测数据算得样本平均数, ,则由该观测数据算得的经验回归方程可能为( ).
A. B.
C. D.
2. 根据如下样本数据得到的经验回归方程为,若,则 每增加1个单位,估计( ).
A.增加0.9个单位 B.减少0.9个单位
C.增加1个单位 D.减少1个单位
3. 如图,这是一组数据的散点图,经最小二乘法计算,
与之间的经验回归方程为,则 ____.
B
A
0.8
3 4 5 6 7
4 2.5 0.5
16
随堂检测
4.某研究机构对高三学生的记忆力𝑥和判断力𝑦 进行统计分析,得下表数据:
已知记忆力𝑥和判断力𝑦 是线性相关的,求经验回归方程.
【解析】由已知得, ,
, ,
则, ,
故所求的经验回归方程为 .
6 8 10 12
2 3 5 6
17
课堂小结
1.知识清单:
(1)一元线性回归模型;
(2)最小二乘法.
18
$$