内容正文:
8.2 一元线性回归模型及其应用
目 标 素 养
1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘法的原理,掌握一元线性回归模型参数的最小二乘法估计方法,会使用相关的统计软件.
2.针对实际问题,会用一元线性回归模型进行预测.
3.通过学习,提升数学抽象、数学运算和数学建模的核心素养.
知 识 概 览
课前·基础认知
1.一元线性回归模型
一元线性回归模型的完整表达式为
其中Y称为 因变量 或 响应变量 ,x称为自变量或 解释变量 ; a,b为模型的未知参数,e是Y与bx+a之间的 随机误差 .
2.一元线性回归模型参数的最小二乘估计
(2)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的 称为预测值,观测值减去预测值所得的差称为 残差 .
(4)经验回归方程的性质:
微训练 (1)若y与x之间的一组数据为
则y关于x的经验回归直线一定经过的点是 .
答案:(2,4)
所以y关于x的经验回归直线一定经过的点是(2,4).
(2)若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei (i=1,2,…,n),且ei恒为0,则R2为 .
答案:1
课堂·重难突破
一 线性回归分析
典例剖析
1.某种产品的广告费用支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:
(1)画出散点图;
(2)求经验回归方程;
(3)试预测广告费用支出为10百万元时的销售额.
解:(1)散点图如图所示:
(2)列出下表:
(3)根据(2)中求得的经验回归方程,当广告费用支出为10百万元时, =6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.
规律总结 1.求经验回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出经验回归方程也是毫无意义的.
学以致用
1.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据:
(1)请画出散点图;
(2)请根据表中的数据,用最小二乘法求出y关于x的经验回归方程 ;
(3)已知该厂技术改造前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的经验回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)由题设所给数据,可得散点图如图所示.
(3)由(2)的经验回归方程及技术改造前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨)标准煤.
二 残差分析
典例剖析
2.已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
求y关于x的经验回归方程,并说明模型拟合效果的好坏.
规律总结 刻画拟合效果的三个方法
(1)残差图法:残差点比较均匀地落在水平带状区域内说明选用的模型比较合适.
学以致用
2.为了研究黏虫孵化的平均温度x(单位:℃)与孵化天数y之间的关系,某课外兴趣小组通过试验得到如下6组数据:
组号 1 2 3 4 5 6
平均温度 15.3 16.8 17.4 18 19.5 21
孵化天数 16.7 14.8 13.9 13.5 8.4 6.2
他们分别用两种模型①y=bx+a,②y=cedx进行拟合,得到相应的经验回归方程并进行残差分析,得到残差图如图所示:
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)
(2)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法并根据(1)的判断结果及表中数据建立y关于x的经验回归方程.(系数精确到0.1)
解:(1)根据题意知,应该选择模型①.
(2)剔除异常数据,即组号为4的数据,
三 非线性回归分析
典例剖析
3.某公司为确定下一年度投
入某种产品的宣传费,需了解
年宣传费x(单位:千元)对年销
售量y(单位:t)和年利润z(单位:
千元)的影响.对近8年的年宣
传费xi和年销售量yi(i=1,2,…,8)的数据作了初步处理,得到下面的散点图及一些统计量的值.
(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程.
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①当年宣传费x=49时,年销售量及年利润的预测值是多少?
②当年宣传费x为何值时,年利润的预测值最大?
解:(1)由散点图可以判断,y=c+d 适宜作为年销售量y关于年宣传费x的经验回归方程类型.
(3)①由(2)知,当x=49时,年销售量y的预测值
故年宣传费为46.24(单位:千元)时,年利润的预测值最大.
规律总结 求非线性经验回归方程的步骤
(1)确定变量,作出散点图.
(2)根据散点图,选择恰当的拟合函数.
(3)变量置换,通过变量置换把非线性经验回归问题转化为经验回归问题,并求出经验回归方程.
(4)分析拟合效果,通过计算R2或画残差图来判断拟合效果.
(5)根据相应的变换,写出非线性经验回归方程.
学以致用
3.若一函数模型为y=ax2+bx+c(a≠0),将y转化为关于t的线性经验回归方程,需作变换t=( )
答案:C
随堂训练
1.相关变量x,y的样本数据如表所示.
x 1 2 3 4 5
y 20 21 m 26 27
经回归分析可得y与x呈线性相关,并由最小二乘法求得相应的经验回归方程为 =1.9x+17.9,则表中的m=( )
A.23.6 B.23
C.24.6 D.24
答案:D
2.甲、乙、丙、丁四名学生在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2分别如下表:
学生 甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
则建立回归模型拟合效果最好的同学是( )
A.甲 B.乙 C.丙 D.丁
答案:A
解析:决定系数R2越大,表示回归模型的拟合效果越好.
3.已知变量x,y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为( )
B
4.已知某产品的销售额y(单位:万元)与广告费用x(单位:万元)之间的关系如表:
x 0 1 2 3 4
y 10 15 20 30 35
若求得其经验回归方程为 ,则预计当广告费用为6万元时的销售额为( )
A.42万元 B.45万元
C.48万元 D.51万元
答案:C
5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x/元 8 8.2 8.4 8.6 8.8 9
销量y/件 90 84 83 80 75 68
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
$