内容正文:
跟踪训练2:解析】由表中数据,计算得=×(2+4+5+6
+8)=5
了=5×(20+30+50+50+70)=4。
含=2+4+52+6+82=145,
27=202+302+502+502+702=11200.
5
xy=2×20+4×30+5×50+6×50+8×70=1270,代入7
的计算公式得r=
1270-5×5×44
/145-5×57×√/11200-5×44
0.975.
例3:【解析】由题意,得x=7,y=5,
则(x-)2=10,(%-)2=16.5,(出-)(0%-)=
-12.5,
-12.5
所以r/10×16.5
≈-0.97
因为Ir=0.97非常接近1,所以y与x之间具有较强的线性
相关关系.
跟踪训练3:【解析】根据C类学生的数据,得x=3,y=98,
则8(x-)·(0y-)=62,
62
所以相应的样本相关系数*≈0.97,
从上述所求样本相关系数可知,从C类学生中抽到的学生的
成绩最稳定
随堂检测重反馈
1.ABA中学生的学习态度与学习成绩之间不是因果关系,但
具有相关性,是相关关系:B中教师的教学水平与学生的学习
成绩之间的关系是相关关系;C、D都不具备相关关系。
2.C由题图①可知,散点几乎在一条直线上,且呈正相关,
1>0,由题图②可知,散点分布在一条直线附近,且呈正相
关,∴2>0.又A组成对数据的线性相关程度比B组强,
1>r2,故选C
3.【解析】由数据表可以看出,两个变量的变化趋势为物品大
小的值由小变大时,销售价格也由小变大,因此两个变量有相
关关系
4.【解析】从表中数据可知,元=4,y=5,所以Σ(x;-x)(y:
y)=16,
(x-)(%-
=1
16
所以T=
含(%-列√,-列
16.12≈0.99
8.2一元线性回归模型及其应用
第1课时
一元线性回归模型及其参数
的最小二乘估计
教材梳理
明要点
新知初探
知识点一
响应变量解释变量a b Y bx+a0
知识点二
经验回归方程
7
预习自测
1.ADy=bx+a表示y与x之间的函数关系,而不是y与x之
间的函数关系,但它反映的关系最接近y与x之间的真实关
系,故选AD.
2.12.1由y=0.8x+0.1知:当x=15时,y=0.8×15+0.1=
12.1(亿元).
题型探究提技能
例1:C对于A中,一元线性回归模型Y=bx+a+e中,方程表
示的不是确定性关系,因此不是一次函数,所以A错误;对于
B中,响应变量Y不是由解释变量x唯一确定的,所以B错
误;对于C中,响应变量Y除了受解释变量x的影响外,可能
还受到其他因素的影响,这些因素会导致随机误差e的产生,
所以C正确;对于D中,随机误差是不能避免的,只能将误差
缩小,所以D错误.故选C
跟踪训练1:D因为财政收人x与支出Y满足一元线性回归模
型Y=bx+a+e,其中b=0.7,a=3,所以Y=0.7x+3+e.当x
=10时,得Y=0.7×10+3+e=10+e,又1el≤0.5,即-0.5
≤e≤0.5,所以9.5≤Y≤10.5,所以年支出预计不会超过10.5
亿元.
例2:【解析】(1)作散点图如图,直观
51
看z与t具有线性相关关系.
4
根据z关于t的表格数据,得
3
i=写1+2+3+4+5)=3.
012345t
8=号0+1+2+3+5)=22
且2杯=45,2=55,
5
所以6=-5t245-5×3×2.2=1.2
2-5子
55-5×9
a=z-bt=2.2-1.2×3=-1.4.
所以z关于t的经验回归方程为z=1.2t-1.4.
(2)2=1.2t-1.4,代入t=x-2018,z=y-5,
得y-5=1.2(x-2018)-1.4,
即y=1.2x-2418.
故y关于x的回归方程为少=1.2x-2418.
跟踪训练2:【解析】(1)散点图如图所示.
↑y
90
70
0
060657075808590x
样本点分布在一条直线附近,y与x具有线性相关关系。
(2)因为=写×(88+76+73+66+63)=73.2,7=写×(78
+65+71+64+61)=67.8,
8xy,=88×78+76×65+73×71+66×64+63×61=
5
25054,
=82+76+732+62+632=27174.
6
所以6=空二5
≈0.625,
2-57
a=y-bc≈67.8-0.625×73.2=22.050.
因此y关于x的经验回归方程为y=22.050+0.625x.
例3:【解析】(1)由题中和附注中的参考数据,知
i=4,8(传-)2=28,
√8-)2=0.55,
7
8(传-0(0-)=2:-i=40.17-4×9.32=289,
i=1
2.89
2.89
所以r27x0.52×2.6a6x0.55*09
因为0.99>0.75,
所以销售量y与月份代码t有较强的线性相关关系.
(2)=932≈1.331及(1)得
7
6.4-0
_2.89≈0.103,
(传-)2
28
a=y-6i≈1.331-0.103×4≈0.92,
所以y关于t的经验回归方程为y=0.10t+0.92.
(3)当t=8时,代入经验回归方程,
得y=0.10×8+0.92=1.72(万件),
设毛利润为z,则第8个月的毛利润
z=10×1.72-8≈17.2-2×1.414=14.372(万元)
因为14.372<15,
所以预测第8个月的毛利润不能突破15万元
跟踪训练3:解析】()由题意可得=5×(1+15+2+2.5
+3)=2,
万=5×(0.9+0.7+0.5+0.3+0.2)=0.52
含(x-(x-列=-1x0.38-0.5x018+05×(-02)
+1×(-0.32)=-0.9,
(-0)2=1+0.25+0.25+1=2.5,
则6=号器-06,
a=y-6元=1.24,故y=-0.36x+1.24.
(2)当x=2.6时,y=-0.36×2.6+1.24=0.304
故估计该居民家庭的恩格尔系数为0.304.
随堂检测重反馈
1.D根据实际情况能够判定变量x,y具有线性相关性的顺序
为:收集数据(x,y:),i=1,2,…,n;根据所搜集的数据绘制散
点图;求线性回归方程;对所求出的回归方程作出解释.故
选D.
2.A易求得x=2.5,y=3.5,经验回归直线经过点(x,y),代人
检验知A正确.
3.ACD由y=-0.7x+10.3,得b=-0.7,故x,y呈负相关关
系,则A正确.元-6+8+10+1业=9,5=-0.7×9+10.3=4
4
_6+m+3+2,解得m=5,B错误.当x=1时,y的预测值为
4
2.6,故C正确.x=9,y=4,故经验回归直线必过点(9,4),则
D正确.
4.63根据题意可得,=行×(10+20+30+40+50)=30,
气×(62+75+81+89+@)=61.4+号.又经验回归直线经
过点(,),故可得61.4+号=0.67×30+54.9,解得a=68.
第2课时非线性回归模型及回归分析
教材梳理明要点
新知初探
知识点二
1.(1)观测值预测值观测值预测值
2.残差分析
知识点三
1.横轴为对称轴的水平带状区域内越高
2.∑(y-)2
3.大小
预习自测
1.A当x=5时,销售额的预测值为y=5×6.5+17.5=50,残
差为60-50=10万元.故选A.
2.A决定系数R越大,表示回归模型的拟合效果越好
3.B由散点图可知,数据分布成递增趋势,但是呈现上凸效果,
即增加越来越缓慢.A中,y=a+x是直线型,均匀增长,不符
合要求;B中,y=a+blnx是对数型,增长越来越缓慢,符合要
求;C中,y=a+be是指数型,爆炸式增长,增长越来越快,不
符合要求;D中,y=a+bx2是二次函数型,图象既有上升,又
有下降,不符合要求。
题型探究提技能
例1:【解析】(1)由题中散点图的趋势判断,样本点分布在一
条指数型函数图象的周围,
则y=ce2适宜作为y与x之间的回归方程模型.
(2)令z=lny,则z=c2x+hG,
于是变量z与x线性相关.由最小二乘法得
10
(x:-x)(a-z)30_1
10
(年-刘
1505,
nc1=z-c2x=-3.33,
1
所以z=ny=5x-3.33,
故y关于x的回归方程为y=e=e子-3,
跟踪训练1:【解析】(1)根据题中散点图,得y=c+dnx更适
宜作为每户平均可支配收入y(千元)关于年份代码x的回归
方程模型.由已知数据,得
含(4-0)(0-列."-7m下235.1-7x1.2x27
d=
∑(4-u)2
13.2-7×1.2×1.2
i=1
心-7m
≈14.2.084
8.2
一元线性回归模型及其应用
第1课时一元线性回归模型及其参数的最小二乘估计
新课程标准解读
学科核心素养
1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义.
数学抽象
2.了解最小二乘法的思想,会求经验回归方程,能根据经验回归方程进行
数学建模、数学运算
预测,
教材梳理
明要点
P情境导入
某地区从某一年开始进行了环境污染整治,得到了如下数据:
[提示]
求出与这些数据最相
第x年
2
3
4
5
6
近的直线的方程,用
该方程表示y与x的
污染指数y
6.1
5.2
4.5
4.7
3.8
3.4
3.1
关系进行预测
[知识点反思1]
作出这些成对数据的散点图,可以判断污染指数y与x具有线性相关关
回归模型与函数模型
系,如何根据这些样本数据估计出该地区第8年的污染指数呢?
的区别
函数模型的特点是对
[提示]
于自变量在定义域内
的任何一个值,因变
已新知初探
量都有唯一一个确定
的值与之对应,但在
知识点一一元线性回归模型
回归模型中,响应变
Y=bx+a+e,
量的取值不能完全由
称
,为Y关于x的一元线性回归模型.其中,Y称为因变
解释变量确定,还要
E(e)=0,D(e)=
加上随机误差.
量或
,x称为自变量或
称为截距参
数,
称为斜率参数;e是
之间的随机误差,如
[知识点反思2]
(1)经验回归方程不
果e=
,那么Y与x之间的关系就可以用一元线性函数模型来描
一定过成对样本数据
述
[知识点反思1]
(x,y),(x2,
y2),,(xm,yn)中
知识点二最小二乘法和经验回归方程
的某一点;但经验回
把具有线性相关关系的两个变量x与y用方程y=bx+a来表示,当样本观
归直线一定经过样本
点的中心(元,y);
测数据与直线y=bx+a的“整体接近程度”最小时,求得b与a的最小二
(2)b也可用公式b=
乘估计为6.a其中6盈:00-
,a=y-bx.
高-n
含(-)
3龙-n
来计算,
将分=bx+a称为Y关于x的
,也称经验回归函数或经验
b>0时Y与x正相
回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最
关,b<0时Y与x负
相关.
小二乘法
●[知识点反思2]
085
©预习自测
1.(多选)下列有关经验回归方程y=bx+a的叙述正确的是
A.反映y与x之间的函数关系
B.反映y与x之间的函数关系
C.表示y与x之间不确定关系
D.表示最接近y与x之间真实关系的一条直线
2.某地区近十年居民的年收人x与支出y之间的关系大致符合y=0.8x+0.1(单位:亿元),则预计
今年该地区居民收入为15亿元时,年支出估计是
亿元
题型探究提技能
题型一一元线性回归模型的理解
例1在一元线性回归模型y=:+口+e中,下列说法正确的是
[方法总结1]
在一元线性回归模型
A.Y=bx+a+e是一次函数
Y=bx+a+e中,模
B.响应变量Y是由解释变量x唯一确定的
型中的Y也是随机变
C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影
量,其值虽然不能由
变量x的值确定,但
响,这些因素会导致随机误差e的产生
是却能表示为bx+a
D.随机误差ε是由于计算不准确造成的,可通过精确计算避免随机误
与e的和(叠加),前
差e的产生
>[方法总结1]
一部分由x所确定,
后一部分是随机的.
)》跟踪训练1
若某地财政收入x与支出Y满足一元线性回归模型Y=bx+a+e(单位:亿
元),其中b=0.7,a=3,lel≤0.5,如果今年该地区财政收入10亿元,年支
出预计不会超过
()
A9亿元
B.9.5亿元
C.10亿元
D.10.5亿元
题型二求经验回归方程
例2某地随者经济的发展,居民收人逐年增长,该地一银行莲续五年年底
的储蓄存款情况如下表所示
年份x
2019
2020
2021
2022
2023
储蓄存款额y/千亿元
5
6
7
8
10
为了计算方便,工作人员将上表的数据进行了处理,令t=x-2018,
=y-5,得到下表
1
2
3
4
5
0
1
2
3
5
086
(1)作:关于1的散点图,求名关于t的经验回归方程;
(2)通过(1)中的方程,求出y关于x的回归方程.
[方法总结2]
P[方法总结2]
1.求经验回归方程的
一般步骤:
(1)画出散点图,从
直观上分析数据间是
否存在线性相关
关系:
(2)计算,,言,
(3)代入公式求出y
=bx+a中参数b,a
的值;
(4)写出经验回归方
》跟踪训练2
程并对实际问题作出
某班5名学生的数学和物理成绩如下表:
估计
2.求经验回归方程
学生
A
B
D
E
时,经常遇到x,y的
数学成绩x/分
88
76
73
66
63
数字过大,直接求解
物理成绩y/分
78
65
71
64
61
a和b的值时,易出现
错误.为了减少计算
(1)画出散点图;
出错的风险,我们可
(2)求物理成绩y关于数学成绩x的经验回归方程(结果保留三位小数).
以对给定的数据进行
预处理,从而减少运
参考公式:b=
含-ny含(x-)(y-列
,a=y-bx.
算量,降低出错的
含-n
含(x-)
概奉.
●087
题型三利用经验回归方程进行预测
例3某公司为了预测下月产品的销售情况,找出了近7个月的产品销售量
y(单位:万件)的统计表:
月份代码t
1
2
3
4
6
7
销售量y(万件)
Y3
但其中数据污损不清,经查证y=9.32,:=40.17,
√(y:-y)2=0.55.
(1)请用相关系数说明销售量y与月份代码1有较强的线性相关
[方法总结3]
只有确定两个变量具
关系;
有较强的线性相关关
(2)求y关于t的经验回归方程(系数精确到0.01);
系时,求出的经验回
(3)公司经营期间的广告宣传费x,=√(单位:万元)(i=1,2,…,7),
归方程才有实际意
每件产品的销售价为10元,预测第8个月的毛利润能否突破15
义,否则根据回归方
万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
程进行的预测毫无意
参考公式及数据:√2≈1.414,√7≈2.646,
义
8(4-0(-y)
相关系数r=
当1r1>0.75时认为两个
V,-0)公(x-)”
变量有较强的线性相关关系。
●[方法总结3]
088
)跟踪训练3
恩格尔系数法是国际上常用的一种测定贫困线的方法,是指居民家庭年人均食物支出占年人均
消费总支出的比重,它随家庭收入的增加而下降,即恩格尔系数越大,生活越贫困.某调研小组通
过调查得到了某地年人均消费总支出x(万元)与恩格尔系数y的五组数据如下表:
1
1.5
2
2.5
3
y
0.9
0.7
0.5
0.3
0.2
(1)请根据上表数据,用最小二乘法求出y关于x的经验回归方程;
(2)若该地某居民家庭年人均消费总支出为2.6万元,估计该居民家庭的恩格尔系数、
参考公式:经验回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为b=
(-x)(y:-y)xy:-nxy
,a=y-bx.
8(x-x)2
含x-n
随堂检测重反馈
1.在对两个变量x,y进行线性回归分析时一般有下列步骤:①对所求出的回归方程作出解释:②收
集数据(x:,y:),i=1,2,…,;③求线性回归方程;④根据所搜集的数据绘制散点图.若根据实际
情况能够判定变量x,y具有线性相关性,则在下列操作顺序中正确的是
(
A.①②④③
B.③②④①
C.②③①④
D.②④③①
2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x的经验回归
方程为
()
A.y=x+1
B.y=x+2
C.y=2x+1
D.y=x-1
3.(多选)已知变量x,y之间的经验回归方程为y=-0.7x+10.3,且变量x,y之间的一组相关数据
如下表所示,则下列说法正确的是
6
8
10
12
6
m
3
2
089
A.变量x,y之间呈负相关关系
B.m=4
C.可以预测,当x=11时,y约为2.6
D.由表格数据知,该经验回归直线必过点(9,4)
4.某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验
的数据列(个数x,加工时间y)为:(10,62),(20,a),(30,75),(40,81),(50,89).若用最小二乘
法求得其经验回归方程为y=0.67x+54.9,则a的值为
夯基提能作业
请同学们认真完成练案[19]
第2课时非线性回归模型及回归分析
新课程标准解读
学科核心素养
1.理解残差的概念,会利用残差进行回归分析。
数学抽象、数据分析
2.理解决定系数的含义,会利用R判定回归模型的拟合效果
数学运算、数据分析
3.会将非线性回归模型转化为线性回归模型求解回归方程.
数学建模
教材梳理明要点
●情境导入
经观测,某种昆虫的产卵数y与温度x有关,
y个
现将收集到的温度x:和产卵数y,(i=1,2,…,350
[提示]
300
可通过换元法,把非
10)的10组观测数据作了初步处理,得到如图
250
200
线性回归模型转化为
的散点图,显然两个变量有密切的相关关系,150
线性回归模型求解回
但不是线性相关关系.如何得出它们的关系方100
50
归方程.
程呢?
202224262830323436
>[提示]
台新知初探
知识点一非线性回归方程
1.非线性回归分析的思想
研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点
没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,
此时不能直接利用经验回归方程来建立两个变量之间的关系.
2.非线性经验回归方程
当回归方程不是形如y=bx+a(a,b∈R)时,称之为非线性经验回归方程.
当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程
来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线
性经验回归方程