内容正文:
高中数学 选择性必修 第三册 A版
赢在微点 轻松课堂 数学
第八章
成对数据的统计分析
8.2 一元线性回归模型
及其应用
第1课时 一元线性回归模型及其
参数的最小二乘估计
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
—— ——
稳健启程 新知初步构建
自主预习·明新知
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
—— ——
细研深究 萃取知识精华
合作探究·攻重难
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
—— ——
即时训练 巩固当堂所学
当堂检测·提素养
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
8.2 第1课时 一元线性回归模型及其
参数的最小二乘估计
点击
导航
合作探究·攻重难
自主预习·明新知
当堂检测·提素养
轻松课堂 高中数学 选择性必修 第三册 A版
第 ‹#› 页
赢在字里行间
英国著名统计学家高尔顿在研究父亲身高与儿子身高的关系时发现了一个有趣的现象:一群父亲的身高普遍偏高时,他们的儿子的平均身高要低于父亲们的平均身高,一群父亲的身高普遍偏矮时,他们的儿子的平均身高要高于父亲们的平均身高。他把这种现象叫做“回归现象”。后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析。本节我们将学习一元线性回归模型参数的最小二乘估计及其在社会生活中的应用。
1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计,会使用相关的统计软件。
2.针对实际问题,会用一元线性回归模型进行预测。
斜率
1.一元线性回归模型
以儿子身高与父亲身高间的关系为例:由散点图我们知道儿子身高与父亲身高这两个变量之间具有较强的线性相关关系,用x表示父亲身高,用Y表示儿子身高,e表示随机误差。假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为我们称此式为Y关于x的一元线性回归模型。其中, ____称为因变量或响应变量, ____称为自变量或解释变量;a和b为模型的未知参数,a称为_________参数,b称为_________参数;e是Y与bx+a之间的随机误差。
Y
x
截距
2.最小二乘法
将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中=, =_________。
-
残差
残差
3.残差与残差分析
(1)残差:对于响应变量Y,通过观测得到的数据称为_________,通过经验回归方程得到的称为________, ________减去________称为残差。
(2)残差分析: ________是随机误差的估计结果,通过对________的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析。
观测值
预测值
观测值
预测值
大
小
4.对模型刻画数据效果的分析
(1)残差图法:在残差图中,如果残差比较均匀地分布在____________________________________
______,则说明经验回归方程较好地刻画了两个变量的关系。
(2)残差平方和法:残差平方和________________越小,模型的拟合效果越好。
(3)R2法:可以用R2=1-来比较两个模型的拟合效果,R2越____,模型的拟合效果越好,R2越____,模型的拟合效果越差。
以取值为0的横轴为对称轴的水平带状区
域内
(yi-)2
提示:所用的拟合函数不恰当;忽略了某些因素的影响;存在观测误差等。
微思考
1.经验回归方程一定过成对样本数据(x1,y1),(x2,y2),…,(xn,yn)中的某一点吗?
2.点(,)在经验回归直线上吗?
3.利用经验回归方程求得的函数值一定是真实值吗?
4.随机误差产生的原因是什么?
提示:不一定。
提示:(,)在经验回归直线上。
提示:不一定,它只是真实值的一个预测估计值。
类型一 一元线性回归模型
【例1】 若某地区年财政收入x(单位:亿元)与年支出y(单位:亿元)满足一元线性回归模型y=bx+a+e,其中b=0.7,a=3,|e|≤0.5。如果今年该地区财政收入为10亿元,那么年支出预计不会超过 ( )
A.9亿元 B.9.5亿元
C.10亿元 D.10.5亿元
解析 由题意,得y=0.7x+3+e,当x=10时,得y=0.7×10+3+e=10+e,而|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元。故选D。
D
在一元线性回归模型y=bx+a+e中y是随机变量,其值不能由解释变量x唯一确定,随机误差e也影响y的值,其中造成随机误差e的因素很多,在具体问题中应具体分析。
【变式训练】 (多选)关于随机误差产生的原因,分析正确的是 ( )
A.用线性回归模型近似真实模型所引起的误差
B.忽略某些因素的影响所产生的误差
C.对样本数据观测时产生的误差
D.计算错误所产生的误差
解析 理解一元线性回归模型y=bx+a+e中随机误差e的含义是解决此问题的关键,随机误差可能由于观测工具及技术产生,也可能因忽略某些因素产生,也可以是回归模型产生,但不是计算错误。故随机误差产生的原因分析正确的是ABC。
ABC
类型二 经验回归方程及应用
【例2】 某种产品的广告费用支出x(单位:百万元)与销售额Y(单位:百万元)之间有如下的对应数据:
x/百万元
2
4
5
6
8
Y/百万元
30
40
60
50
70
(1)画出散点图;
(2)求经验回归方程;
(3)试预测广告费用支出为10百万元时,销售额多大?
解 (1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:
i
1
2
3
4
5
合计
xi
2
4
5
6
8
25
yi
30
40
60
50
70
250
xiyi
60
160
300
300
560
1 380
4
16
25
36
64
145
所以==5,==50,=145,xiyi=1 380。于是可得=
==6.5,=-=50-6.5×5=17.5。所以所求的经验回归方程为=6.5x+17.5。
(3)根据上面求得的经验回归方程,当广告费用支出为10百万元时,=6.5×10+17.5=82.5(百万元)。即广告费用支出为10百万元时,销售额大约为82.5百万元。
(1)求经验回归方程可分如下步骤来完成:
①列表表示xi,yi,,xiyi;
②计算,,,xiyi;
③代入公式计算,的值;
④写出经验回归方程。
(2)题目提供的大量数据运用统计的方法,得到经验回归方程,进而得到预测需求量,体现了数据分析的核心素养。
【变式训练】 (1)一位母亲记录了自己儿子3~9岁的身高数据,由此建立的身高与年龄的一元线性回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是 ( )
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm左右
D.身高在145.83 cm以下
解析 由回归模型可得=7.19×10+73.93=145.83,所以预测这个孩子10岁时的身高在145.83 cm左右。
C
(2)某班主任为了对本班学生的月考成绩进行分析,从全班40名同学中随机抽取一个容量为6的样本进行分析。随机抽取6位同学的数学、物理分数对应如表:
学生编号
1
2
3
4
5
6
数学分数x
60
70
80
85
90
95
物理分数y
72
80
88
90
85
95
①根据上表数据用散点图说明物理成绩y与数学成绩x之间是否具有线性相关性?
②如果具有线性相关性,求出经验回归方程(系数精确到0.1);如果不具有线性相关性,请说明理由;
③如果班里的某位同学数学成绩为50,请预测这位同学的物理成绩。
附:==,=-。
解 ①画出散点图:
通过图象可以看出物理成绩y与数学成绩x之间具有线性相关性。
②=×(60+70+80+85+90+95)=80,=×(72+80+88+90+85+95)= 85, xiyi=41 285,=39 250,故≈0.6,=37.0,故经验回归方程是=0.6x+37.0。
③当x=50时,解得=67。故当该同学的数学成绩为50时,预测其物理成绩是67。
类型三 残差分析
【例3】 (1)对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是 ( )
A
解析 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高。
(2)已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+a,若样本点(r,1)与(1,s)的残差相同,则有 ( )
A.r=s B.s=2r
C.s=-2r+3 D.s=2r+1
解析 样本点(r,1)的残差为1-2r-a,样本点(1,s)的残差为s-a-2,依题意,得1-2r-a=s-a-2,故s=-2r+3。
C
残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适。这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高。
【变式训练】 (1)已知经验回归方程=x+0.6相对于点(3,6.5)的残差为-0.1,则的值为 ( )
A.1 B.2
C.-0.5 D.-3
解析 因为相对于点(3,6.5)的残差为-0.1,所以6.5-=-0.1。所以6.5+0.1=3+0.6,解得=2。故选B。
B
(2)两个线性相关变量x与y的统计数据如下表
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其经验回归方程是=x+40,则相对于点(11,5)的残差为 ( )
A.0.1 B.0.4
C.0.3 D.0.2
解析 ==10,==8。因为经验回归直线=x+40过点(,),所以8=10+40,解得=-3.2。所以=-3.2x+40,当x=11时,=4.8,则相对于点(11,5)的残差为5-4.8=0.2。故选D。
D
(3)已知某成对样本数据的残差图如图,则成对样本数据中可能不准确的是从左到右第_____个。
解析 原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大。
6
1.关于残差图的描述错误的是 ( )
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或预报变量
C.残差点分布的带状区域的宽度越窄决定系数越小
D.残差点分布的带状区域的宽度越窄残差平方和越小
解析 残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,决定系数R2的值越大。
C
2.根据如下样本数据:
x
2
3
4
5
6
Y
4
2.5
-0.5
-2
-3
得到的经验回归方程为=x+,则 ( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
解析 由题干表中的数据可得,变量Y随着x的增大而减小,则<0,又经验回归方程为=x+经过(4,0.2),可得>0。
B
3.已知x,y的取值如下表所示,若y与x线性相关,且=0.95x+,则= ( )
x
0
1
3
4
y
2.2
4.3
4.8
6.7
A.2.2 B.2.9 C.2.8 D.2.6
解析 由表格得=×(0+1+3+4)=2,=×(2.2+4.3+4.8+6.7)=4.5,经验回归直线过样本点的中心(2,4.5)。所以4.5=0.95×2+,所以=2.6。故选D。
D
4.已知变量x,Y之间具有线性相关关系,其散点图如图所示,则其经验回归方程可能为( )
A.=1.5x+2
B.=-1.5x+2
C.=1.5x-2
D.=-1.5x-2
解析 设经验回归方程为=x+,由题干中散点图可知变量x,Y之间负相关,经验回归直线在y轴上的截距为正数,所以<0,>0,因此方程可能为=-1.5x+2。
B
5.已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:
x
14
16
18
20
22
y
12
10
7
5
3
求y关于x的经验回归方程,并借助残差平方和和R2说明回归模型拟合效果的好坏。
附:=,=-,
R2=1-。
解 =×(14+16+18+20+22)=18,=×(12+10+7+5+3)=7.4,= 142+162 +182+202+222=1 660,xiyi=14×12+16×10+18×7+20×5+22×3=620,所以===-1.15,=7.4+1.15×18=28.1,所以所求经验回归方程是=-1.15x+28.1。
yi-
0
0.3
-0.4
-0.1
0.2
yi-
4.6
2.6
-0.4
-2.4
-4.4
所以(yi-)2=0.3,(yi-)2=53.2,R2=1-≈0.994,所以回归模型的拟合效果很好。
$$