8.2 第1课时 一元线性回归模型及其参数的最小二乘估计-【优学精讲】2024-2025学年高中数学选择性必修第三册教用Word(人教A版)
2026-01-23
|
12页
|
63人阅读
|
3人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.2 一元线性回归模型及其应用 |
| 类型 | 教案 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2025-2026 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 371 KB |
| 发布时间 | 2026-01-23 |
| 更新时间 | 2026-01-23 |
| 作者 | 拾光树文化 |
| 品牌系列 | 优学精讲·高中同步 |
| 审核时间 | 2026-01-23 |
| 下载链接 | https://m.zxxk.com/soft/56089637.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该教案聚焦一元线性回归模型及参数的最小二乘估计,以恩格尔系数实例导入,从生活现象出发提出“如何建立线性相关变量预测模型”的问题,衔接相关关系知识,搭建从实际到理论的学习支架。
资料以实例驱动教学,通过学生成绩、气温与用电量等案例,结合判断、计算、应用等多样题型,培养数学建模与数据分析素养,总结求回归方程通性通法,助力学生提升应用能力,也为教师提供丰富教学资源,提高课堂效率。
内容正文:
8.2 一元线性回归模型及其应用
新课程标准解读
核心素养
1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义
数学抽象
2.了解最小二乘法的思想,会求经验回归方程,并会用一元线性回归模型进行预测
数学运算、数学建模、
数据分析
3.了解随机误差、残差、残差图的概念
数学抽象、直观想象
第1课时 一元线性回归模型及其参数的最小二乘估计
恩格尔系数是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭总支出中用来购买食物的支出所占比例将会下降.
【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
知识点一 一元线性回归模型
称 为Y关于x的一元线性回归模型.其中,Y称为 因变量 或 响应变量 ,x称为 自变量 或 解释变量 ; a 称为截距参数, b 称为斜率参数;e是 Y 与 bx+a 之间的随机误差,如果e= 0 ,那么Y与x之间的关系就可以用一元线性函数模型来描述.
知识点二 最小二乘法和经验回归方程
将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中,=,=-.
提醒 (1)经验回归方程不一定过成对样本数据(x1,y1),(x2,y2),…,(xn,yn)中的某一点;(2)经验回归直线一定经过样本点的中心(,);(3)=.
1.判断正误.(正确的画“√”,错误的画“×”)
(1)两个变量之间产生随机误差的原因仅仅是因为测量工具产生的误差.( )
(2)经验回归方程最能代表观测值x,y之间的线性关系,且经验回归直线过样本点的中心(,).( )
(3)求经验回归方程前可以不进行相关性检验.( )
(4)利用经验回归方程求出的值是准确值.( )
答案:(1)× (2)√ (3)× (4)×
2.(多选)下列有关经验回归方程=x+的叙述正确的是( )
A.反映与x之间的函数关系
B.反映y与x之间的函数关系
C.表示与x之间不确定关系
D.表示最接近y与x之间真实关系的一条直线
解析:AD =x+表示与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系,故选A、D.
3.某地区近十年居民的年收入x与支出y之间的关系大致符合=0.8x+0.1(单位:亿元),则预计今年该地区居民收入为15亿元时,年支出估计是 12.1 亿元.
解析:∵=0.8x+0.1,∴=0.8×15+0.1=12.1(亿元).
题型一
一元线性回归模型的理解
【例1】 在一元线性回归模型Y=bx+a+e中,下列说法正确的是( )
A.Y=bx+a+e是一次函数
B.响应变量Y是由解释变量x唯一确定的
C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生
D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生
解析:C 对于A中,一元线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B中,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C中,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D中,随机误差是不能避免的,只能将误差缩小,所以D错误.故选C.
通性通法
在一元线性回归模型Y=bx+a+e中,模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的.
【跟踪训练】
关于一元线性回归模型给出下列说法:
①表达式Y=bx+a+e刻画的是变量Y与变量x之间的线性相关关系;②bx+a反映了由于x的变化而引起的Y的线性变化;③误差项e是一个期望值为0的随机变量,即E(e)=0;④对于所有的x值,e的方差σ2都相同.其中正确的是 ①②③④ (填序号).
解析:根据一元线性回归模型的含义可知,以上说法均正确.
题型二
求经验回归方程
【例2】 某班5名学生的数学和物理成绩如下表:
学生
A
B
C
D
E
数学成绩x/分
88
76
73
66
63
物理成绩y/分
78
65
71
64
61
(1)画出散点图;
(2)求物理成绩y关于数学成绩x的经验回归方程(结果保留三位小数).
参考公式:==,=-.
解:(1)散点图如图所示.
(2)因为=×(88+76+73+66+63)=73.2,=×(78+65+71+64+61)=67.8,
xiyi=88×78+76×65+73×71+66×64+63×61=25 054,
=882+762+732+662+632=27 174,
所以=≈0.625,
=-≈67.8-0.625×73.2=22.050.
因此y关于x的经验回归方程为=22.050+0.625x.
通性通法
求经验回归方程的基本步骤
(1)画出散点图,从直观上分析数据间是否存在线性相关关系;
(2)计算,,xiyi,(xi-)2,(yi-)2;
(3)代入公式求出=x+中参数,的值;
(4)写出经验回归方程并对实际问题作出估计.
提醒 只有在散点图大致呈线性时,求出的经验回归方程才有实际意义,否则求出的回归方程毫无意义.
【跟踪训练】
入夏以来,天气炎热,某地区用电负荷连创新高,某用户随机统计了家里某4天用电量(kW·h)与当天气温(℃)的情况,数据如表:
气温x(℃)
30
32
34
36
用电量ykW·h)
20
26
30
36
请根据提供的数据,计算,,并用最小二乘法求出y关于x的经验回归方程=x+.
参考公式:=,=-.
解:==33,==28,
=
==2.6,
∴=2.6x-57.8.
题型三
利用经验回归方程对总体进行估计
【例3】 对具有线性相关关系的变量x,y,测得一组数据如下表,根据表中数据,利用最小二乘法得到经验回归方程=10.5x+,据此模型预测当x=20时,y的估计值为( )
x
2
4
5
6
8
y
20
40
60
70
80
A.210 B.210.5
C.211.5 D.212.5
解析:C 由题意可知,==5,==54.∵经验回归直线经过样本中心点,∴54=10.5×5+,=1.5,经验回归方程为=10.5x+1.5,当x=20时,y的估计值为10.5×20+1.5=211.5.故选C.
通性通法
解题的关键是先确定两个变量y与x是线性相关关系,求出经验回归方程进行估计和预测.
【跟踪训练】
中医是中华民族五千年传统文化的瑰宝,是千百年医疗实践的结晶,也是世界优秀文化的精华.某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如表:
研发投入x(亿元)
1
2
3
4
5
产品收益y(亿元)
3
7
9
10
11
用最小二乘法求得y关于x的经验回归方程是=x+2.3,当研发投入为20亿元时,相应的产品收益估计值为 40.3 亿元.
解析:由表格中的数据可得==3,==8,将样本中心点(,)代入经验回归方程可得3+2.3=8,解得=1.9,所以经验回归方程为=1.9x+2.3,当x=20时,=1.9×20+2.3=40.3(亿元),因此,当研发投入为20亿元时,相应的产品收益估计值为40.3亿元.
1.在对两个变量x,y进行线性回归分析时一般有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④根据所搜集的数据绘制散点图.若根据实际情况能够判定变量x,y具有线性相关性,则在下列操作顺序中正确的是( )
A.①②④③ B.③②④①
C.②③①④ D.②④③①
解析:D 根据实际情况能够判定变量x,y具有线性相关性的顺序为:收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图;求线性回归方程;对所求出的回归方程作出解释;故选D.
2.用最小二乘法得到一组数据(xi,yi)(i=1,2,3,4,5,6)的经验回归方程为=2x+3,若xi=30,则yi=( )
A.11 B.13
C.63 D.78
解析:D 依题意,因为xi=30,所以==5,因为经验回归方程=2x+3一定过点(,),所以=2+3=2×5+3=13,所以yi=6×13=78.故选D.
3.已知x与y之间的一组数据:
x
0
1
2
3
y
m
3
5.5
7
已求得关于y与x的经验回归方程为=2.2x+0.7,则m=( )
A.1 B.0.85
C.0.7 D.0.5
解析:D ==1.5,==,将其代入=2.2x+0.7,可得m=0.5,故选D.
4.若根据5名儿童的年龄x(岁)和体重y(kg)的数据用最小二乘法得到用年龄预报体重的经验回归方程是=2x+18,已知这5名儿童的年龄分别是3,5,2,6,4,则这5名儿童的平均体重是 26 kg.
解析:由题意得,==4,由于经验回归直线过样本的中心点(,),所以=2+18=2×4+18=26,则这5名儿童的平均体重是26 kg.
1.在有线性相关关系的两个变量建立的经验回归方程=+x中,( )
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
解析:C 当=0时,不具有线性相关关系,但能大于0,也能小于0.
2.已知某经验回归方程为=2-3x,则当解释变量增加1个单位时,响应变量平均( )
A.增加3个单位 B.增加个单位
C.减少3个单位 D.减少个单位
解析:C 依题意,经验回归方程为=2-3x,所以当解释变量增加1个单位时,响应变量平均减少3个单位.故选C.
3.对具有线性相关关系的变量x,y,有一组观测数据(xi,yi)(i=1,2,3,…,8),其经验回归方程为=x+,且x1+x2+x3+…+x8=6,y1+y2+y3+…+y8=9,则=( )
A.-2 B.2
C.-1 D.1
解析:D ==,=,由于经验回归直线过样本中心点,将代入经验回归方程,解得=1.
4.对于变量x,y,经随机抽样获得一组具有线性相关关系的数据为(6,y1),(7,y2),(10,y3),(12,y4),(15,y5),其经验回归方程为=0.7x-6.若y1,y2,y3,y4,y5成等差数列,则y3=( )
A.4 B.3
C.2 D.1
解析:D 由题意可得,=×(6+7+10+12+15)=10.∵经验回归方程为=0.7x-6,∴=0.7×10-6=1.∵y1,y2,y3,y4,y5成等差数列,∴=(y1+y2+y3+y4+y5)=y3=1.故选D.
5.(多选)数据(x,y)的5组测量值(xi,yi)(i=1,2,3,4,5),已知=90,xiyi=112,xi=20,yi=25.若y对x的经验回归方程记作=x+,则( )
A.=1.2
B.=0.2
C.y与x正相关
D.x=8时,y的估计值为9
解析:ABC 由已知的数据可得=xi=4,=yi=5,====1.2,=-=5-1.2×4=0.2,所以经验回归方程为=1.2x+0.2.因为=1.2>0,所以y与x正相关.当x=8时,=1.2×8+0.2=9.8.故A、B、C选项正确,D选项错误.
6.如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的经验回归方程为=x+1,则= 0.8 .
解析:由题图知==2,==2.6,将(2,2.6)代入=x+1中,解得=0.8.
7.为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其经验回归方程为=x+,已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为166cm.
解析:由题意可知=4x+,又=22.5,=160,∴160=22.5×4+,得=70,因此=4x+70.当x=24时,=4×24+70=96+70=166.
8.一项关于16艘船的研究中,已知船的吨位区间为[192,3 246](单位:吨),船员人数y与吨位x之间具有相关关系,经验回归方程为=9.5+0.006 2x.
(1)若两艘船的吨位相差1 000,求船员平均相差的人数;
(2)估计吨位最大的船和最小的船的船员人数.
解:(1)设两艘船的吨位分别为x1,x2(x1>x2),则船员人数为,,-=9.5+0.006 2x1-(9.5+0.006 2x2)=0.006 2×1 000≈6,即船员平均相差6人.
(2)当x=3 246时,=9.5+0.006 2×3 246≈30,
当x=192时,=9.5+0.006 2×192≈11.
即估计吨位最大的船和最小的船的船员人数分别为30,11.
9.根据以下样本数据
x
1
3
5
7
y
6
4.5
3.5
2.5
得到经验回归方程为=x+.则( )
A.<0,<0 B.>0,>0
C.<0,>0 D.>0,<0
解析:D 由表中数据可得随着x的增大,y越来越小,所以<0,又因为当x=1时,y=6,所以当x=0时,y>6,所以>0,故选D.
10.若某地财政收入x与支出Y满足一元线性回归模型Y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.9亿元 B.9.5亿元
C.10亿元 D.10.5亿元
解析:D 因为财政收入x与支出Y满足一元线性回归模型Y=bx+a+e,其中b=0.7,a=3,所以Y=0.7x+3+e.当x=10时,得Y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤Y≤10.5,所以年支出预计不会超过10.5亿元.
11.(多选)已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到经验回归方程为=1.5x-0.6且=2,去除两个异常数据(-2,7)和(2,-7)后,得到的新的经验回归直线的斜率为3,则( )
A.相关变量x,y具有正相关关系
B.去除异常数据后,新的平均数'=2
C.去除异常数据后的经验回归方程为=3x-4.8
D.去除异常数据后,随x值增加,的值增加速度变小
解析:AC 对于A,因为经验回归直线的斜率为正,所以相关变量x,y具有正相关关系,所以A正确;对于B,因为=2,所以去除两个异常数据(-2,7)和(2,-7)后,得到新的'==,所以B错误;对于C,将=2代入=1.5x-0.6得=2.4,故去除两个异常数据(-2,7)和(2,-7)后,'==3.2,因为得到的新的经验回归直线的斜率为3,所以'-3'=3.2-3×=-4.8,所以去除异常数据后的经验回归方程为=3x-4.8,故C正确;对于D,因为经验回归直线=3x-4.8的斜率为正数,所以变量x,y具有正相关关系,且去除异常数据后,斜率由1.5增大到3,故值增加的速度变大,D错误.故选A、C.
12.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为 0.5 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 0.53 .
解析:小李这5天的平均投篮命中率=×(0.4+0.5+0.6+0.6+0.4)=0.5,=3,计算得==0.01,=-=0.5-0.03=0.47.∴经验回归方程为=0.01x+0.47,则当x=6时,=0.53.∴预测小李该月6号打6小时篮球的投篮命中率为0.53.
13.2023年冬季旅游一夜逆袭,“南方小土豆”“马铃薯公主”一度走红网络.哈尔滨冰雪大世界于2022年9月投入使用,总投资高达25亿元,号称“永不落幕”的冰雪游乐场,从“一季繁荣”到“四季绽放”. 2024年1月至5月的游客数以及对游客填写满意与否的调查表,统计如下:
月份x
1
2
3
4
5
游客人数y(万人)
130
m
n
90
80
满意率
0.5
0.4
0.4
0.3
0.35
已知y关于x的经验回归方程为=-11.5x+134.5.
(1)求2月份,3月份的游客数m,n的值;
(2)在1月至5月的游客中随机抽取2人进行调查,把满意率视为概率,求评价为满意的人数X的分布列与期望E(X).
(参考公式:==,=-)
解:(1)由题意可得=3,=,且=-11.5×3+134.5=100,
所以m+n=200, ①
又因为xiyi=2m+3n+890,5=1 500,5=45,=55,
所以==-11.5,化简得2m+3n=495, ②
联立①②得:m=105,n=95.
(2)任取1个人满意的概率P==,
所以满意的人数X服从二项分布,即X~B(2,),
随机变量X的取值分别为0,1,2,从而得:
P(X=0)==,P(X=1)==,P(X=2)==,
所以可得满意人数X的分布列如表所示:
X
0
1
2
P
所以期望E(X)=0×+1×+2×=.
9 / 9
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。