内容正文:
专题8.2 一元线性回归模型及其应用
【知识梳理】 1
【考点1:由散点图画求近似回归直线】 3
【考点2:用回归直线方程对总体进行估计】 7
【考点3:根据回归方程求原数据中的值】 8
【考点4:根据回归方程进行数据估计】 11
【考点5:求回归直线方程】 14
【考点6:最小二乘法的概念及辨析】 20
【考点7:残差的计算】 22
【考点8:决定系数的计算及分析】 26
【考点9:非线性回归】 28
【知识梳理】
1.一元线性回归模型
把式子为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称
为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
2.随机误差
在线性回归模型Y=bx+a+e中,a和b为模型的未知参数,e是Y与bx+a之间的误差,通常e为随机变
量,称为随机误差.它的均值E(e)=0,方程D(e)=σ2>0.
线性回归模型的完整表达式为,在此模型中,随机误差e的方差σ2越小,用bx+a
预报真实值y的精度越高.
3.线性经验回归方程与最小二乘法
设满足一元线性回归模型的两个变量的n对样本数据为,由
(i=1,2,,n),得,显然越小,表示样本数据点离直线y=bx+a
的竖直距离越小.
通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线y=bx+a的“整体接近程度”.
当a,b的取值为时,Q达到最小.将称为Y关于x的经验回
归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最
小二乘法,求得的叫做b,a的最小二乘估计.
经验回归直线一定过点.
4.求经验回归方程的一般步骤
(1)作出散点图,判断两变量是否具有线性相关关系,若具有线性相关关系,则可求其经验回归方程;
(2)列表求出的值;
(3)利用公式先计算,再根据经验回归直线过样本点的中心计算;
(4)写出经验回归方程.
求经验回归方程,关键在于正确求出系数,由于计算量较大,所以计算时要仔细谨慎、分层进行,避免因计算产生错误要特别注意,只有两个变量呈线性相关关系时,求出的经验回归方程才有意义.
5.残差分析
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减
去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
6.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称
为残差图.在残差图中,残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为,残差平方和越小,模型拟合效果越好.
(3)利用刻画拟合效果
=.
越大,模型的拟合效果越好,越小,模型的拟合效果越差.
7.回归分析的三大常用结论
(1)求解经验回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心.
(2)根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
(3)根据的值可以判断两个分类变量有关的可信程度,若越大,则两分类变量有关的把握越大.
【考点1:由散点图画求近似回归直线】
1.(25-26高一下·全国·课后作业)下图是某地区2010年至2019年污染天数(单位:天)与年份的折线图.根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型,,,则( )
A., B.,
C., D.,
【答案】C
【分析】根据折线图中各阶段的数据,计算其样本中心纵坐标、极差,并结合数据的变化趋势画出近似回归直线,即可确定回归方程参数之间的大小关系.
【详解】根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型,,,
∴由图知:2010年至2014年数据为;
2015年至2019年数据为;
2010年至2019年数据为;均成递减趋势.
又,,,且极差分别为6、51、65,
三条回归方程的直线大致图象,如下图示:
∴回归方程的斜率大小关系为,且截距.
故选:C.
2.(25-26高二下·全国·课后作业)若两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是( )
A. B. C. D.
【答案】C
【分析】由图可知函数的函数值既可以为正,也可为负,结合选项分析即可得到答案.
【详解】由散点图可知,此曲线类似对数函数型曲线,因此可用函数模型进行拟合,而选项A、B、D中函数值只能为负或只能为正,所以不符合散点图.
故选:C.
3.(25-26高三上·安徽滁州·月考)下表为2018年—2022年的中国数字经济规模(单位:万亿元):
年份
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
中国数字经济规模y
31.3
35.8
39.2
45.5
50.2
则下列所给函数模型中比较适合这一数据关系的是( )
A. B.
C. D.
【答案】C
【分析】取代入各选项中求出y值,再与50.2比较即可得答案.
【详解】对于,当时,.与50.2相差较大;
对于,当时,,与50.2相差较大;
对于,当时,,与50.2相差较大;
根据数据可得中国数字经济规模每年比上一年增长12%左右,所以比较合适,
故选:C.
4.(25-26高二下·全国·课后作业)鲫鱼产卵后,鱼卵的孵化时间(单位:天)会受到水温(单位:℃)的影响,下面是某生物研究小组进行8次观察实验收集到的数据:
水温x/℃
15
16
18
20
21
23
26
29
孵化时间y/天
8
7
6
5
5
4
3
2
(1)画出上述成对数据的散点图;
(2)已知水温对鱼卵的孵化时间可表示为一元线性回归模型,请在散点图中近似地作出表示孵化时间y和水温x之间关系的直线,并说明该一元线性回归模型的自变量与因变量.
【答案】(1)作图见解析
(2)作图见解析,水温x为自变量,孵化时间y为因变量
【分析】(1)根据表格中的数据,以x轴表示水温,y轴表示孵化时间,画出散点图;
(2)由一元线性回归模型定义,近似作出直线,并分析回归模型中自变量和因变量.
【详解】(1)以x轴表示水温,y轴表示孵化时间,可作散点图如下:
(2)直线如图所示,由(1)中散点图及一元线性回归模型定义可得,其中水温x为自变量,孵化时间y为因变量.
5.(25-26高三·上海·课堂例题)有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第二行表示此种食品所含热量的百分比,第三行数据表示由一些美食家以百分制给出的对此种食品口味的评价:
品牌
A
B
C
D
E
F
G
H
I
J
所含热量的百分比
25
34
20
19
26
20
19
24
19
13
口味记录
89
89
80
78
75
71
65
62
60
52
(1)作出散点图;
(2)你能从散点图中发现两者之间的近似关系吗?
(3)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;
(4)对于食品,为什么人们更喜欢吃位于直线上方的食品而不是下方的?
【答案】(1)作图见解析
(2)基本近似成线性相关关系
(3)作图见解析
(4)因为直线上方的食品口味更好.
【分析】对于(1),首先以两个变量分别为横轴和纵轴作平面直角坐标系,再在坐标系中描出各点坐标,即作出散点图;
对于(2),由散点图中点的分布规律可判断两变量的相关性;
对于(3),根据(1)的散点图,画一条直线近似地表示两个变量线性相关即可;
对于(4),从口味分析.
【详解】(1)散点图如图所示;
(2)从散点图上可以看出,食品所含热量的百分比与口味值之间总体趋势近似地成一条直线,也就是说他们之间是线性相关的;
(3)直线如上图所示;
(4)因为当直线上方的食品和下方的食品所含热量相同时,直线上方的食品口味更好.
【考点2:用回归直线方程对总体进行估计】
1.(25-26高三上·湖北随州·期末)假设某超市今年上半年每个月的销售额(单位:万元)与广告支出(单位:万元)的经验回归方程为.若该超市计划明年5月份的销售额为10万元,则估计该超市明年5月份的广告支出为________万元.
【答案】2.5/
【分析】在回归方程中令,求得,得解.
【详解】由,得,
则估计该超市明年5月份的广告支出为2.5万元.
故答案为:.
2.(24-25高二下·新疆喀什·期末)根据调查,家庭年收入(万元)与年消费(万元)的回归方程是.若某家庭年收入为50万元,预测其年消费为 __________万元 .
【答案】30.5
【分析】根据线性回归方程求当时的值.
【详解】当时,,
则若某家庭年收入为50万元,预测其年消费为万元.
故答案为:
3.(2025·上海奉贤·三模)为了研究某班学生的脚步(单位厘米)和身高之间有线性相关关系,设其回归直线方程为.该班某学生的脚长为24,据此估计其身高为______.
【答案】
【分析】将代入回归直线方程即可得解.
【详解】由题意,令,则,
即该班某学生的脚长为24,据此估计其身高为厘米.
故答案为:.
4.(24-25高二上·辽宁·期末)已知与具有相关关系,且利用关于的回归直线方程进行预测,当时,,当时,,则关于的回归直线方程中的回归系数为__________.
【答案】5
【分析】由题意设出回归直线方程,由待定系数法即可得解.
【详解】设关于的回归直线方程为,由题意得,解得,即回归系数为5.
故答案为:5.
5.(多选)(24-25高二下·甘肃白银·期末)(多选)某种细胞在培养正常的情况下,时刻(单位:分)与细胞数(单位:个)的部分数据如下表所示:
1
2
3
4
5
52
95
185
227
若与线性相关,由上表数据求得经验回归方程为,则下列说法正确的是( )
A.与正相关 B.
C.细胞数逐分增加,平均每分钟增加10个左右 D.预计10分钟后细胞数约为450个
【答案】ABD
【分析】由回归方程中的系数大于0,可判断A;再根据线性回归方程过样本中心点,可求得的值,进而可判断BCD.
【详解】由回归方程中的系数大于0,可知与正相关,故A项正确;
由表中数据可知,又因为回归方程为,
把代入回归方程中,解得,所以,解得,故B项正确;
由经验回归方程知细胞数逐分增加,平均每分钟增加44个左右,故C项错误;
将代入回归方程中,得,故D项正确.
故选:ABD.
【考点3:根据回归方程求原数据中的值】
1.(2026·广东清远·二模)已知线性相关的两个变量的取值如表所示,如果其线性回归方程为,则( )
3
4
6
7
20
40
80
A.50 B.60 C.70 D.75
【答案】B
【分析】求出样本中心,代入回归方程求解即可.
【详解】因为,
又因为所有回归方程都过样本中心,
所以将点代入回归方程,
得,
解得.
2.(25-26高二上·江西赣州·期末)已知变量x,y的数据如下若x与y的回归直线方程为,则( )
x
3
4
6
7
y
2.5
3
m
5.9
A.3.5 B.4 C.4.2 D.5
【答案】B
【分析】由题意可得,求,,并代入求解即可.
【详解】由题意可得,,,
将,代入,
可得,解得.
故选:B.
3.(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
【答案】C
【分析】根据线性回归方程一定过进行计算即可.
【详解】根据表中数据,,,
因为线性回归方程一定过,
所以,
解得.
故选:C.
4.(25-26高二下·江苏无锡·期中)稀土被誉为工业的维生素,具有无法取代的优异磁、光、电性能,对改善产品性能,增加产品品种,提高生产效率起到了巨大的作用.右表是2024年前5个月某国稀土出口均价(单位:万元吨)与月份的统计数据.若与的线性回归方程为,则的值为( )
1
2
3
4
5
1.7
2.4
2.0
1.6
A.1.4 B.1.5 C.1.6 D.1.7
【答案】B
【分析】根据线性回归方程为过样本中心点求解即可.
【详解】由题意可知,,
因为线性回归方程为过样本中心点,
所以,
所以,解得.
故选:
5.(2026高三·全国·专题练习)下表为2017—2023年某企业两轮电动车的年产量(单位:万辆),其中2017—2023年的年份代码分别为1—7.
年份代码
1
2
3
4
5
6
7
年产量万辆
31
33
38
44
已知与具有线性相关关系,且满足经验回归方程,则的值为( )
A.146.5 B.164.8 C.179.5 D.197.8
【答案】B
【分析】先求出,又因为点在经验回归直线上,得出即可计算求解.
【详解】由表中数据得,因为点在经验回归直线上,
所以,所以.
故选:B.
【考点4:根据回归方程进行数据估计】
1.(25-26高二下·江西吉安·期中)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业变革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为吉安市统计的2025年11月至2026年3月这5个月该市AI电脑的月销量,其中为月份代号,(单位:千台)为AI电脑的月销量.
月份
2025年11月
2025年12月
2026年1月
2026年2月
2026年3月
月份代号
1
2
3
4
5
月销量
0.5
0.9
1
1.2
1.4
经过分析,与线性相关,且其线性回归方程为,估计2026年4月的吉安市AI电脑的月销量为( )
A.1.63 B.1.61 C.1.57 D.1.52
【答案】A
【分析】先求得,然后利用回归方程过样本中心点求得,进而求得估计值.
【详解】因为,
所以,
所以关于的线性回归方程为,
2026年4月对应的,代入得.
2.(2026·天津·二模)芯片作为集成电路上的载体广泛应用于手机和航天等多个领域.某公司根据市场调研与统计得到,从年至年在芯片技术上的研发投入(亿元)与收益(亿元)的数据统计如下:
由上图发现可以用一元线性回归模型刻画收益与投入的关系.根据以上信息,如下判断错误的为( )
A.该公司收益数据的极差为
B.该公司收益数据的中位数为
C.可推断与两个变量正线性相关
D.若年投入亿元,则收益一定为亿元
【答案】D
【分析】利用极差的定义可判断A选项;利用中位数的定义可判断B选项;利用相关性可判断C选项;利用回归直线的概念可判断D选项.
【详解】对于AB选项,将收益由小到大排列依次为、、、、、、,
该公司收益数据的极差为,A对,
该公司收益数据的中位数为,B对;
对于C选项,由散点图可知,可推断与两个变量正线性相关,C对;
对于D选项,用回归方程计算的收益只是个估计值,而不是准确值,
即若年投入亿元,则收益不一定为亿元,D错.
3.(多选)(2026·山东德州·二模)(多选)下表是我国2021年至2025年生活垃圾无害化处理量(单位:亿吨)与年份代码(1-5分别对应2021-2025)的相关数据.根据表中数据求得关于的经验回归方程为,则( )
1
2
3
4
5
12
18
25
30
34
A.与正相关
B.回归直线过点
C.
D.预测2030年生活垃圾无害化处理量为60亿吨
【答案】AC
【详解】,,
而回归直线为,故,故,故C正确,
因为,故与正相关,故A正确;
当时,,故B错误;
2030年对应,此时生活垃圾无害化处理量为(亿吨),
故D错误.
4.(多选)(2026·四川攀枝花·二模)(多选)某公司近5年的利润情况如下表所示:
第年
1
2
3
4
5
利润/亿元
2
3
4
5
7
利用最小二乘法计算数据,得到的经验回归方程为,则( )
A.变量与正相关 B.回归直线一定过点
C. D.预测该公司第7年的利润约为9亿元
【答案】ACD
【分析】根据回归方程判断与成正相关,即可判断A;求出、,根据回归直线方程必过,即可求出,即可判断BC;令求出,即可预测第7年的利润,即可判断D.
【详解】因为回归直线方程为,且,所以与成正相关,故A正确;
由题意可得:,,
因为回归直线方程为必过样本中心点,故B错误;
则,解得,故C正确;
当时,,即该公司第7年的利润约为9亿元,故D正确.
5.(多选)(2026高三·全国·专题练习)(多选)下面统计了某品牌新能源汽车2024年上半年的销售量(单位:万辆)的情况,如下表:
月份
1
2
3
4
5
6
月销售量万辆
7.3
8.4
9.4
10.2
10.1
若月销售量关于月份的经验回归方程为,则( )
A.月销售量与月份呈正相关
B.
C.样本的残差约为
D.根据该模型,该品牌新能源汽车2024年8月销售量的预测值为11.52万辆
【答案】ABD
【分析】由回归方程可判断A;利用回归方程过样本中心点可求得判断B;当时,,可求样本的残差判断C;当时,可求判断D.
【详解】因为经验回归方程中,所以月销售量与月份呈正相关,故A正确.
易知,则,所以,解得,故B正确.
当时,,所以样本的残差约为,故C错误.
当时,,故D正确.
故选:ABD.
【考点5:求回归直线方程】
1.(25-26高二下·全国·课后作业)一个车间为了规定工时,需要确定加工零件所花费的时间,为此进行了5次试验,测得的数据如下:
零件数个
10
20
30
40
50
加工时间分钟
62
68
75
81
89
如果与线性相关,求回归直线方程;
附:,.
【答案】
【详解】根据题中公式,结合表中数据进行运算求解即可;
由题中数据得,,
,
,
,.
因为,,
故所求的回归直线方程为.
2.(25-26高二下·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
【答案】(1);
(2)
【详解】(1),,
,
则,
所以关于的线性回归方程为;
(2)中,令得,
预测记忆力为9的学生的判断力为.
3.(2026·陕西西安·模拟预测)随着新能源产业的发展,我市近年来新能源汽车保有量快速增长,为了研究我市充电桩建设的情况,能源部门收集到了2021年到2025年充电桩数量(单位:万个),为方便研究,年份代码用表示(用分别表示2021年,2022年,…,2025年),具体参考数据如下表:
统计量
数值
15
21
55
72.6
(1)请根据表中数据,建立关于的回归直线方程;
(2)现对该市某区域现有的9个充电桩进行检查,其中4个为快充桩,随机抽取3个充电桩进行检查,记抽到的快充桩个数为,求的分布列及均值.
(参考公式:)
【答案】(1);
(2)的分布列为:
0
1
2
3
均值.
【分析】(1)代入回归直线方程的计算公式计算回归直线方程;
(2)根据题意可以看出服从超几何分布,根据超几何分布的概率计算公式可得到的分布列及均值.
【详解】(1)由题意可得:;;
故;
;
则关于的回归直线方程为:.
(2)由题意知,随机变量的取值为:0,1,2,3;则:
;
;
;
故的分布列为:
0
1
2
3
所以随机变量的均值.
4.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
2
4
6
8
10
40
45
50
55
60
经计算:,,,
(1)求关于的线性回归方程;(参考公式:,)
(2)若明年计划投入宣传费12万元,预测年利润.
【答案】(1)
(2)万元
【分析】(1)根据所给的数据,结合所给的公式进行求解即可;
(2)利用代入法,结合(1)中的结论进行求解即可.
【详解】(1)
,
,
所以,
因此,
所以关于的线性回归方程;
(2)把代入中,得,
所以预测明年利润为万元.
5.(2026·重庆九龙坡·二模)2026 年 3 月, 某市“山城邻里”社区团购平台在市中心商业区设立户外直播间, 推广本地特产晚熟春橙. 该社区团购平台共进行了5场户外直播销售,相应的直播时长与销售额数据经财务与运营双岗复核如下:
场次
1
2
3
4
5
时长(小时)
1
2
3
4
5
销售额(万元)
3.0
5.0
7.0
10.0
12.0
(1)求销售额关于直播时长的经验回归方程;
(2)从这5场直播中随机抽取2场复盘,记“销售额超过7万元”的场数为,求的分布列与数学期望.
附:回归直线的斜率和截距的最小二乘估计公式分别为: ,.
【答案】(1);
(2)的分布列为
数学期望.
【分析】(1)求经验回归方程:先计算,,,,再代入最小二乘公式算,最后由得回归方程;
(2)求分布列与数学期望:先确定的可能取值,再用超几何分布概率公式计算各取值概率,列出分布列后求期望.
【详解】(1)首先计算均值:,,
计算所需求和项:
,
,
根据最小二乘公式计算系数:
,
,
因此,经验回归方程为.
(2)5场直播中,销售额超过7万元的共有2场,不超过7万元的共有3场,的所有可能取值为0,1,2,服从超几何分布.
计算概率:
,
,
.
因此的分布列为:
计算数学期望:.
【考点6:最小二乘法的概念及辨析】
1.(2026高二下·上海·专题练习)用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【答案】D
【分析】根据最小二乘法的概念和求解过程,即可求解.
【详解】根据最小二乘法的概念和求解,可得回归方程是为了使得每个数据与估计值之间的差的平方和最小.
故选:D.
2.(2026·陕西宝鸡·模拟预测)回归直线方程的系数a,b的最小二乘法估计使函数最小,Q函数指( )
A. B.
C. D.
【答案】A
【分析】由表示随机误差的平方和得出答案.
【详解】是指所求回归直线方程在各点的值与真实值的误差的平方和,
即.
故选:A
3.(24-25高二下·陕西西安·期末)一组成对数据样本中心点为,由这组数据拟合的线性回归方程为,用最小二乘法求回归方程是为了使( )最小.
A.总偏差平方和 B.残差平方和
C.回归平方和 D.竖直距离和
【答案】B
【分析】使用最小二乘法的定义进行求解.
【详解】最小二乘法求回归方程,是为了使残差平方和最小,B正确;其他选项错误.
故选:B
4.(25-26高一下·陕西宝鸡·期中)如果有个点,可以用表达式( )来刻画这些点与直线的接近程度,当该式达到最小值时,直线就是我们所要求的直线,这种方法称为最小二乘法.
A.
B.
C.
D.
【答案】C
【分析】根据最小二乘法的定义,即可求解.
【详解】根据最小二乘法的概念,可得有个点,
可以用表达式:来刻画这些点与直线的接近程度.
故选:C.
5.(多选)(24-25高二下·辽宁·期末)(多选)为了解某种药物的疗效,患者服用该药物,短时间内血液中药物浓度达到峰值,研究员统计了血液中药物浓度(单位:)与代谢时间(单位:)的数据,如下表所示:
0
1
2
3
4
5
6
150
143
132
123
114
104
95
根据表中数据可得回归方程为,则下列说法正确的是( )
附:回归直线中斜率和截距的最小二乘估计公式分别为,,相关系数.
A.
B.当时,对应样本点的残差为0.32
C.若再增加一组数据,则关于的回归直线的斜率变大
D.若删去数据,则与的相关系数不变
【答案】ABD
【分析】求出的平均值,即可求出,判断A;根据残差的计算判断B;根据最小二乘估计公式以及相关系数公式可判断CD.
【详解】由题意知,
,
所以,A项正确;
由上可知,当时,,
则残差为,B项正确;
再增加一组数据后,,,所以的值不变,
的值也不变,故关于的回归直线的斜率不变,C项错误;
删去数据后,,,所以的值不变,
的值也不变,因此与的相关系数不变,D项正确.
故选:ABD
【考点7:残差的计算】
1.(25-26高二下·海南·期中)根据生物实验中的一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比( )
A.决定系数变小 B.残差平方和变小
C.相关系数变大 D.不变
【答案】A
【详解】增加点,从散点图中可以看出拟合效果变差;
决定系数越接近1,拟合效果越好,所以拟合效果变差后决定系数变小,故A正确;
残差平方和越小,拟合效果越好,所以残差平方和变大,故B错误;
越接近1,相关程度越强,拟合效果越好,由于两个变量成正相关,所以相关系数变小,故C错误;
增加点前的的平均数为,增加点后的的平均数为,
所以变大,故D错误.
2.(25-26高二下·江苏南京·期中)某学校一同学研究温差与本校当天新增感冒人数(人)的关系,该同学记录了5天的数据:
5
6
8
9
12
17
20
25
28
35
经过拟合,发现基本符合经验回归方程,则下列选项错误的是( )
A.样本中心点为 B.
C.时,残差为 D.相关系数
【答案】B
【分析】由回归直线必过样本中心可判断A项,代入样本中心点即可判断B,由残差公式可判断C项,由线性回归方程的斜率即可相关系数正负可判断D项.
【详解】对于A项,因为,,
所以样本中心点为,故A项正确;
对于B项,由回归直线必过样本中心可得:,解得:,故B项不正确;
对于C项,由B项知,,令,则,
所以残差为,故C项正确;
对于D项,经验回归方程中,斜率,说明与正相关,
故相关系数,故D项正确.
3.(25-26高二下·吉林·期中)已知根据如下表所示的样本数据,已知线性回归方程为,且该回归直线经过样本中心,则当时的残差为( )
2
4
6
8
10
5.8
5.1
3.8
3.2
2.1
A.0.1 B.0.2 C.0.3 D.0.4
【答案】B
【分析】先根据已知条件求出,再求出时的预测值和真实值,最后根据残差的定义求出残差即可.
【详解】由表可知:,,
因为样本中心点必在线性回归直线上,
代入得:,解得.
当时,,
所以残差为,
故选:B.
4.(多选)(2026·新疆·二模)(多选)某电子商城统计了最近5个月某品牌电脑的实际销量,如下表所示:
时间x(月份)
1
2
3
4
5
销量y(百台)
0.3
0.4
0.6
0.7
0.9
若y与x线性相关,且经验回归方程为:,则下列说法正确的是( )
A.变量x,y正相关
B.
C.可以预测当时,商城内该电脑的销量为1百台
D.当时,残差为
【答案】ABD
【分析】求出样本中心点,进而求出经验回归方程,再逐项求解判断.
【详解】对于A,由,得变量x,y正相关,A正确;
对于B,,
因此,B正确;
对于C,,当时,(百台),C错误;
对于D,当时,,残差为,D正确.
5.(25-26高二下·天津滨海新区·期中)某商家统计了某商品最近5个月销量,如表所示,若与线性相关,且经验回归方程为,
时间
1
2
3
4
5
销量万只
5
4.5
4
3.5
2.5
给出下列说法:
①由题中数据可知,变量与负相关
②当时,残差为
③可以预测当时销量约为万只
④经验回归方程中
其中正确的是__________(填序号).
【答案】①③④
【分析】根据表格中销量与时间的变化规律可判断①;利用表格分别求出销量与时间的平均数,得样本中心点,代入回归方程求出判断④;进而推得线性回归方程,再利用残差定义,计算判断②;利用线性回归方程赋值计算即可判断③.
【详解】由经验回归方程,可知回归直线的斜率,即变量与负相关,同时结合表格,可知销量随着的增大而减小,故①正确;
又由表格可得,,
因样本中心点在回归方程上,则得,故④正确;
则回归方程为,当时,,此时残差为,故②错误;
当时,代入回归方程可得,即可以预测当时销量约为万只,故③正确.
【考点8:决定系数的计算及分析】
1.(2026高二·全国·专题练习)某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线的方程:,相关系数为,决定系数为;经过残差分析,确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线的方程:相关系数为,决定系数为.则以下结论中,正确的是( ).
① ② ③ ④
A.①② B.①②③ C.②④ D.②③④
【答案】B
【分析】利用回归方程的性质,利用相关系数和相关指数分析解答.
【详解】由散点图可知,x,y之间是正相关关系,所以,故①正确;
由散点图可知,回归直线的斜率是正数,且的斜率大于的斜率,
所以,故②③正确:
由散点图可知,去掉“离群点”E后,相关性更强,拟合的效果更好,
所以,故④错误.
故选:B.
2.(多选)(25-26高二下·河北沧州·期中)(多选)两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
【答案】AC
【分析】根据相关系数的概念可判定AB,根据决定系数的概念可判定CD.
【详解】对于A:因为r的符号反映相关关系的正负性,故A正确;
对于B:根据相关系数越接近1,变量相关性越强,故B错误;
对于C:决定系数越大,残差平方和越小,效果越好,故C正确,D错误.
故选:AC.
3.(多选)(25-26高二下·河北张家口·月考)(多选)如下图所示,5个数据,去掉后,下列说法正确的是( )
A.相关系数r变大 B.残差平方和变大
C.决定系数变小 D.解释变量x与响应变量y的相关性变强
【答案】AD
【分析】由散点图知,去掉离群点后,与的相关性变强,且为正相关,由此判断即可.
【详解】由散点图知,去掉离群点后,与的相关性变强,且为正相关,
所以相关系数的值变大,决定系数的值变大,残差平方和变小.
故选:AD.
4.(多选)(2026·河南开封·模拟预测)(多选)如图所示,有一散点图在5个数据中去掉后,下列说法中错误的是( )
A.残差平方和变大 B.相关系数变小
C.决定系数变小 D.解释变量与响应变量的相关性变强
【答案】ABC
【分析】利用散点图分析数据,判断相关系数,相关指数,残差平方和的变化情况即可得.
【详解】从散点图可分析出,若去掉点,则解释变量与响应变量的线性相关性变强,
且是正相关,所以相关系数变大,决定系数变大,残差平方和变小,
故A、B、C错误,D正确.
5.(多选)(25-26高三下·湖北武汉·开学考试)(多选)下列说法正确的是( )
A.在使用经验回归方程进行预测时,经验回归方程只适用于所研究的样本的总体
B.决定系数,可以作为衡量一个模型拟合效果的指标,它越大说明拟合效果越好
C.样本相关系数,当时,表明成对样本数据间没有相关关系
D.经验回归方程相对于点的残差为
【答案】ABD
【分析】本题利用回归分析的基本概念,样本相关系数的解释,决定系数的使用以及残差的计算即可求解.
【详解】对于A,使用经验回归方程进行预测时,经验回归方程只适用于所研究的样本的总体,故A正确;
对于B,决定系数表示的是拟合效果,越大模型的拟合效果越好,故B正确;
对于C,当时,表示成对样本数据间的相关关系很小,并不是没有相关关系,故C错误;
对于D,残差为,故D正确.
【考点9:非线性回归】
1.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
1
2
3
4
5
4
7
12
20
33
经计算:,,令,,,,,,经分析.与呈线性相关关系,用最小二乘法求得线性回归方程,则关于的回归方程为( )(参考公式:,)
A. B. C. D.
【答案】A
【分析】根据给定数据,利用最小二乘法求出关于的线性回归方程,进而求出关于的回归方程.
【详解】令,,由与呈线性相关关系,得线性回归方程,
则,,
因此,即,所以关于的回归方程为.
2.(25-26高二下·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
【答案】(1)②合适
(2)
【分析】(1)利用函数①②③的性质及表中的数据,即可求解;
(2)先将非线性回归方程转化成线性回归方程,再根据题设条件,利用最小二乘法,即可求解.
【详解】(1)由表格可知,增大时,值整体呈上升趋势但存在局部波动,比较函数①②③,
选择②()作为学习时间x和平均成绩y的回归类型最合适.
(2)对()两边取以为底的对数可得,
设,则,
,
,所以,
故,即,所以.
3.(2026·辽宁沈阳·三模)某农业技术站研究化肥施用量对大棚青菜产量的影响.在一定范围内,施肥量(单位kg/亩)越大,青菜产量(单位kg/亩)越高.实验测得具体数据如下表:
施肥量
2
3
4
5
6
青菜产量
4200
4300
4350
4380
4400
根据散点数据特征,研究人员分析得出产量与施肥量近似满足的关系,取,经计算可知,,,,
(1)请根据上述数据,计算得出产量y关于施肥量x的回归方程,并结合常识描述的实际意义,为简化计算,计算过程中、均精确到个位数.
(2)若青菜的收购价格为2元/kg,化肥的采购价格为12元/kg,请从利润最大的角度给出大棚的最优施肥量.
参考公式:,.
【答案】(1),实际意义是当化肥使用量无限增加时,青菜产量的理论上限为/亩
(2)当施肥量为10kg/亩时利润最大
【分析】(1)根据题意,利用回归系数的公式,求得,进而得出回归直线方程,结合的值,得出的实际意义;
(2)由利润为,结合基本不等式,即可求解.
【详解】(1)根据题意,可得,
又由,
所以产量y关于施肥量x的回归方程为,
其中的实际意义是当化肥使用量无限增加时,青菜产量的理论上限为/亩.
(2)设利润为元/亩,
当且仅当kg/亩时取等,即当施肥量为10kg/亩时利润最大.
4.(24-25高二下·山东·月考)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
【答案】(1)模型建立y与x的回归方程更合适;
(2);
(3)960万元.
【分析】(1)利用非线性转化为线性,再求相关系数即可得到判断;
(2)利用非线性转化为线性,再求线性回归方程系数即可得解;
(3)利用基本不等式求最大值即可.
【详解】(1)由题意知,,
因为,所以用模型建立y与x的回归方程更合适.
(2)令,回归方程为,因为,,
所以关于x的回归方程为,即.
(3)由题意知,
当且仅当,即时取等号,
则,所以.
所以当研发经费投入为60万元时企业生产的利润最大,最大利润为960万元.
5.(25-26高二下·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
【答案】(1)
(2)644.6;258.3
【分析】(1)根据散点图分析得出回归方程类型,结合非线性回归模型转化线性回归方程分析求解即可;
(2)根据(1)中的方程代入相关变量计算分析即可.
【详解】(1)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型,
令,先建立关于的线性回归方程,
由于 ,
则,
所以关于的线性回归方程为,
因此关于的回归方程为.
(2)当时,年销售量的预报值,
年利润的预报值.
第 1 页 共 18 页
学科网(北京)股份有限公司
$
专题8.2 一元线性回归模型及其应用
【知识梳理】 1
【考点1:由散点图画求近似回归直线】 3
【考点2:用回归直线方程对总体进行估计】 5
【考点3:根据回归方程求原数据中的值】 5
【考点4:根据回归方程进行数据估计】 6
【考点5:求回归直线方程】 8
【考点6:最小二乘法的概念及辨析】 13
【考点7:残差的计算】 14
【考点8:决定系数的计算及分析】 16
【考点9:非线性回归】 17
【知识梳理】
1.一元线性回归模型
把式子为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称
为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
2.随机误差
在线性回归模型Y=bx+a+e中,a和b为模型的未知参数,e是Y与bx+a之间的误差,通常e为随机变
量,称为随机误差.它的均值E(e)=0,方程D(e)=σ2>0.
线性回归模型的完整表达式为,在此模型中,随机误差e的方差σ2越小,用bx+a
预报真实值y的精度越高.
3.线性经验回归方程与最小二乘法
设满足一元线性回归模型的两个变量的n对样本数据为,由
(i=1,2,,n),得,显然越小,表示样本数据点离直线y=bx+a
的竖直距离越小.
通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线y=bx+a的“整体接近程度”.
当a,b的取值为时,Q达到最小.将称为Y关于x的经验回
归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最
小二乘法,求得的叫做b,a的最小二乘估计.
经验回归直线一定过点.
4.求经验回归方程的一般步骤
(1)作出散点图,判断两变量是否具有线性相关关系,若具有线性相关关系,则可求其经验回归方程;
(2)列表求出的值;
(3)利用公式先计算,再根据经验回归直线过样本点的中心计算;
(4)写出经验回归方程.
求经验回归方程,关键在于正确求出系数,由于计算量较大,所以计算时要仔细谨慎、分层进行,避免因计算产生错误要特别注意,只有两个变量呈线性相关关系时,求出的经验回归方程才有意义.
5.残差分析
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减
去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
6.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称
为残差图.在残差图中,残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为,残差平方和越小,模型拟合效果越好.
(3)利用刻画拟合效果
=.
越大,模型的拟合效果越好,越小,模型的拟合效果越差.
7.回归分析的三大常用结论
(1)求解经验回归方程的关键是确定回归系数,应充分利用回归直线过样本点的中心.
(2)根据经验回归方程计算的值,仅是一个预报值,不是真实发生的值.
(3)根据的值可以判断两个分类变量有关的可信程度,若越大,则两分类变量有关的把握越大.
【考点1:由散点图画求近似回归直线】
1.(25-26高一下·全国·课后作业)下图是某地区2010年至2019年污染天数(单位:天)与年份的折线图.根据2010年至2014年数据,2015年至2019年的数据,2010年至2019年的数据分别建立线性回归模型,,,则( )
A., B.,
C., D.,
2.(25-26高二下·全国·课后作业)若两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是( )
A. B. C. D.
3.(25-26高三上·安徽滁州·月考)下表为2018年—2022年的中国数字经济规模(单位:万亿元):
年份
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
中国数字经济规模y
31.3
35.8
39.2
45.5
50.2
则下列所给函数模型中比较适合这一数据关系的是( )
A. B.
C. D.
4.(25-26高二下·全国·课后作业)鲫鱼产卵后,鱼卵的孵化时间(单位:天)会受到水温(单位:℃)的影响,下面是某生物研究小组进行8次观察实验收集到的数据:
水温x/℃
15
16
18
20
21
23
26
29
孵化时间y/天
8
7
6
5
5
4
3
2
(1)画出上述成对数据的散点图;
(2)已知水温对鱼卵的孵化时间可表示为一元线性回归模型,请在散点图中近似地作出表示孵化时间y和水温x之间关系的直线,并说明该一元线性回归模型的自变量与因变量.
5.(25-26高三·上海·课堂例题)有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第二行表示此种食品所含热量的百分比,第三行数据表示由一些美食家以百分制给出的对此种食品口味的评价:
品牌
A
B
C
D
E
F
G
H
I
J
所含热量的百分比
25
34
20
19
26
20
19
24
19
13
口味记录
89
89
80
78
75
71
65
62
60
52
(1)作出散点图;
(2)你能从散点图中发现两者之间的近似关系吗?
(3)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系;
(4)对于食品,为什么人们更喜欢吃位于直线上方的食品而不是下方的?
【考点2:用回归直线方程对总体进行估计】
1.(25-26高三上·湖北随州·期末)假设某超市今年上半年每个月的销售额(单位:万元)与广告支出(单位:万元)的经验回归方程为.若该超市计划明年5月份的销售额为10万元,则估计该超市明年5月份的广告支出为________万元.
2.(24-25高二下·新疆喀什·期末)根据调查,家庭年收入(万元)与年消费(万元)的回归方程是.若某家庭年收入为50万元,预测其年消费为 __________万元 .
3.(2025·上海奉贤·三模)为了研究某班学生的脚步(单位厘米)和身高之间有线性相关关系,设其回归直线方程为.该班某学生的脚长为24,据此估计其身高为______.
4.(24-25高二上·辽宁·期末)已知与具有相关关系,且利用关于的回归直线方程进行预测,当时,,当时,,则关于的回归直线方程中的回归系数为__________.
5.(多选)(24-25高二下·甘肃白银·期末)(多选)某种细胞在培养正常的情况下,时刻(单位:分)与细胞数(单位:个)的部分数据如下表所示:
1
2
3
4
5
52
95
185
227
若与线性相关,由上表数据求得经验回归方程为,则下列说法正确的是( )
A.与正相关 B.
C.细胞数逐分增加,平均每分钟增加10个左右 D.预计10分钟后细胞数约为450个
【考点3:根据回归方程求原数据中的值】
1.(2026·广东清远·二模)已知线性相关的两个变量的取值如表所示,如果其线性回归方程为,则( )
3
4
6
7
20
40
80
A.50 B.60 C.70 D.75
2.(25-26高二上·江西赣州·期末)已知变量x,y的数据如下若x与y的回归直线方程为,则( )
x
3
4
6
7
y
2.5
3
m
5.9
A.3.5 B.4 C.4.2 D.5
3.(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
4.(25-26高二下·江苏无锡·期中)稀土被誉为工业的维生素,具有无法取代的优异磁、光、电性能,对改善产品性能,增加产品品种,提高生产效率起到了巨大的作用.右表是2024年前5个月某国稀土出口均价(单位:万元吨)与月份的统计数据.若与的线性回归方程为,则的值为( )
1
2
3
4
5
1.7
2.4
2.0
1.6
A.1.4 B.1.5 C.1.6 D.1.7
5.(2026高三·全国·专题练习)下表为2017—2023年某企业两轮电动车的年产量(单位:万辆),其中2017—2023年的年份代码分别为1—7.
年份代码
1
2
3
4
5
6
7
年产量万辆
31
33
38
44
已知与具有线性相关关系,且满足经验回归方程,则的值为( )
A.146.5 B.164.8 C.179.5 D.197.8
【考点4:根据回归方程进行数据估计】
1.(25-26高二下·江西吉安·期中)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业变革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为吉安市统计的2025年11月至2026年3月这5个月该市AI电脑的月销量,其中为月份代号,(单位:千台)为AI电脑的月销量.
月份
2025年11月
2025年12月
2026年1月
2026年2月
2026年3月
月份代号
1
2
3
4
5
月销量
0.5
0.9
1
1.2
1.4
经过分析,与线性相关,且其线性回归方程为,估计2026年4月的吉安市AI电脑的月销量为( )
A.1.63 B.1.61 C.1.57 D.1.52
2.(2026·天津·二模)芯片作为集成电路上的载体广泛应用于手机和航天等多个领域.某公司根据市场调研与统计得到,从年至年在芯片技术上的研发投入(亿元)与收益(亿元)的数据统计如下:
由上图发现可以用一元线性回归模型刻画收益与投入的关系.根据以上信息,如下判断错误的为( )
A.该公司收益数据的极差为
B.该公司收益数据的中位数为
C.可推断与两个变量正线性相关
D.若年投入亿元,则收益一定为亿元
3.(多选)(2026·山东德州·二模)(多选)下表是我国2021年至2025年生活垃圾无害化处理量(单位:亿吨)与年份代码(1-5分别对应2021-2025)的相关数据.根据表中数据求得关于的经验回归方程为,则( )
1
2
3
4
5
12
18
25
30
34
A.与正相关
B.回归直线过点
C.
D.预测2030年生活垃圾无害化处理量为60亿吨
4.(多选)(2026·四川攀枝花·二模)(多选)某公司近5年的利润情况如下表所示:
第年
1
2
3
4
5
利润/亿元
2
3
4
5
7
利用最小二乘法计算数据,得到的经验回归方程为,则( )
A.变量与正相关 B.回归直线一定过点
C. D.预测该公司第7年的利润约为9亿元
5.(多选)(2026高三·全国·专题练习)(多选)下面统计了某品牌新能源汽车2024年上半年的销售量(单位:万辆)的情况,如下表:
月份
1
2
3
4
5
6
月销售量万辆
7.3
8.4
9.4
10.2
10.1
若月销售量关于月份的经验回归方程为,则( )
A.月销售量与月份呈正相关
B.
C.样本的残差约为
D.根据该模型,该品牌新能源汽车2024年8月销售量的预测值为11.52万辆
【考点5:求回归直线方程】
1.(25-26高二下·全国·课后作业)一个车间为了规定工时,需要确定加工零件所花费的时间,为此进行了5次试验,测得的数据如下:
零件数个
10
20
30
40
50
加工时间分钟
62
68
75
81
89
如果与线性相关,求回归直线方程;
附:,.
2.(25-26高二下·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
3.(2026·陕西西安·模拟预测)随着新能源产业的发展,我市近年来新能源汽车保有量快速增长,为了研究我市充电桩建设的情况,能源部门收集到了2021年到2025年充电桩数量(单位:万个),为方便研究,年份代码用表示(用分别表示2021年,2022年,…,2025年),具体参考数据如下表:
统计量
数值
15
21
55
72.6
(1)请根据表中数据,建立关于的回归直线方程;
(2)现对该市某区域现有的9个充电桩进行检查,其中4个为快充桩,随机抽取3个充电桩进行检查,记抽到的快充桩个数为,求的分布列及均值.
(参考公式:)
4.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
2
4
6
8
10
40
45
50
55
60
经计算:,,,
(1)求关于的线性回归方程;(参考公式:,)
(2)若明年计划投入宣传费12万元,预测年利润.
5.(2026·重庆九龙坡·二模)2026 年 3 月, 某市“山城邻里”社区团购平台在市中心商业区设立户外直播间, 推广本地特产晚熟春橙. 该社区团购平台共进行了5场户外直播销售,相应的直播时长与销售额数据经财务与运营双岗复核如下:
场次
1
2
3
4
5
时长(小时)
1
2
3
4
5
销售额(万元)
3.0
5.0
7.0
10.0
12.0
(1)求销售额关于直播时长的经验回归方程;
(2)从这5场直播中随机抽取2场复盘,记“销售额超过7万元”的场数为,求的分布列与数学期望.
附:回归直线的斜率和截距的最小二乘估计公式分别为: ,.
【考点6:最小二乘法的概念及辨析】
1.(2026高二下·上海·专题练习)用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
2.(2026·陕西宝鸡·模拟预测)回归直线方程的系数a,b的最小二乘法估计使函数最小,Q函数指( )
A. B.
C. D.
3.(24-25高二下·陕西西安·期末)一组成对数据样本中心点为,由这组数据拟合的线性回归方程为,用最小二乘法求回归方程是为了使( )最小.
A.总偏差平方和 B.残差平方和
C.回归平方和 D.竖直距离和
4.(25-26高一下·陕西宝鸡·期中)如果有个点,可以用表达式( )来刻画这些点与直线的接近程度,当该式达到最小值时,直线就是我们所要求的直线,这种方法称为最小二乘法.
A.
B.
C.
D.
5.(多选)(24-25高二下·辽宁·期末)(多选)为了解某种药物的疗效,患者服用该药物,短时间内血液中药物浓度达到峰值,研究员统计了血液中药物浓度(单位:)与代谢时间(单位:)的数据,如下表所示:
0
1
2
3
4
5
6
150
143
132
123
114
104
95
根据表中数据可得回归方程为,则下列说法正确的是( )
附:回归直线中斜率和截距的最小二乘估计公式分别为,,相关系数.
A.
B.当时,对应样本点的残差为0.32
C.若再增加一组数据,则关于的回归直线的斜率变大
D.若删去数据,则与的相关系数不变
【考点7:残差的计算】
1.(25-26高二下·海南·期中)根据生物实验中的一组数据作出如图所示的散点图,并对这组数据进行回归分析后发现遗漏了点,增加点后再次进行回归分析,得到的结果和原来相比( )
A.决定系数变小 B.残差平方和变小
C.相关系数变大 D.不变
2.(25-26高二下·江苏南京·期中)某学校一同学研究温差与本校当天新增感冒人数(人)的关系,该同学记录了5天的数据:
5
6
8
9
12
17
20
25
28
35
经过拟合,发现基本符合经验回归方程,则下列选项错误的是( )
A.样本中心点为 B.
C.时,残差为 D.相关系数
3.(25-26高二下·吉林·期中)已知根据如下表所示的样本数据,已知线性回归方程为,且该回归直线经过样本中心,则当时的残差为( )
2
4
6
8
10
5.8
5.1
3.8
3.2
2.1
A.0.1 B.0.2 C.0.3 D.0.4
4.(多选)(2026·新疆·二模)(多选)某电子商城统计了最近5个月某品牌电脑的实际销量,如下表所示:
时间x(月份)
1
2
3
4
5
销量y(百台)
0.3
0.4
0.6
0.7
0.9
若y与x线性相关,且经验回归方程为:,则下列说法正确的是( )
A.变量x,y正相关
B.
C.可以预测当时,商城内该电脑的销量为1百台
D.当时,残差为
5.(25-26高二下·天津滨海新区·期中)某商家统计了某商品最近5个月销量,如表所示,若与线性相关,且经验回归方程为,
时间
1
2
3
4
5
销量万只
5
4.5
4
3.5
2.5
给出下列说法:
①由题中数据可知,变量与负相关
②当时,残差为
③可以预测当时销量约为万只
④经验回归方程中
其中正确的是__________(填序号).
【考点8:决定系数的计算及分析】
1.(2026高二·全国·专题练习)某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线的方程:,相关系数为,决定系数为;经过残差分析,确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线的方程:相关系数为,决定系数为.则以下结论中,正确的是( ).
① ② ③ ④
A.①② B.①②③ C.②④ D.②③④
2.(多选)(25-26高二下·河北沧州·期中)(多选)两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
3.(多选)(25-26高二下·河北张家口·月考)(多选)如下图所示,5个数据,去掉后,下列说法正确的是( )
A.相关系数r变大 B.残差平方和变大
C.决定系数变小 D.解释变量x与响应变量y的相关性变强
4.(多选)(2026·河南开封·模拟预测)(多选)如图所示,有一散点图在5个数据中去掉后,下列说法中错误的是( )
A.残差平方和变大 B.相关系数变小
C.决定系数变小 D.解释变量与响应变量的相关性变强
5.(多选)(25-26高三下·湖北武汉·开学考试)(多选)下列说法正确的是( )
A.在使用经验回归方程进行预测时,经验回归方程只适用于所研究的样本的总体
B.决定系数,可以作为衡量一个模型拟合效果的指标,它越大说明拟合效果越好
C.样本相关系数,当时,表明成对样本数据间没有相关关系
D.经验回归方程相对于点的残差为
【考点9:非线性回归】
1.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
1
2
3
4
5
4
7
12
20
33
经计算:,,令,,,,,,经分析.与呈线性相关关系,用最小二乘法求得线性回归方程,则关于的回归方程为( )(参考公式:,)
A. B. C. D.
2.(25-26高二下·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
3.(2026·辽宁沈阳·三模)某农业技术站研究化肥施用量对大棚青菜产量的影响.在一定范围内,施肥量(单位kg/亩)越大,青菜产量(单位kg/亩)越高.实验测得具体数据如下表:
施肥量
2
3
4
5
6
青菜产量
4200
4300
4350
4380
4400
根据散点数据特征,研究人员分析得出产量与施肥量近似满足的关系,取,经计算可知,,,,
(1)请根据上述数据,计算得出产量y关于施肥量x的回归方程,并结合常识描述的实际意义,为简化计算,计算过程中、均精确到个位数.
(2)若青菜的收购价格为2元/kg,化肥的采购价格为12元/kg,请从利润最大的角度给出大棚的最优施肥量.
参考公式:,.
4.(24-25高二下·山东·月考)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
5.(25-26高二下·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
第 1 页 共 18 页
学科网(北京)股份有限公司
$