内容正文:
8.2 一元线性回归模型及其应用
题型一 对最小二乘估计的理解
1.对成对数据、、…、用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【答案】D
【详解】根据最小二乘法的求解可知:回归方程是为了使得每个数据与估计值之间的差的平方和最小,
故选:D
2.回归直线方程的系数a,b的最小二乘法估计使函数最小,Q函数指( )
A. B.
C. D.
【答案】A
【详解】是指所求回归直线方程在各点的值与真实值的误差的平方和,
即.
故选:A
3.在最小二乘法中,用来刻画各样本点到直线“距离”的量是( )
A. B. C. D.
【答案】D
【详解】解:由最小二乘法的定义可知,用来刻画各个样本点与直线之间的“距离”,它们的和表示这些点与直线的接近程度;
故选:D
4.如果有个点,可以用表达式( )来刻画这些点与直线的接近程度,当该式达到最小值时,直线就是我们所要求的直线,这种方法称为最小二乘法.
A.
B.
C.
D.
【答案】C
【详解】根据最小二乘法的概念,可得有个点,
可以用表达式:来刻画这些点与直线的接近程度.
故选:C.
题型二 求线性经验回归方程
1.(25-26高二下·全国·单元测试)已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
【答案】C
【详解】由条件知,,设经验回归方程为,
则,
∴经验回归的方程是.
故选:C.
2.(25-26高二上·全国·单元测试)某校对学生记忆力和判断力进行统计分析,所得数据如表:
记忆力
2
5
6
8
9
判断力
7
8
10
12
18
则关于的线性回归方程为( )
A. B.
C. D.
【答案】B
【详解】方法一 由表中数据知,随着的增大,增大,所以与正相关,排除A,D,
又,,
由回归直线过样本点的中心,代入验证知B正确.
方法二 ,,
,,
所以关于的线性回归方程为.
故选:B.
3.(24-25高二下·辽宁·期末)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李某月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( )(参考公式:)
A.0.04 B.0.03 C.0.02 D.0.01
【答案】D
【详解】已知,则,,
则,
故选:D.
4.(25-26高二上·全国·单元测试)已知变量和变量的一组成对样本数据为,其中,其线性回归方程为,当增加两个样本数据和后,重新得到的回归直线的斜率为3,则在新的线性回归方程下,时,的估计值为( )
A.13 B.12 C.11 D.8
【答案】B
【详解】,增加两个样本点后的平均数为;
增加两个样本点前,,增加两个样本点后的平均数为.
设新的线性回归方程为,,解得,
新的线性回归方程为,则当时,.
故选:B.
5.(24-25高二下·全国·课后作业)某品牌的宣传支出与收入的数据如下表所示.
万元
200
400
500
600
800
万元
3000
4000
5000
6000
7000
则线性回归模型为______.
【答案】
【详解】设线性回归方程为,
,,
,
故答案为:.
6.(24-25高二下·辽宁·月考)一组互不相等的样本数据,其中,若在样本中加入数据后,新样本数据的回归直线方程与原样本数据的相同,则这组样本数据的回归直线方程为_______.
【答案】
【详解】设回归直线方程为,原数据样本的中心点为,
新数据样本的中心点为,
于是解得,
所以回归直线方程为.
故答案为:.
题型三 用线性经验回归方程求参数
1.(2026·山东青岛·一模)已知变量,的统计数据如下,若与的回归直线方程为,则( )
2.8
3.3
5.0
6.7
7.2
2.6
4.0
5.1
5.4
A.2.5 B.2.7 C.2.9 D.3.1
【答案】C
【详解】由题意,可得,,
所以样本点的中心坐标为,
代入回归直线方程,可得,
解方程得.
2.(25-26高三上·河北承德·期中)已知两个线性相关变量x与y的统计数据如下表:
x
3
4
5
6
7
y
2.4
m
4
4.6
5.2
其经验回归方程为 则m=( )
A.2.8 B.3 C.3.2 D.3.4
【答案】A
【详解】,,经验回归方程经过点,
所以,解得.
故选:A.
3.(24-25高二下·广东深圳·期末)某智能机器人公司从某年起7年的利润情况如下表所示,y关于x的回归直线方程是,则该智能机器人公司第4年利润的残差是( )
第x年
1
2
3
4
5
6
7
利润y/亿元
m
A.亿元 B.亿元 C.亿元 D.亿元
【答案】A
【详解】由题意,,关于的回归直线方程为,
所以,故,解得,
所以当时,,则.
故选:A
4.(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
【答案】C
【详解】根据表中数据,,,
因为线性回归方程一定过,
所以,
解得.
故选:C.
5.(2026·陕西咸阳·一模)某单位为了解日用电量(单位:千瓦时)与当天平均温度(单位:摄氏度)之间的关系,随机统计了4天的日用电量与当天的平均温度,绘制了如下表格,由表中数据可得线性回归方程,则实数________.
5
15
24
60
40
20
【答案】4
【详解】由表数据可得,
所以线性回归方程必过点,
所以,解得,
故答案为:.
题型四 解释回归方程的意义
1.(24-25高二下·黑龙江·期中)研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
【答案】B
【详解】对于A,因为时,,即山高估计为5km,A正确;
对于B,令,解得,即山高为8km处的年平均气温估计为℃,B错误;
对于C,由线性回归方程的系数的含义可知C正确;
对于D,因为,所以该地的山高与该山的年平均气温成负相关关系.
故选:B
2.(24-25高二下·贵州遵义·月考)相关变量的样本数据如下表:
x
1
2
3
4
y
2
3
a
5
经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为,下列说法正确的是( )
A.当每增加1时,一定增加1.5 B.当每增加13时,一定增加8
C. 与呈负相关 D.
【答案】D
【详解】对于A,因为回归直线方程为,故当每增加1时,增加约为 ,
故A错误;
对于B,因为回归直线方程为,故当每增加13时,增加约为,
故B错误;
对于C,因为,故与呈正相关,故C错误;
对于D,,故,故,故,
故D正确;
故选:D.
3.(2026·福建莆田·二模)为了探究六年级学生每日自主阅读时间与语文成绩的关系,某研究小组随机调查了50名学生,得到成对样本数据,其中表示每日自主阅读时间(单位:小时),表示语文成绩(单位:分).经计算得回归直线方程为.下列说法正确的是( )
A.该样本数据的相关系数为5.2
B.当阅读时间每增加1小时,语文成绩平均增加5.2分
C.该样本数据中,至少有一个点在回归直线上
D.若某学生每日阅读时间为2小时,则他的语文成绩一定为分
【答案】B
【详解】对于A,相关系数取值范围是,故错误;
对于B,回归系数的含义是:当自变量每增加1个单位时,因变量平均增加的量。
这里表示每日自主阅读时间(小时),表示语文成绩(分),所以当阅读时间每增加1小时,语文成绩平均增加5.2分,故正确;
对于C,回归直线是对样本的拟合直线,不一定经过样本点,故错误;
对于D,当时,,为预测值,不是确定值,故错误.
题型四 残差
1.(2026高三下·福建厦门·专题练习)已知线性相关的两个变量,的取值如下表所示,若其回归方程为,那么当时的残差为( )
7
9
11
13
30
45
50
A. B. C.8 D.9
【答案】A
【详解】由题意得:
因为回归直线过样本中心点,
代入得:,
又,
解得,
即时真实值,
当时,预测值,
因此当时的残差为.
2.(25-26高三上·江苏宿迁·月考)变量关于变量的经验回归方程为.若时,的实际观测值为8,则此时的残差为( )
A. B. C.1 D.2
【答案】C
【详解】当时,,
又时,的实际观测值为8,所以此时的残差为.
故选:C
3.(2025高二·全国·专题练习)某种高科技产品开发的支出成本(单位:万元)与市场销售额(单位:万元)之间有如下表所示的线性相关关系,与的经验回归方程为,当支出成本为8万元时,残差为( )
x
2
4
5
6
8
y
40
50
70
60
80
A. B.1.5 C. D.0.5
【答案】D
【详解】因为与的经验回归方程为,
所以当时,,
由表知当支出成本为8万元时,销售额为80万元,所以残差为.
故选:D
题型五 用样本中心求参数
1.(河北省张家口市2026届高三下学期一模数学试题)通过下表5组数据得到的经验回归方程为,则的值为( )
2
3
4
5
6
0.67
0.56
0.47
0.39
0.31
A. B.0.08 C. D.0.09
【答案】C
【详解】根据题意可得,,
由,可得,
解得:.
2.某公司为了解用电量(单位:)与气温(单位:)之间的关系,随机统计了天的用电量与当天气温,并制作了如下对照表:
气温
用电量
由表中数据可得回归方程中.试预测当气温为时,用电量约为 __.
【答案】
【详解】,,
样本点的中心为,
代入,
,
则线性回归方程为,
取,得,
故答案为:.
3.(24-25高二下·天津和平·期末)若关于某人工智能设备的使用年限和所支出的维修费用(万元)统计数据如下:
使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
若有数据知对呈线性相关关系.其线性回归方程为,请估计使用10年时的维修费用是__________万元.
【答案】11
【详解】由题知,
,即回归方程为,
所以估计使用10年时的维修费用是11万元.
故答案为:11.
4.(24-25高二下·天津西青·月考)手机支付的兴起使得现金支付越来越稀缺.某便利店统计了该店历年现金收入的数额如下表:
年份
2015
2016
2017
2018
2019
2020
序号
1
2
3
4
5
6
现金收入(万元)
40
36
29
23
14
8
若认为该便利店的历年现金收入与序号满足回归方程为,请你估计该店2021年的年现金收入为__________万元.
【答案】
【详解】由表可知,,,
代入公式中,得到,解得.
所以,当2021年即时代入可得:.
所以估计该店2021年的年现金收入为万元.
故答案为:1.8
5.王伯伯家的果园最近4年的支出(单位:万元)和收入(单位:万元)之间的数据如下:
2020年
2021年
2022年
2023年
1.8
2.1
2.3
3.0
2.0
2.8
3.2
4.0
若果园最近4年的收入与支出满足线性相关关系,则的值为_____________,若计划2024年该果园的收入达到6万元,预计2024年的支出为_____________万元.
【答案】 4.175
【详解】由图表可知,,,
则样本点的中心为,
代入,得.
收入与支出满足线性回归方程为.
取,可得,则.
预计2024年的支出为4.175万元.
故答案为:;4.175.
题型六 求非线性经验回归方程
1.(2025高三·全国·专题练习)近年来,我国云计算市场规模持续增长.某科技公司云计算市场规模与年份代码的关系可以用模型拟合,设,2018年至2022年的数据统计如表所示:
年份
2018年
2019年
2020年
2021年
2022年
年份代码
1
2
3
4
5
云计算市场规模
7
20
71
200
510
0.85
1.3
1.85
2.3
2.7
若根据上表得到经验回归方程,则该科技公司2025年云计算市场规模约为( )
A. B. C. D.
【答案】B
【难度】0.85
【知识点】根据样本中心点求参数、用回归直线方程对总体进行估计、对数的运算性质的应用
【分析】求出,后,根据线性回归方程的性质求得,即回归方程为,可求得2025年即时,,即可求解.
【详解】由题表知,,,
将,代入回归方程,可得,
即,所以z关于x的回归方程为,
2025年时即当时,,此时.
故选:B.
2.(25-26高二下·全国·单元测试)近期,某市公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次.
[参考数据:,,,,,其中,]
【详解】(1)由散点图,得适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型.
(2)由,两边同时取常用对数,得,
设,则,由,,
得,,
因此,即,则,
当时,得,
所以y关于x的回归方程为,活动推出第8天使用扫码支付的人次为347十人次.
3.(25-26高二下·辽宁·开学考试)已知与及与的成对数据如下表,且关于的回归直线方程为.
0.1
0.4
0.9
1.6
2.5
3.6
4.9
1
4
6
8
9
10
1
4
9
16
25
36
49
0
4
7
9
11
12
13
(1)求关于的回归直线方程;
(2)由散点图发现可以用函数模型拟合与的关系,请建立关于的回归方程(的值精确到0.01);
参考数据:.
参考公式:对于一组数据,其回归直线方程为,其中.
【详解】(1)由表中数据得,则,,
又关于的回归直线方程为,则,
即关于的回归直线方程为.
(2)若用函数模型拟合与的关系,则令,此时,
则,即,
又,所以关于的回归方程为.
题型七 回归方程的综合应用
1.(25-26高三上·天津滨海新·月考)下列说法正确的是( )
A.样本数据点的中心不一定在线性回归直线上
B.残差平方和越小的模型,拟合的效果越好
C.回归直线就是散点图中经过样本数据点最多的那条直线
D.如果两个变量的相关性越强,则相关系数就越接近于1
【答案】B
【详解】对于选项A:样本数据点的中心一定在线性回归直线上,故A错误;
对于选项B:残差平方和越小的模型,拟合的效果越好,故B正确;
对于选项C:线性回归直线在散点图中可能不经过任一样本数据点,故C错误;
对于选项D:如果两个变量的相关性越强,则相关系数的绝对值就越接近于1,故D错误;
故选:B.
2.(24-25高二下·天津·月考)在下表的统计量中,有一个数值不清晰,用表示.
1
2
3
4
5
6.3
7.4
8.1
8.7
已知表中数据的经验回归方程同时满足:①过点;②每增加一个单位,增加个单位,则___________;当时,___________.
【答案】
【详解】因为每增加一个单位,增加个单位,即,
因为经验回归方程过点,所以,
故,则;
又,,
代入,所以,解得,
当时,,
故答案为:,.
3.(24-25高二下·湖北恩施·期末)某田径协会组织开展竞走的步长和步频之间关系的课题研究,得到相应的试验数据:
步频x(单位:步/s)
0.28
0.29
0.30
0.31
0.32
步长y(单位:cm)
90
95
99
m
115
(1)若步频和步长近似为线性相关关系,当时,,,根据表中数据,求出y关于x的回归直线方程.
附:回归直线方程中,
(2)记,其中为观测值,为预测值,为对应的残差,根据表中数据,若得出y关于x的经验回归方程为,且计算出在样本点处的残差为,求实数m的值.
【详解】(1)解:根据统计表格中的数据,可得,,
又由,,可得,
则,所以回归直线方程为.
(2)解:由回归方程为,且计算出在样本点处的残差为,
可得,解得,
因为,,
可得,解得.
1.(25-26高二上·江西赣州·期末)已知变量x,y的数据如下若x与y的回归直线方程为,则( )
x
3
4
6
7
y
2.5
3
m
5.9
A.3.5 B.4 C.4.2 D.5
【答案】B
【详解】由题意可得,,,
将,代入,
可得,解得.
故选:B.
2.(25-26高二下·河南南阳·开学考试)某产品的广告费用与销售额的统计数据如下表:
广告费用x/万元
1.8
2.2
3
5
销售额y/万元
t
7
14
16
根据上表数据得到y与x的回归直线方程为,则t的值( )
A.3 B.5.5 C.4 D.6.5
【答案】A
【详解】依题意,得,,
所以,解得.
3.(2026·江苏·一模)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A.2 B.3 C.4 D.5
【答案】A
【详解】由题设可得,故,
故即,故残差为,
故选:A.
4.一组成对数据样本中心点为,由这组数据拟合的线性回归方程为,用最小二乘法求回归方程是为了使( )最小.
A.总偏差平方和 B.残差平方和
C.回归平方和 D.竖直距离和
【答案】B
【详解】最小二乘法求回归方程,是为了使残差平方和最小,B正确;其他选项错误.
故选:B
5.(2025高二·全国·专题练习)设一条经验回归直线的方程为,则当变量x增加一个单位时,( )
A.y平均增加1.2个单位 B.y平均增加3个单位
C.y平均减少1.2个单位 D.y平均减少3个单位
【答案】C
【详解】设一条经验回归直线的方程为,则当变量x增加一个单位时,y平均减少1.2个单位.
故选:C.
6.(25-26高二上·江西九江·期末)已知变量与的一组统计数据如下表:
2
4
5
6
8
27
42
62
72
87
若与线性相关,且关于的经验回归方程为.据此估计,当为9时,约为( )
A.95 B.100 C.105 D.110
【答案】B
【详解】由题意可得,,
由于回归直线过样本的中心点,
所以,解得,
故回归方程为,
当时,.
故选:B.
7.(25-26高二下·全国·课堂例题)若某地财政收入x与支出y满足经验回归方程(单位:亿元),其中,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元 B.9亿元 C.10.5亿元 D.9.5亿元
【答案】C
【详解】由题知,
令得,
又因为,所以.
所以年支出预计不会超过10.5亿元.
故选:C.
8.(2025·江西新余·模拟预测)某品牌啤酒厂,进行市场调研,发现该品牌啤酒在某地的月销量随着每瓶啤酒的定价不同而发生变化,连续调研5个月得到的数据如下表所示:
第1个月
第2个月
第3个月
第4个月
第5个月
单价/元
6
6.5
7
7.5
8
销量/万瓶
90
85
80
75
70
根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程,则( )
A.相关系数 B.点一定在经验回归直线上
C. D.当每瓶啤酒为9.5元时,月销量一定为50万瓶
【答案】B
【详解】由可得与具有负相关,故A错误;
由表中数据可得,
所以样本中心点为,将代入得,
解得,故C错误.
则回归方程为,当时,,故在回归直线上,故B正确:
当时,,这是一个估计值,不是精确值,故D错误.
故选:B.
9.(24-25高二下·四川绵阳·期末)已知在一定范围内,水稻对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽水稻实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度(单位:cm)与氮元素吸收量(单位:mg/天)的相关数据,如下表所示:
9.9
12.1
14.8
18.2
19.9
21.8
25.1
27.7
30.4
32.1
0.30
0.34
0.42
0.50
0.55
0.60
0.71
0.74
0.78
0.86
根据表中数据可得及经验回归方程为,则( )
A.
B.变量和变量的样本相关系数
C.当时,残差为0
D.水稻根长度每增加1cm,一天的氮元素吸收量一定增加mg
【答案】C
【详解】由题设,所以,可得,故A错误;
所以,又,即与正相关,则样本相关系数,故B错误;
由时,,残差为,故C正确;
由回归方程说明随变化值的变化趋势,不能说变量每增加一个单位,的值一定增加个单位,故D错误.
故选:C
10.(辽宁抚顺市2026届高三一模数学试题)若根据样本数据得到的回归直线方程为,且,,则______.
【答案】
【详解】由题意得,
则,
则样本中心点为,将其代入到,
即,解得.
11.(25-26高三上·上海·单元测试)某企业节能降耗技术改造后,在生产某产品过程中记录的产量(吨)与相应的生产能耗(吨)的几组对应数据如表,现发现表中有个数据看不清,已知回归直线方程为,下列说法中正确的是__________(填序号).
2
3
4
5
6
19
25
★
38
44
①看不清的数据★的值为34;
②回归直线必经过样本点;
③回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨;
④据此模型预测产量为7吨时,相应的生产能耗为50.9吨.
【答案】①④
【详解】回归直线方程为一定过,根据表格可得,
代入可得,又,所以①正确;②错误;
根据回归直线,可知回归系数6.3的含义是产量每增加1吨,相应的生产能耗大约增加6.3吨,③错误;
根据回归直线,当时,相应的生产能耗为吨.④正确;
故答案为:①④.
12.(2026·河南濮阳·一模)为了研究某班学生的听力成绩(单位:分)与笔试成绩(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现与之间有线性关系,设其回归直线为,已知,若该班某学生的听力成绩为28,据此估计其笔试成绩约为__________.
【答案】
【详解】,故;,故,
故点在回归直线上,即,得,
即,当时,代入计算得到.
故答案为:.
13.中国是茶的故乡,也是茶文化的发源地.为了弘扬中国茶文化,某酒店推出特色茶饮,按事先拟定的价格进行试销,得到销售数据,如下表所示:
试销单价(元)
20
25
30
35
40
45
销量(壶)
88
86
76
73
68
参考数据:.
(1)已知变量具有线性相关关系,求销量(壶)关于试销单价(元)的线性回归方程和的值;
(2)用表示根据线性回归方程得到的与对应的销量的估计值,当销售数据中与估计值满足时,则称该销售数据为一组“理想数据”.现从6组销售数据中任取2组,求抽取的2组销售数据中至少有1组是“理想数据”的概率.
附:回归直线方程的斜率,截距.
【详解】(1)解:由题意得,,
由,可求得,
所以,
,
故所求的线性回归方程为.
(2)解:当时,当时,
当时,当时,
当时,当时,.
与销售数据对比可知满足的共有4组:、、、.
从6组销售数据中任意抽取2组的所有可能结果有种,
其中2组数据中至少有一组是“理想数据”的结果有种,
所以抽取的2组销售数据中至少有1组是“理想数据”的概率为.
14.(25-26高二下·全国·课堂例题)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量.的数据作了初步处理,得到下面的散点图及一些统计量的值.
x
46.6
y
563
w
6.8
289.8
1.6
1469
108.8
表中.
(1)根据散点图判断:与哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x、y的关系为.根据(2)的结果回答下列问题;
①年宣传费时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.
【详解】(1)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型.
(2)令,先建立关于的线性经验回归方程.由于
,
所以关于的线性经验回归方程为,
因此关于的经验回归方程为.
(3)①由(2)知,当时,年销售量的预报值,
年利润的预报值.
②根据(2)的结果知,年利润的预报值.
所以当,即时,取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
1.(24-25高二下·山东青岛·期末)已知变量,线性相关,其一组样本数据满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到新的经验回归方程,则此时数据的残差为( )
A. B. C.1 D.2
【答案】D
【详解】由题意可知,旧数据,则,
增加数据后,,,
将点代入中得, ,即,则,
当时,,故残差为.
故选:D
2.农业强国是社会主义现代化强国的根基,推进农业现代化是实现高质量发展的必然要求.某农科所对冬季大棚内的昼夜温差与某反季节大豆新品种发芽率之间的关系进行分析研究,记录了2023年1月1日至1月12日大棚内的昼夜温差与每天每100颗种子的发芽数,得到如下资料:
日期
1日
2日
3日
4日
5日
6日
7日
8日
9日
10日
11日
12
日
温差
10
11
13
12
8
10
9
11
13
10
12
9
发芽数y/颗
21
24
28
28
15
22
17
22
30
18
27
18
已知发芽数与温差之间线性相关.该农科所确定的研究方案是:先从这12组数据中选取2组,用剩下的10组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)若选取的是1日与6日的两组数据,试根据除这两日之外的其他数据,求出关于的线性回归方程均精确到1)
(2)若由线性回归方程得到的估计数据与所选取的检验数据的误差均不超过2颗,则认为求得的线性回归方程是可靠的,试问:(1)中所得的线性回归方程是否可靠?
参考公式:线性回归方程中的斜率参数和截距参数的最小二乘估计公式分别为:
【详解】(1)设剩下的10组数据分别为.
,
,.
. .
. .
.
所以所求回归方程为.
(2)当时,.因为,,
所以(2)中所得的线性回归方程可靠.
1 / 11
学科网(北京)股份有限公司
$
8.2 一元线性回归模型及其应用
题型一 对最小二乘估计的理解
1.对成对数据、、…、用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
2.回归直线方程的系数a,b的最小二乘法估计使函数最小,Q函数指( )
A. B.
C. D.
3.在最小二乘法中,用来刻画各样本点到直线“距离”的量是( )
A. B. C. D.
4.如果有个点,可以用表达式( )来刻画这些点与直线的接近程度,当该式达到最小值时,直线就是我们所要求的直线,这种方法称为最小二乘法.
A.
B.
C.
D.
题型二 求线性经验回归方程
1.(25-26高二下·全国·单元测试)已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
2.(25-26高二上·全国·单元测试)某校对学生记忆力和判断力进行统计分析,所得数据如表:
记忆力
2
5
6
8
9
判断力
7
8
10
12
18
则关于的线性回归方程为( )
A. B.
C. D.
3.(24-25高二下·辽宁·期末)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李某月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( )(参考公式:)
A.0.04 B.0.03 C.0.02 D.0.01
4.(25-26高二上·全国·单元测试)已知变量和变量的一组成对样本数据为,其中,其线性回归方程为,当增加两个样本数据和后,重新得到的回归直线的斜率为3,则在新的线性回归方程下,时,的估计值为( )
A.13 B.12 C.11 D.8
5.(24-25高二下·全国·课后作业)某品牌的宣传支出与收入的数据如下表所示.
万元
200
400
500
600
800
万元
3000
4000
5000
6000
7000
则线性回归模型为______.
6.(24-25高二下·辽宁·月考)一组互不相等的样本数据,其中,若在样本中加入数据后,新样本数据的回归直线方程与原样本数据的相同,则这组样本数据的回归直线方程为_______.
题型三 用线性经验回归方程求参数
1.(2026·山东青岛·一模)已知变量,的统计数据如下,若与的回归直线方程为,则( )
2.8
3.3
5.0
6.7
7.2
2.6
4.0
5.1
5.4
A.2.5 B.2.7 C.2.9 D.3.1
2.(25-26高三上·河北承德·期中)已知两个线性相关变量x与y的统计数据如下表:
x
3
4
5
6
7
y
2.4
m
4
4.6
5.2
其经验回归方程为 则m=( )
A.2.8 B.3 C.3.2 D.3.4
3.(24-25高二下·广东深圳·期末)某智能机器人公司从某年起7年的利润情况如下表所示,y关于x的回归直线方程是,则该智能机器人公司第4年利润的残差是( )
第x年
1
2
3
4
5
6
7
利润y/亿元
m
A.亿元 B.亿元 C.亿元 D.亿元
4.(24-25高二下·江苏泰州·期末)已知的取值如下表所示,若与有线性相关关系且与之对应的线性回归方程为,则的值为( )
1
3
5
7
5.8
6.2
6.6
A.5 B.6 C.7 D.8
5.(2026·陕西咸阳·一模)某单位为了解日用电量(单位:千瓦时)与当天平均温度(单位:摄氏度)之间的关系,随机统计了4天的日用电量与当天的平均温度,绘制了如下表格,由表中数据可得线性回归方程,则实数________.
5
15
24
60
40
20
题型四 解释回归方程的意义
1.(24-25高二下·黑龙江·期中)研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
2.(24-25高二下·贵州遵义·月考)相关变量的样本数据如下表:
x
1
2
3
4
y
2
3
a
5
经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为,下列说法正确的是( )
A.当每增加1时,一定增加1.5 B.当每增加13时,一定增加8
C. 与呈负相关 D.
3.(2026·福建莆田·二模)为了探究六年级学生每日自主阅读时间与语文成绩的关系,某研究小组随机调查了50名学生,得到成对样本数据,其中表示每日自主阅读时间(单位:小时),表示语文成绩(单位:分).经计算得回归直线方程为.下列说法正确的是( )
A.该样本数据的相关系数为5.2
B.当阅读时间每增加1小时,语文成绩平均增加5.2分
C.该样本数据中,至少有一个点在回归直线上
D.若某学生每日阅读时间为2小时,则他的语文成绩一定为分
题型五 计算残差
1.(2026高三下·福建厦门·专题练习)已知线性相关的两个变量,的取值如下表所示,若其回归方程为,那么当时的残差为( )
7
9
11
13
30
45
50
A. B. C.8 D.9
2.(25-26高三上·江苏宿迁·月考)变量关于变量的经验回归方程为.若时,的实际观测值为8,则此时的残差为( )
A. B. C.1 D.2
3.(2025高二·全国·专题练习)某种高科技产品开发的支出成本(单位:万元)与市场销售额(单位:万元)之间有如下表所示的线性相关关系,与的经验回归方程为,当支出成本为8万元时,残差为( )
x
2
4
5
6
8
y
40
50
70
60
80
A. B.1.5 C. D.0.5
题型六 用样本中心求参数
1.(河北省张家口市2026届高三下学期一模数学试题)通过下表5组数据得到的经验回归方程为,则的值为( )
2
3
4
5
6
0.67
0.56
0.47
0.39
0.31
A. B.0.08 C. D.0.09
2.某公司为了解用电量(单位:)与气温(单位:)之间的关系,随机统计了天的用电量与当天气温,并制作了如下对照表:
气温
用电量
由表中数据可得回归方程中.试预测当气温为时,用电量约为 __.
3.(24-25高二下·天津和平·期末)若关于某人工智能设备的使用年限和所支出的维修费用(万元)统计数据如下:
使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
若有数据知对呈线性相关关系.其线性回归方程为,请估计使用10年时的维修费用是__________万元.
4.(24-25高二下·天津西青·月考)手机支付的兴起使得现金支付越来越稀缺.某便利店统计了该店历年现金收入的数额如下表:
年份
2015
2016
2017
2018
2019
2020
序号
1
2
3
4
5
6
现金收入(万元)
40
36
29
23
14
8
若认为该便利店的历年现金收入与序号满足回归方程为,请你估计该店2021年的年现金收入为__________万元.
5.王伯伯家的果园最近4年的支出(单位:万元)和收入(单位:万元)之间的数据如下:
2020年
2021年
2022年
2023年
1.8
2.1
2.3
3.0
2.0
2.8
3.2
4.0
若果园最近4年的收入与支出满足线性相关关系,则的值为_____________,若计划2024年该果园的收入达到6万元,预计2024年的支出为_____________万元.
题型七 求非线性经验回归方程
1.(2025高三·全国·专题练习)近年来,我国云计算市场规模持续增长.某科技公司云计算市场规模与年份代码的关系可以用模型拟合,设,2018年至2022年的数据统计如表所示:
年份
2018年
2019年
2020年
2021年
2022年
年份代码
1
2
3
4
5
云计算市场规模
7
20
71
200
510
0.85
1.3
1.85
2.3
2.7
若根据上表得到经验回归方程,则该科技公司2025年云计算市场规模约为( )
A. B. C. D.
2.(25-26高二下·全国·单元测试)近期,某市公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次.
[参考数据:,,,,,其中,]
3.(25-26高二下·辽宁·开学考试)已知与及与的成对数据如下表,且关于的回归直线方程为.
0.1
0.4
0.9
1.6
2.5
3.6
4.9
1
4
6
8
9
10
1
4
9
16
25
36
49
0
4
7
9
11
12
13
(1)求关于的回归直线方程;
(2)由散点图发现可以用函数模型拟合与的关系,请建立关于的回归方程(的值精确到0.01);
参考数据:.
参考公式:对于一组数据,其回归直线方程为,其中.
题型八 回归方程的综合应用
1.(25-26高三上·天津滨海新·月考)下列说法正确的是( )
A.样本数据点的中心不一定在线性回归直线上
B.残差平方和越小的模型,拟合的效果越好
C.回归直线就是散点图中经过样本数据点最多的那条直线
D.如果两个变量的相关性越强,则相关系数就越接近于1
2.(24-25高二下·天津·月考)在下表的统计量中,有一个数值不清晰,用表示.
1
2
3
4
5
6.3
7.4
8.1
8.7
已知表中数据的经验回归方程同时满足:①过点;②每增加一个单位,增加个单位,则___________;当时,___________.
3.(24-25高二下·湖北恩施·期末)某田径协会组织开展竞走的步长和步频之间关系的课题研究,得到相应的试验数据:
步频x(单位:步/s)
0.28
0.29
0.30
0.31
0.32
步长y(单位:cm)
90
95
99
m
115
(1)若步频和步长近似为线性相关关系,当时,,,根据表中数据,求出y关于x的回归直线方程.
附:回归直线方程中,
(2)记,其中为观测值,为预测值,为对应的残差,根据表中数据,若得出y关于x的经验回归方程为,且计算出在样本点处的残差为,求实数m的值.
1.(25-26高二上·江西赣州·期末)已知变量x,y的数据如下若x与y的回归直线方程为,则( )
x
3
4
6
7
y
2.5
3
m
5.9
A.3.5 B.4 C.4.2 D.5
2.(25-26高二下·河南南阳·开学考试)某产品的广告费用与销售额的统计数据如下表:
广告费用x/万元
1.8
2.2
3
5
销售额y/万元
t
7
14
16
根据上表数据得到y与x的回归直线方程为,则t的值( )
A.3 B.5.5 C.4 D.6.5
3.(2026·江苏·一模)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A.2 B.3 C.4 D.5
4.一组成对数据样本中心点为,由这组数据拟合的线性回归方程为,用最小二乘法求回归方程是为了使( )最小.
A.总偏差平方和 B.残差平方和
C.回归平方和 D.竖直距离和
5.(2025高二·全国·专题练习)设一条经验回归直线的方程为,则当变量x增加一个单位时,( )
A.y平均增加1.2个单位 B.y平均增加3个单位
C.y平均减少1.2个单位 D.y平均减少3个单位
6.(25-26高二上·江西九江·期末)已知变量与的一组统计数据如下表:
2
4
5
6
8
27
42
62
72
87
若与线性相关,且关于的经验回归方程为.据此估计,当为9时,约为( )
A.95 B.100 C.105 D.110
7.(25-26高二下·全国·课堂例题)若某地财政收入x与支出y满足经验回归方程(单位:亿元),其中,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元 B.9亿元 C.10.5亿元 D.9.5亿元
8.(2025·江西新余·模拟预测)某品牌啤酒厂,进行市场调研,发现该品牌啤酒在某地的月销量随着每瓶啤酒的定价不同而发生变化,连续调研5个月得到的数据如下表所示:
第1个月
第2个月
第3个月
第4个月
第5个月
单价/元
6
6.5
7
7.5
8
销量/万瓶
90
85
80
75
70
根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程,则( )
A.相关系数 B.点一定在经验回归直线上
C. D.当每瓶啤酒为9.5元时,月销量一定为50万瓶
9.(24-25高二下·四川绵阳·期末)已知在一定范围内,水稻对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽水稻实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度(单位:cm)与氮元素吸收量(单位:mg/天)的相关数据,如下表所示:
9.9
12.1
14.8
18.2
19.9
21.8
25.1
27.7
30.4
32.1
0.30
0.34
0.42
0.50
0.55
0.60
0.71
0.74
0.78
0.86
根据表中数据可得及经验回归方程为,则( )
A.
B.变量和变量的样本相关系数
C.当时,残差为0
D.水稻根长度每增加1cm,一天的氮元素吸收量一定增加mg
10.(辽宁抚顺市2026届高三一模数学试题)若根据样本数据得到的回归直线方程为,且,,则______.
11.(25-26高三上·上海·单元测试)某企业节能降耗技术改造后,在生产某产品过程中记录的产量(吨)与相应的生产能耗(吨)的几组对应数据如表,现发现表中有个数据看不清,已知回归直线方程为,下列说法中正确的是__________(填序号).
2
3
4
5
6
19
25
★
38
44
①看不清的数据★的值为34;
②回归直线必经过样本点;
③回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨;
④据此模型预测产量为7吨时,相应的生产能耗为50.9吨.
12.(2026·河南濮阳·一模)为了研究某班学生的听力成绩(单位:分)与笔试成绩(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现与之间有线性关系,设其回归直线为,已知,若该班某学生的听力成绩为28,据此估计其笔试成绩约为__________.
13.中国是茶的故乡,也是茶文化的发源地.为了弘扬中国茶文化,某酒店推出特色茶饮,按事先拟定的价格进行试销,得到销售数据,如下表所示:
试销单价(元)
20
25
30
35
40
45
销量(壶)
88
86
76
73
68
参考数据:.
(1)已知变量具有线性相关关系,求销量(壶)关于试销单价(元)的线性回归方程和的值;
(2)用表示根据线性回归方程得到的与对应的销量的估计值,当销售数据中与估计值满足时,则称该销售数据为一组“理想数据”.现从6组销售数据中任取2组,求抽取的2组销售数据中至少有1组是“理想数据”的概率.
附:回归直线方程的斜率,截距.
14.(25-26高二下·全国·课堂例题)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量.的数据作了初步处理,得到下面的散点图及一些统计量的值.
x
46.6
y
563
w
6.8
289.8
1.6
1469
108.8
表中.
(1)根据散点图判断:与哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x、y的关系为.根据(2)的结果回答下列问题;
①年宣传费时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.
1.(24-25高二下·山东青岛·期末)已知变量,线性相关,其一组样本数据满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到新的经验回归方程,则此时数据的残差为( )
A. B. C.1 D.2
2.农业强国是社会主义现代化强国的根基,推进农业现代化是实现高质量发展的必然要求.某农科所对冬季大棚内的昼夜温差与某反季节大豆新品种发芽率之间的关系进行分析研究,记录了2023年1月1日至1月12日大棚内的昼夜温差与每天每100颗种子的发芽数,得到如下资料:
日期
1日
2日
3日
4日
5日
6日
7日
8日
9日
10日
11日
12
日
温差
10
11
13
12
8
10
9
11
13
10
12
9
发芽数y/颗
21
24
28
28
15
22
17
22
30
18
27
18
已知发芽数与温差之间线性相关.该农科所确定的研究方案是:先从这12组数据中选取2组,用剩下的10组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)若选取的是1日与6日的两组数据,试根据除这两日之外的其他数据,求出关于的线性回归方程均精确到1)
(2)若由线性回归方程得到的估计数据与所选取的检验数据的误差均不超过2颗,则认为求得的线性回归方程是可靠的,试问:(1)中所得的线性回归方程是否可靠?
参考公式:线性回归方程中的斜率参数和截距参数的最小二乘估计公式分别为:
1 / 11
学科网(北京)股份有限公司
$