内容正文:
专题4.2 一元线性回归模型
教学目标
1.结合实例,了解一元线性回归模型的含义与参数的统计意义,掌握其表达式。
2.理解最小二乘原理,会用最小二乘法估计回归系数与截距,能求回归直线方程。
3.会用一元线性回归模型进行预测,能借助统计软件处理数据。
教学重难点
1.重点:
(1)一元线性回归模型的概念与表达式。
(2)最小二乘法求回归直线方程(与的计算)。
(3)回归模型的实际应用与预测。
2.难点:
(1) 最小二乘法原理的理解(为何用误差平方和最小)。
(2)回归系数的统计意义解释。
(3)非线性关系转化为线性回归模型的方法(拓展)。
知识点01 回归直线方程
1.回归直线与回归直线方程:找出与散点图中各点散布趋势相似的直线,使各点经过或充分靠近该直线,这样所得到的直线就可以比较科学地反映实际问题中两个变量之间的相关关系。这条直线叫作回归直线,这条直线的方程叫作回归直线方程。
2.回归分析:由散点图求出回归直线并进行统计推断的过程叫作回归分析。
【即学即练】(24-25高二下·全国·课后作业)有人收集了10年中某城市居民年收入(即此城市所有居民在一年内的收入的总和)与某种商品的销售额的有关数据:(单位:亿元)
第年
1
2
3
4
5
6
7
8
9
10
年收入
32.2
31.1
32.9
35.8
37.1
38.0
39.0
43.0
44.6
46.0
销售额
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
(1)画出散点图,你能从散点图中发现居民年收入与该种商品销售额之间的近似关系吗?
(2)如果它们之间近似呈线性关系,请画出一条直线来近似表示这种关系.
知识点02 一元线性回归模型
1.一元线性回归方程:(1)一元线性回归方程:如果具有相关关系的两个变量 x,y 可用方程y=a+bx (1)来近似刻画,则称 (1) 式为 y 关于 x 的一元线性回归方程,其中 a,b 称为回归系数。
(2)方程,(2)是根据样本数据求出的回归方程的估计。
2.一元线性回归模型:我们把 yi=a+bxi+ei(i=1,2,…,n) 这一描述因变量 y 如何依赖于自变量 x 和随机误差 ei的方程称为一元线性回归模型。
3.最小二乘法:用随机误差的平方和即作为总随机误差来刻画各估计值与实际值之间的误差。若总随机误差最小,则这条直线就是所要求的回归直线。由于平方又叫二乘方,所以这种使 “随机误差平方和最小” 的方法叫作最小二乘法。
4的计算公式:令,则Q取最小值时,、的计算公式为
其中是回归直线在y轴的截距,是回归直线 的斜率.
【即学即练】(25-26高二下·河南周口·月考)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价x(元)与网上月销量y(万件)的数据如下:
x
10
12
14
16
18
y
8
7
6
5
4
(1)求相关系数r,并说明其意义;
(2)建立y关于x的线性回归方程;
(3)若月销量不低于5万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
知识点03 一元线性回归模型的应用
1.回归分析的主要目的:一元线性回归方程在一定程度上描述了变量x与y之间的数量关系,根据这一方程,可依据自变量x来估计或预测因变量y的取值,这就是回归分析的主要目的。
2.运用一元线性回归模型思想解题的步骤:
一般地,运用一元线性回归模型思想解决实际问题的基本步骤为:
(1) 确定研究对象,明确哪个变量是因变量,哪个变量是自变量;
(2) 运用相关系数的计算公式,分析自变量与因变量之间的关系;
(3) 运用最小二乘原理估计一元线性回归方程的系数,建立一元线性回归方程;
(4) 根据一元线性回归方程进行预测。
3.非线性回归问题:在实际问题中,如果从数据的散点图可以看出两个变量之间有明显的非线性关系,就需要选择一个合适的曲线方程,按照这个曲线方程对原始数据进行代换,目的是把变量间的非线性关系转化为近似的线性关系,然后用建立线性回归方程的方法确定未知参数。
【即学即练】(25-26高二下·江西萍乡·期中)2026年国务院政府工作报告明确指出:支持有条件的地方推广中小学春秋假,落实职工带薪错峰休假制度,这一政策直接带动旅游市场热度.某景点为科学定价、吸引更多游客,根据往年数据拟定价格,有关门票价格和日游客人数的数据如下表所示:
门票价格(元/人)
30
40
50
60
70
日游客人数(千人)
21
20
14
8
7
(1)已知与具有线性相关关系,求出关于的线性回归方程;
(2)为了扩大景区知名度与客流吸引力,景区将门票定价为10(元/人),并计划做广告宣传.由前期调查可知,当日均广告费为千元时的日游客人数为千人,其中是当门票为10(元/人)时,根据(1)的回归方程所预测的日游客人数.求景区的日均广告费用为多少千元时,日门票净收入最大.(日门票净收入=票价×日游客人数-广告费)
参考数据:.参考公式:线性回归方程.
题型01 求回归直线方程
【典例1】(25-26高三·全国·一轮复习)我国某农业大学植物研究所相关人员为了解仙人掌的植株高度(单位:),与其根茎长度(单位:)之间是否存在线性相关的关系,通过采样和数据记录得到如下数据:
样本编号
1
2
3
4
根茎长度
10
12
14
16
植株高度
62
86
112
132
参考数据:,,.
(1)由上表数据计算相关系数,并说明是否可用线性回归模型拟合与的关系(若,则可用线性回归模型拟合,计算结果精确到0.001);
(2)求y关于x的经验回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式,相关系数r的公式分别为,
【变式1-1】(25-26高二下·全国·单元测试)已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
【变式1-2】(25-26高二下·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
【变式1-3】(25-26高二下·全国·课堂例题)下表是某种产品销售收入与销售量之间的一组数据:
销售量x(吨)
2
3
5
6
销售收入y(万元)
7
8
9
12
(1)画出散点图;
(2)求出经验回归方程;
(3)根据经验回归方程估计销售量为9吨时的销售收入.
题型02 最小二乘法的概念及辨析
【典例2】(2023·山东·模拟预测)某公司在2016-2021年的销售额(万元)如下表,根据表中数据用最小二乘法得到的回归方程为.
2016
2017
2018
2019
2020
2021
则当关于的表达式取最小值时,__________.
【变式2-1】(22-23高二下·上海奉贤·期中)用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【变式2-2】(2023·陕西宝鸡·模拟预测)回归直线方程的系数a,b的最小二乘法估计使函数最小,Q函数指( )
A. B.
C. D.
【变式2-3】(2023·上海杨浦·二模)对成对数据、、…、用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
题型03 解释回归直线方程的意义
【典例3】(25-26高二上·江苏常州·期末)(多选)某单位通过对数据的统计与分析得知,日用电量(单位:)与当天平均气温(单位:)之间线性相关,且线性回归方程为.已知数据样本的相关系数为,则下列说法正确的有( )
A.日用电量与平均气温成负相关,气温每升高,日用电量平均减少
B.可以预测到当平均气温为时,日用电量约为
C.如果样本的相关系数,则说明用电量与平均气温的线性相关性很弱
D.该回归直线必经过样本点的平均值点
【变式3-1】(25-26高三上·河南·月考)(多选)某同学在一次试验中,得到两个变量,的成对样本数据:,,⋯,,经对该组数据研究发现,变量,间具有线性相关关系,用最小二乘法求得的经验回归方程为.该同学给出如下结论,其中正确的结论有()
A.变量与具有正线性相关关系
B.在实际问题中,解释变量每增加1个单位,响应变量一定相应增加个单位
C.经验回归直线过样本点的中心
D.散点图中的点中至少有一个点在经验回归直线上
【变式3-2】(25-26高二下·江西萍乡·期中)(多选)在一项关于学生体能测试的研究中,某研究小组随机选取了100名学生作为研究对象.他们记录了每位学生的日常锻炼时间(记为变量,单位:小时)与体能测试得分(记为变量,单位:分)的数据.通过对这100组成对数据进行统计分析,某学生计算出回归直线方程为,则下列说法正确的是( )
A.体能测试得分与日常锻炼时间正相关
B.该样本数据的相关系数为4.8
C.该样本数据中的所有点都可以不在该回归直线方程上
D.某学生的日常锻炼时间为2小时,则他的体能测试得分一定为82分
【变式3-3】(2026·广东深圳·二模)(多选)某公司统计了去年1月份到5月份某种产品的销售额如下表:
月份
1
2
3
4
5
销售额万元
1.8
2.2
2.8
3.1
根据表中数据,通过最小二乘法求得的经验回归方程为,则( )
A.变量与正相关
B.
C.样本数据的下四分位数为1.8
D.当时,的预测值为4.1万元
题型04 已知回归方程求原数据中的值
【典例4】(24-25高二下·上海·期末)一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为__________.
零件数x(个)
2
3
4
5
加工时间y(分钟)
30
a
40
50
【变式4-1】(2025·云南昆明·模拟预测)下表为2018至2024年某手机品牌的年产量y(单位:万台),其中2018至2024年的年份代码x分别为1至7.
年份代码x
1
2
3
4
5
6
7
年产量y/万台
28
32
36
40
a
b
c
已知y与x具有线性相关关系,由上述7组数据得到经验回归方程,则的值为( ).
A.165.4 B.173.4 C.182.5 D.191.8
【变式4-2】(2026·山东德州·一模)为研究某池塘中水生植物覆盖池塘的面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,如表格所示,得到与的线性回归方程,则( )
3
4
6
7
2
2.5
4.5
A.5 B.6 C.7 D.8
【变式4-3】(25-26高二下·河南南阳·月考)已知具有相关关系的变量,它们之间的一组数据如表所示,若关于的回归方程为,则( )
A. B. C. D.
题型05 计算样本的中心点求参数
【典例5】(25-26高三上·广东·月考)一组数据的线性回归方程为,若,则_____.
【变式5-1】(25-26高二下·河南南阳·开学考试)某产品的广告费用与销售额的统计数据如下表:
广告费用x/万元
1.8
2.2
3
5
销售额y/万元
t
7
14
16
根据上表数据得到y与x的回归直线方程为,则t的值( )
A.3 B.5.5 C.4 D.6.5
【变式5-2】(2025高二·全国·专题练习)在抗击新型冠状病毒肺炎(COVID-19)期间,有研究团队得到了一项研究成果,首次揭示了COVID-19患者发生急性呼吸窘迫综合征(ARDS)和从ARDS进展至死亡的危险因素,并首次提出发生ARDS的COVID-19患者使用甲强龙可能获益的观点.为了了解甲强龙的指标数据y与质量分数p(单位:%)之间的关系,随机统计了相关数据,如下表,由最小二乘法求得经验回归方程为.
p
6
10
14
18
22
y
62
x
44
28
14
现发现表中有一个数据x模糊不清,请你推断,该数据的值为( )
A.53 B.56 C.59 D.62
【变式5-3】(24-25高二下·山西·期末)某校当天的新增感冒人数与温差(单位:)的5组数据如下表:
5
7
8
9
11
9
17
20
由于保存不善,有两个数据模糊不清,用,代替,已知关于的经验回归方程为,则( )
A. B. C. D.
题型06 根据样本中心点求斜率、截距
【典例6】(25-26高二上·江西宜春·期末)根据下表数据得到y关于x的线性回归方程,则=______.
x
4
6
7
8
10
y
2
3
4
5
6
【变式6-1】(25-26高二下·全国·单元测试)某饮料店某5天的日销售收入(单位:百元)与当天平均气温(单位:℃)之间的数据如下表:
0
1
2
5
4
2
2
1
若与之间是线性相关关系,且关于的经验回归方程是,则实数的值是( )
A.3 B.2.8 C.2.6 D.2.4
【变式6-2】(25-26高二下·上海松江·期中)某产品的研发投入费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:
/万元
2.2
2.6
4.3
5.0
5.9
/万件
3.8
5.4
7.0
10.35
12.2
根据表中的数据,可得回归直线方程,则______.
【变式6-3】(2026·辽宁抚顺·一模)若根据样本数据得到的回归直线方程为,且,,则______.
题型07 根据回归方程进行数据估计
【典例7】(2026·江苏·一模)某兴趣小组研究昼夜温差大小与患感冒人数多少之间的关系,他们到气象局和医院抄录了1~7月份每月5日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月5日
2月5日
3月5日
4月5日
5月5日
6月5日
7月5日
昼夜温差
10
11
13
12
8
7
6
感冒人数
23
25
29
26
16
13
9
该兴趣小组确定的研究方案是:先从这7组数据中选取2组,用剩下的5组数据求经验回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据是不相邻的两个月的概率;
(2)若该小组选取的是1月与6月的两组数据,请根据剩下5个月份的数据:
①求出关于的经验回归方程;
②若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的经验回归方程是理想的,问:该小组所得经验回归方程是否理想?说明理由.
附:
【变式7-1】(25-26高二下·全国·单元测试)某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
【变式7-2】(25-26高二下·河南南阳·月考)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价(元)与网上月销量(万件)的数据如下:
(1)求相关系数(保留3位小数),并说明与的线性相关程度;
(2)建立关于的线性回归方程;
(3)若月销量不低于万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
【变式7-3】(25-26高二下·上海·期中)绝对零度()是一个只能逼近而不能达到的最低温度,那么这个数据是如何得到的?小张同学通过查询资料了解到:①气体温度和气体压强存在线性关系;②当气体压强为时,气体温度达到绝对零度.小张同学在实验时,记录了某种气体温度和气体压强一组相关数据:
数据
1
2
3
4
5
6
温度
4.07
16.69
29.42
45.67
57.06
73.05
压强
103.095
107.734
112.461
118.469
122.706
128.758
(1)用上表数据建立气体压强与气体温度的线性回归方程,若这组实验数据的拟合误差小于0.05,则认为得到的线性回归是理想的.求出回归方程(精确到0.001),并判断所得回归方程是否理想?附:拟合误差
(2)估计该次实验下绝对零度的数值.(精确到)
题型08 非线性回归问题
【典例8】(25-26高二下·湖南长沙·月考)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出关于的回归方程.
(计算结果精确到0.1)
附:回归方程中
参考数据
5215
17713
714
27
81.3
3.6
【变式8-1】(18-19高二下·内蒙古巴彦淖尔·月考)在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得经验回归方程为,则该模型的回归方程为________.
【变式8-2】(25-26高二下·全国·单元测试)近期,某市公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次.
[参考数据:,,,,,其中,]
【变式8-3】(25-26高二下·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
一、单选题
1.(25-26高二下·黑龙江大庆·期中)某商店记录2026年4月(16日至20日)每天的平均气温(单位:℃)与矿泉水日销量(单位:瓶),得到数据如下表:
气温
10
11
12
13
14
销量
65
70
75
80
85
经计算,气温与销量的样本相关系数接近1,经验回归直线方程为,其中斜率,则截距的值为( )
A.20 B.15 C.10 D.5
2.(25-26高二上·江西九江·期末)已知变量与的一组统计数据如下表:
2
4
5
6
8
27
42
62
72
87
若与线性相关,且关于的经验回归方程为.据此估计,当为9时,约为( )
A.95 B.100 C.105 D.110
3.(25-26高三下·上海·月考)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用:(单位:万元)与销售利润(单位:万元)的相关数据,根据下表中数据,得到经验回归方程,则下列结论中错误的是( ).
广告费用
3
4
5
8
销售利润
4
5
7
8
A. B.
C.直线必过点 D.直线必过点
4.(25-26高二上·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
5.(2026·福建莆田·二模)为了探究六年级学生每日自主阅读时间与语文成绩的关系,某研究小组随机调查了50名学生,得到成对样本数据,其中表示每日自主阅读时间(单位:小时),表示语文成绩(单位:分).经计算得回归直线方程为.下列说法正确的是( )
A.该样本数据的相关系数为5.2
B.当阅读时间每增加1小时,语文成绩平均增加5.2分
C.该样本数据中,至少有一个点在回归直线上
D.若某学生每日阅读时间为2小时,则他的语文成绩一定为分
6.(2026·安徽六安·模拟预测)已知具有线性相关的两个变量之间的一组数据如表:
0
1
2
3
4
2.5
4.0
4.3
4.2
且回归直线方程是,则( )
A.6.2 B.6.3 C.6.4 D.6.5
7.(25-26高二下·全国·课堂例题)若某地财政收入x与支出y满足经验回归方程(单位:亿元),其中,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元 B.9亿元 C.10.5亿元 D.9.5亿元
8.(25-26高二上·陕西汉中·期末)茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
二、多选题
9.(25-26高二下·河南南阳·开学考试)2024年全民健身运动的主题“全民健身与奥运同行”,为了满足群众健身需求,某健身房近几年陆续购买了几台型跑步机,该型号跑步机已投入使用的时间(单位:年)与当年所需要支出的维修费用(单位:千元)有如下统计资料:
2
3
4
5
6
2.2
3.8
5.5
6.5
7
根据表中的数据可得到线性回归方程为:,则( )
A.与的样本相关系数
B.
C.当每增加一个单位时,平均增加1.23个单位
D.该型跑步机已投入使用的时间为10年时,当年所需要支出的维修费用一定是12.38万元
10.(24-25高二下·广东广州·期末)用模型去拟合一组数据,设,将其变换后得到线性回归方程,则( )
A. B. C. D.
11.(25-26高二下·河南南阳·月考)对于变量X,Y,经过随机抽样获得成对数据(,2,3,…,10),且,利用最小二乘法得到Y关于X的线性回归方程为,且X与Y的相关系数,则下列结论正确的是( )
A.r越大,X与Y的线性相关性越强
B.若,则
C.若,则
D.若样本点(,2,3,…,10)都在回归直线上,则
三、填空题
12.(25-26高二下·上海·期中)已知、取值如表所示,从散点图分析,与线性相关,且,则__________.
0
1
3
4
0.9
1.9
3.2
4.4
13.(25-26高二上·全国·随堂练习)某学校开展研究性学习活动,一组同学获得了下面的一组试验数据:
x
1.99
3
4
5.1
8
y
0.99
1.58
2.01
2.35
3.00
现有如下5个模拟函数:①;②;③;④;⑤,请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号).
14.(25-26高二上·全国·单元测试)某学习小组用计算机软件对一组数据,进行回归分析,甲同学首先求出线性回归方程为,样本点的中心为.乙同学对甲的计算过程进行检查,发现甲将数据误输成,数据误输成,将这两个数据修正后得到线性回归方程为,则实数______.
四、解答题
15.(2026·江苏南京·一模)为研究昼夜温差(单位:)与某植物种子当日的百粒发芽数(单位:粒)之间的关系,实验室记录了6天的每日昼夜温差与种子当日的百粒发芽数,如下表所示:
日期编号
1
2
3
4
5
6
温差
9
13
11
15
10
14
百粒发芽数
23
28
26
31
25
29
(1)根据表中的数据,计算样本相关系数(精确到0.01);
(2)求百粒发芽数关于温差的经验回归方程,并估计昼夜温差为时,这种植物种子当日的百粒发芽数.
参考公式:相关系数,
,,
参考数据:,,,.
16.(25-26高二下·江西·月考)为促进消费,助力经济发展,某市持续开展了共8期政府消费券发放活动,记第期活动发放的消费券总额为百万元,带动的消费为百万元,根据这8期活动的数据,可得,,且和的样本方差分别为,,用最小二乘法得到关于的线性回归方程为.
(1)若下一期活动政府计划发放10.8百万元的消费券,预计可以带动多少消费;
(2)求相关系数.(结果保留2位小数)
(附参考数据及公式:.相关系数,线性回归方程中,,.)
17.(24-25高二下·山东·月考)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
1 / 17
学科网(北京)股份有限公司
$
专题4.2 一元线性回归模型
教学目标
1.结合实例,了解一元线性回归模型的含义与参数的统计意义,掌握其表达式。
2.理解最小二乘原理,会用最小二乘法估计回归系数与截距,能求回归直线方程。
3.会用一元线性回归模型进行预测,能借助统计软件处理数据。
教学重难点
1.重点:
(1)一元线性回归模型的概念与表达式。
(2)最小二乘法求回归直线方程(与的计算)。
(3)回归模型的实际应用与预测。
2.难点:
(1) 最小二乘法原理的理解(为何用误差平方和最小)。
(2)回归系数的统计意义解释。
(3)非线性关系转化为线性回归模型的方法(拓展)。
知识点01 回归直线方程
1.回归直线与回归直线方程:找出与散点图中各点散布趋势相似的直线,使各点经过或充分靠近该直线,这样所得到的直线就可以比较科学地反映实际问题中两个变量之间的相关关系。这条直线叫作回归直线,这条直线的方程叫作回归直线方程。
2.回归分析:由散点图求出回归直线并进行统计推断的过程叫作回归分析。
【即学即练】(24-25高二下·全国·课后作业)有人收集了10年中某城市居民年收入(即此城市所有居民在一年内的收入的总和)与某种商品的销售额的有关数据:(单位:亿元)
第年
1
2
3
4
5
6
7
8
9
10
年收入
32.2
31.1
32.9
35.8
37.1
38.0
39.0
43.0
44.6
46.0
销售额
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
(1)画出散点图,你能从散点图中发现居民年收入与该种商品销售额之间的近似关系吗?
(2)如果它们之间近似呈线性关系,请画出一条直线来近似表示这种关系.
【答案】(1)散点图见解析,线性相关关系
(2)图象见解析
【知识点】绘制散点图、根据散点图判断是否线性相关
【分析】(1)根据表里数据标点即可;
(2)根据散点图即可画出一条直线.
【详解】(1)散点图如图所示:
从散点图中可以看出年收入与销售额之间的总体趋势成一条直线,也就是说它们之间是线性相关关系.
(2)所画直线如图所示.
知识点02 一元线性回归模型
1.一元线性回归方程:(1)一元线性回归方程:如果具有相关关系的两个变量 x,y 可用方程y=a+bx (1)来近似刻画,则称 (1) 式为 y 关于 x 的一元线性回归方程,其中 a,b 称为回归系数。
(2)方程,(2)是根据样本数据求出的回归方程的估计。
2.一元线性回归模型:我们把 yi=a+bxi+ei(i=1,2,…,n) 这一描述因变量 y 如何依赖于自变量 x 和随机误差 ei的方程称为一元线性回归模型。
3.最小二乘法:用随机误差的平方和即作为总随机误差来刻画各估计值与实际值之间的误差。若总随机误差最小,则这条直线就是所要求的回归直线。由于平方又叫二乘方,所以这种使 “随机误差平方和最小” 的方法叫作最小二乘法。
4的计算公式:令,则Q取最小值时,、的计算公式为
其中是回归直线在y轴的截距,是回归直线 的斜率.
【即学即练】(25-26高二下·河南周口·月考)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价x(元)与网上月销量y(万件)的数据如下:
x
10
12
14
16
18
y
8
7
6
5
4
(1)求相关系数r,并说明其意义;
(2)建立y关于x的线性回归方程;
(3)若月销量不低于5万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
【答案】(1),与完全负相关
(2)
(3)16元
【知识点】求回归直线方程、相关系数的计算、相关系数的意义及辨析、根据回归方程进行数据估计
【详解】(1),,
故,
故与完全负相关.
(2),
故,回归方程为.
(3)由题设,此时,故,故定价最高为16元.
知识点03 一元线性回归模型的应用
1.回归分析的主要目的:一元线性回归方程在一定程度上描述了变量x与y之间的数量关系,根据这一方程,可依据自变量x来估计或预测因变量y的取值,这就是回归分析的主要目的。
2.运用一元线性回归模型思想解题的步骤:
一般地,运用一元线性回归模型思想解决实际问题的基本步骤为:
(1) 确定研究对象,明确哪个变量是因变量,哪个变量是自变量;
(2) 运用相关系数的计算公式,分析自变量与因变量之间的关系;
(3) 运用最小二乘原理估计一元线性回归方程的系数,建立一元线性回归方程;
(4) 根据一元线性回归方程进行预测。
3.非线性回归问题:在实际问题中,如果从数据的散点图可以看出两个变量之间有明显的非线性关系,就需要选择一个合适的曲线方程,按照这个曲线方程对原始数据进行代换,目的是把变量间的非线性关系转化为近似的线性关系,然后用建立线性回归方程的方法确定未知参数。
【即学即练】(25-26高二下·江西萍乡·期中)2026年国务院政府工作报告明确指出:支持有条件的地方推广中小学春秋假,落实职工带薪错峰休假制度,这一政策直接带动旅游市场热度.某景点为科学定价、吸引更多游客,根据往年数据拟定价格,有关门票价格和日游客人数的数据如下表所示:
门票价格(元/人)
30
40
50
60
70
日游客人数(千人)
21
20
14
8
7
(1)已知与具有线性相关关系,求出关于的线性回归方程;
(2)为了扩大景区知名度与客流吸引力,景区将门票定价为10(元/人),并计划做广告宣传.由前期调查可知,当日均广告费为千元时的日游客人数为千人,其中是当门票为10(元/人)时,根据(1)的回归方程所预测的日游客人数.求景区的日均广告费用为多少千元时,日门票净收入最大.(日门票净收入=票价×日游客人数-广告费)
参考数据:.参考公式:线性回归方程.
【答案】(1);
(2)5千元.
【知识点】利用给定函数模型解决实际问题、求回归直线方程、根据回归方程进行数据估计
【分析】(1)根据给定条件,利用最小二乘法求出回归直线方程.
(2)由(1)的结论求出日门票净收入关于的函数关系,再列出不等式组求解.
【详解】(1)设关于的线性回归方程为,
由数表得,
而,
所以关于的线性回归方程为.
(2)由(1)知,当时,,则,
日门票净收入,,
当时,令最大,则,即,
整理得,而,,
函数是递增的,因此,,
所以当门票定价为10元,日广告费用为5千元时门票净收入最大.
题型01 求回归直线方程
【典例1】(25-26高三·全国·一轮复习)我国某农业大学植物研究所相关人员为了解仙人掌的植株高度(单位:),与其根茎长度(单位:)之间是否存在线性相关的关系,通过采样和数据记录得到如下数据:
样本编号
1
2
3
4
根茎长度
10
12
14
16
植株高度
62
86
112
132
参考数据:,,.
(1)由上表数据计算相关系数,并说明是否可用线性回归模型拟合与的关系(若,则可用线性回归模型拟合,计算结果精确到0.001);
(2)求y关于x的经验回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式,相关系数r的公式分别为,
【答案】(1),可用线性回归模型拟合与的关系;
(2)
【知识点】相关系数的计算、求回归直线方程
【分析】(1)求出,,,,根据,可判断出可用线性回归模型拟合与的关系;
(2)求出和,从而得到关于的经验回归方程.
【详解】(1),,
,
,
,可用线性回归模型拟合与的关系;
(2),,
故关于的经验回归方程为.
【变式1-1】(25-26高二下·全国·单元测试)已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
【答案】C
【知识点】根据样本中心点求参数、求回归直线方程
【分析】先根据斜率值设经验回归方程,再代入样本中心点求出参数得出经验回归方程即可.
【详解】由条件知,,设经验回归方程为,
则,
∴经验回归的方程是.
故选:C.
【变式1-2】(25-26高二下·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
【答案】(1);
(2)
【知识点】求回归直线方程、根据回归方程进行数据估计
【详解】(1),,
,
则,
所以关于的线性回归方程为;
(2)中,令得,
预测记忆力为9的学生的判断力为.
【变式1-3】(25-26高二下·全国·课堂例题)下表是某种产品销售收入与销售量之间的一组数据:
销售量x(吨)
2
3
5
6
销售收入y(万元)
7
8
9
12
(1)画出散点图;
(2)求出经验回归方程;
(3)根据经验回归方程估计销售量为9吨时的销售收入.
【答案】(1)作图见解析
(2)
(3)14.5万元
【知识点】根据回归方程进行数据估计、求回归直线方程、绘制散点图
【分析】(1)根据所给的数据,写出4组坐标,作出散点图即可;
(2)根据所给的数据先求出横坐标和纵坐标的平均数,利用最小二乘法写出线性回归方程系数的表达式,把样本中心点代入求出的值,得到线性回归方程;
(3)根据所给的变量的值,把值代入线性回归方程可得答案.
【详解】(1)在坐标系中描出点,散点图如图
(2),
,,
,
∴所求的经验回归方程为;
(3)当时,.
故当销售量为9吨时,估计销售收入为14.5万元.
题型02 最小二乘法的概念及辨析
【典例2】(2023·山东·模拟预测)某公司在2016-2021年的销售额(万元)如下表,根据表中数据用最小二乘法得到的回归方程为.
2016
2017
2018
2019
2020
2021
则当关于的表达式取最小值时,__________.
【答案】4067
【知识点】最小二乘法的概念及辨析
【分析】根据题意结合最小二乘法可得取到最小值时,,换元令,分析运算即可.
【详解】根据题意结合最小二乘法可知:取到最小值时,,
令,即,
则取到最小,
即,所以.
故答案为:4067.
【变式2-1】(22-23高二下·上海奉贤·期中)用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【答案】D
【知识点】最小二乘法的概念及辨析
【分析】由最小二乘法的定义判断即可.
【详解】根据最小二乘法的求解可知:回归方程是为了使得每个数据与估计值之间的差的平方和最小,
即残差平方和最小.
故选:D
【变式2-2】(2023·陕西宝鸡·模拟预测)回归直线方程的系数a,b的最小二乘法估计使函数最小,Q函数指( )
A. B.
C. D.
【答案】A
【知识点】最小二乘法的概念及辨析
【分析】由表示随机误差的平方和得出答案.
【详解】是指所求回归直线方程在各点的值与真实值的误差的平方和,
即.
故选:A
【变式2-3】(2023·上海杨浦·二模)对成对数据、、…、用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
【答案】D
【知识点】最小二乘法的概念及辨析
【分析】由最小二乘法的求解即可知.
【详解】根据最小二乘法的求解可知:回归方程是为了使得每个数据与估计值之间的差的平方和最小,
故选:D
题型03 解释回归直线方程的意义
【典例3】(25-26高二上·江苏常州·期末)(多选)某单位通过对数据的统计与分析得知,日用电量(单位:)与当天平均气温(单位:)之间线性相关,且线性回归方程为.已知数据样本的相关系数为,则下列说法正确的有( )
A.日用电量与平均气温成负相关,气温每升高,日用电量平均减少
B.可以预测到当平均气温为时,日用电量约为
C.如果样本的相关系数,则说明用电量与平均气温的线性相关性很弱
D.该回归直线必经过样本点的平均值点
【答案】ABD
【知识点】根据回归方程进行数据估计、计算样本的中心点、相关系数的意义及辨析、解释回归直线方程的意义
【详解】A、因为线性回归方程为,,两个变量成负相关,
即当气温每升高,日用电量平均减少,故A正确;
B、因为线性回归方程为,当时,,
则当平均气温为时,日用电量的度数约为68,故B正确;
C、,,非常接近1,
说明用电量与平均气温的线性相关性很强,故C错误;
D、回归直线必经过样本中心,
所以回归直线必经过样本点的平均值点,故D正确.
【变式3-1】(25-26高三上·河南·月考)(多选)某同学在一次试验中,得到两个变量,的成对样本数据:,,⋯,,经对该组数据研究发现,变量,间具有线性相关关系,用最小二乘法求得的经验回归方程为.该同学给出如下结论,其中正确的结论有()
A.变量与具有正线性相关关系
B.在实际问题中,解释变量每增加1个单位,响应变量一定相应增加个单位
C.经验回归直线过样本点的中心
D.散点图中的点中至少有一个点在经验回归直线上
【答案】AC
【知识点】求回归直线方程、解释回归直线方程的意义、根据样本中心点求参数、相关系数的意义及辨析
【分析】A选项:由线性回归系数的符号可判断相关性的正负,当斜率大于0时,变量之间呈正线性相关关系;B选项:回归方程中的斜率表示解释变量每增加一个单位时,响应变量预测值的平均变化量,不能断言每一个个体都会发生确定的同等变化;C选项:根据最小二乘法的性质,回归直线必然经过样本中心点,D选项:对于任意给定的样本数据,散点不一定落在拟合的回归直线上,这是模型拟合的统计特性,回归线是整体趋势的估计,并不强制经过某个样本点.
【详解】因为经验回归方程为,根据正线性相关关系的定义,
当时,随的增大而增大,所以变量与具有正线性相关关系,故选项A正确.
在实际问题中,解释变量每增加1个单位,响应变量的平均变化量为,
但不一定增加个单位,因为经验回归方程是根据样本数据拟合的,存在一定的误差,故选项B错误.
根据经验回归直线的性质,经验回归直线一定过样本点的中心,故选项C正确.
散点图中的点不一定都在经验回归直线上,
经验回归直线是根据样本数据拟合的,它不一定经过所有样本点,故选项D错误.
故选:AC
【变式3-2】(25-26高二下·江西萍乡·期中)(多选)在一项关于学生体能测试的研究中,某研究小组随机选取了100名学生作为研究对象.他们记录了每位学生的日常锻炼时间(记为变量,单位:小时)与体能测试得分(记为变量,单位:分)的数据.通过对这100组成对数据进行统计分析,某学生计算出回归直线方程为,则下列说法正确的是( )
A.体能测试得分与日常锻炼时间正相关
B.该样本数据的相关系数为4.8
C.该样本数据中的所有点都可以不在该回归直线方程上
D.某学生的日常锻炼时间为2小时,则他的体能测试得分一定为82分
【答案】AC
【知识点】判断正、负相关、解释回归直线方程的意义、相关系数的意义及辨析、根据回归方程进行数据估计
【详解】对于A,在回归直线方程中,由,得与日常锻炼时间正相关,A正确;
对于B,该样本数据的相关系数在内,B错误;
对于C,该样本数据中的所有点都可以不在该回归直线方程上,C正确;
对于D,当时,,即时间为2小时,体能测试得分约为82分,D错误.
【变式3-3】(2026·广东深圳·二模)(多选)某公司统计了去年1月份到5月份某种产品的销售额如下表:
月份
1
2
3
4
5
销售额万元
1.8
2.2
2.8
3.1
根据表中数据,通过最小二乘法求得的经验回归方程为,则( )
A.变量与正相关
B.
C.样本数据的下四分位数为1.8
D.当时,的预测值为4.1万元
【答案】ABD
【知识点】根据回归方程求原数据中的值、总体百分位数的估计、用回归直线方程对总体进行估计、相关系数的意义及辨析
【分析】根据回归系数,可判定A正确;根据回归直线方程经过样本中心,列出方程,求得的值,可判定B正确;根据百分位数的计算方法,可判定C错误;根据回归直线方程,求得预测值,可判定D正确.
【详解】对于A,由回归直线方程,可得,
所以变量与正相关,所以A正确;
对于B,因为回归直线方程经过样本中心,
因为,所以,
又由,解得,所以B正确;
对于C,将样本数据的数据排序为:,
由,则样本数据的下四分位数为第个数据,所以C不正确;
对于D,当时,,所以的预测值为万元,所以D正确.
题型04 已知回归方程求原数据中的值
【典例4】(24-25高二下·上海·期末)一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为__________.
零件数x(个)
2
3
4
5
加工时间y(分钟)
30
a
40
50
【答案】36
【知识点】根据回归方程求原数据中的值
【分析】根据回归方程经过样本中心点,代入即可求得的值.
【详解】根据表中数据可知,,
因为回归方程经过样本中心点,
代入回归直线方程可得,解得,
故答案为:36.
【变式4-1】(2025·云南昆明·模拟预测)下表为2018至2024年某手机品牌的年产量y(单位:万台),其中2018至2024年的年份代码x分别为1至7.
年份代码x
1
2
3
4
5
6
7
年产量y/万台
28
32
36
40
a
b
c
已知y与x具有线性相关关系,由上述7组数据得到经验回归方程,则的值为( ).
A.165.4 B.173.4 C.182.5 D.191.8
【答案】B
【知识点】根据样本中心点求参数
【分析】先求出,又因为点在经验回归直线上,得出即可计算求解.
【详解】由表中数据得,
因为点在经验回归方程直线上,所以,
所以,
故选:B.
【变式4-2】(2026·山东德州·一模)为研究某池塘中水生植物覆盖池塘的面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,如表格所示,得到与的线性回归方程,则( )
3
4
6
7
2
2.5
4.5
A.5 B.6 C.7 D.8
【答案】C
【知识点】根据样本中心点求参数
【详解】由题意可得,,
所以样本中心点为,又与的线性回归方程,
所以,解得.
【变式4-3】(25-26高二下·河南南阳·月考)已知具有相关关系的变量,它们之间的一组数据如表所示,若关于的回归方程为,则( )
A. B. C. D.
【答案】A
【知识点】根据样本中心点求参数、计算样本的中心点
【详解】,,
代入回归方程后可得,故.
题型05 计算样本的中心点求参数
【典例5】(25-26高三上·广东·月考)一组数据的线性回归方程为,若,则_____.
【答案】78
【知识点】计算几个数的平均数、计算样本的中心点
【分析】根据回归直线恒过样本中心点,求得,即可求得.
【详解】由得.
因为过点,所以,所以.
故答案为:78.
【变式5-1】(25-26高二下·河南南阳·开学考试)某产品的广告费用与销售额的统计数据如下表:
广告费用x/万元
1.8
2.2
3
5
销售额y/万元
t
7
14
16
根据上表数据得到y与x的回归直线方程为,则t的值( )
A.3 B.5.5 C.4 D.6.5
【答案】A
【知识点】计算样本的中心点、根据样本中心点求参数、计算几个数的平均数
【详解】依题意,得,,
所以,解得.
【变式5-2】(2025高二·全国·专题练习)在抗击新型冠状病毒肺炎(COVID-19)期间,有研究团队得到了一项研究成果,首次揭示了COVID-19患者发生急性呼吸窘迫综合征(ARDS)和从ARDS进展至死亡的危险因素,并首次提出发生ARDS的COVID-19患者使用甲强龙可能获益的观点.为了了解甲强龙的指标数据y与质量分数p(单位:%)之间的关系,随机统计了相关数据,如下表,由最小二乘法求得经验回归方程为.
p
6
10
14
18
22
y
62
x
44
28
14
现发现表中有一个数据x模糊不清,请你推断,该数据的值为( )
A.53 B.56 C.59 D.62
【答案】A
【知识点】根据样本中心点求参数、根据回归方程求原数据中的值
【分析】先分别求出和,再根据经验回归直线过点,代入回归方程计算即得.
【详解】由已知可得,,
因为经验回归直线过点,所以,解得.
故选:A.
【变式5-3】(24-25高二下·山西·期末)某校当天的新增感冒人数与温差(单位:)的5组数据如下表:
5
7
8
9
11
9
17
20
由于保存不善,有两个数据模糊不清,用,代替,已知关于的经验回归方程为,则( )
A. B. C. D.
【答案】D
【知识点】根据回归方程求原数据中的值、根据样本中心点求参数
【分析】求出样本中心点,再利用回归方程即可求解.
【详解】依题意,,,
则,得,所以.
故选:D
题型06 根据样本中心点求斜率、截距
【典例6】(25-26高二上·江西宜春·期末)根据下表数据得到y关于x的线性回归方程,则=______.
x
4
6
7
8
10
y
2
3
4
5
6
【答案】/
【知识点】计算样本的中心点、根据样本中心点求参数
【分析】根据必在线性回归直线上代入求解即得.
线性回归方程中心点性质计算即可.
【详解】,,
因必在线性回归直线上,
则有,解得.
故答案为:.
【变式6-1】(25-26高二下·全国·单元测试)某饮料店某5天的日销售收入(单位:百元)与当天平均气温(单位:℃)之间的数据如下表:
0
1
2
5
4
2
2
1
若与之间是线性相关关系,且关于的经验回归方程是,则实数的值是( )
A.3 B.2.8 C.2.6 D.2.4
【答案】B
【知识点】根据样本中心点求参数
【分析】根据表格中的数据,求得样本点的中心是,将其代入回归方程,即可求解.
【详解】由统计表格中的数据,可得,,
所以统计数据的样本点的中心为,
因为关于的经验回归方程是,
代入可得,解得.
故选:B.
【变式6-2】(25-26高二下·上海松江·期中)某产品的研发投入费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:
/万元
2.2
2.6
4.3
5.0
5.9
/万件
3.8
5.4
7.0
10.35
12.2
根据表中的数据,可得回归直线方程,则______.
【答案】
【知识点】根据样本中心点求参数、计算样本的中心点
【详解】由题意可得,
,
因为回归直线方程经过点,
所以.
【变式6-3】(2026·辽宁抚顺·一模)若根据样本数据得到的回归直线方程为,且,,则______.
【答案】
【知识点】计算样本的中心点、根据样本中心点求参数
【详解】由题意得,
则,
则样本中心点为,将其代入到,
即,解得.
题型07 根据回归方程进行数据估计
【典例7】(2026·江苏·一模)某兴趣小组研究昼夜温差大小与患感冒人数多少之间的关系,他们到气象局和医院抄录了1~7月份每月5日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月5日
2月5日
3月5日
4月5日
5月5日
6月5日
7月5日
昼夜温差
10
11
13
12
8
7
6
感冒人数
23
25
29
26
16
13
9
该兴趣小组确定的研究方案是:先从这7组数据中选取2组,用剩下的5组数据求经验回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据是不相邻的两个月的概率;
(2)若该小组选取的是1月与6月的两组数据,请根据剩下5个月份的数据:
①求出关于的经验回归方程;
②若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的经验回归方程是理想的,问:该小组所得经验回归方程是否理想?说明理由.
附:
【答案】(1)
(2)①;②是理想的,理由见解析
【知识点】求回归直线方程、实际问题中的组合计数问题、用回归直线方程对总体进行估计、计算古典概型问题的概率
【分析】(1)利用组合数和对立事件概率公式直接求解即可;
(2)①利用最小二乘法直接求解即可;
②分别将和代入回归直线方程,由此可得预估值,与检验数据之差的绝对值均不超过2可确定结论.
【详解】(1)记事件为“选取的2组数据是不相邻的两个月”,
则
(2)①由题意,,.
1
3
2
4
8
5
则,
即,
所以关于的经验回归方程为.
②当时,;
当时,.
所以该小组所得经验回归方程是理想的.
【变式7-1】(25-26高二下·全国·单元测试)某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
【答案】
【知识点】根据样本中心点求参数、根据回归方程进行数据估计
【分析】根据题意,求得的值,代入回归方程,求得,得到回归方程,进而求得答案.
【详解】由表格中的数据,可得,
因为回归方程中的,代入可得,
所以经验回归方程为,
当时,,即每天的销售量约为个.
故答案为:;.
【变式7-2】(25-26高二下·河南南阳·月考)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价(元)与网上月销量(万件)的数据如下:
(1)求相关系数(保留3位小数),并说明与的线性相关程度;
(2)建立关于的线性回归方程;
(3)若月销量不低于万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
【答案】(1),与完全线性负相关.
(2)
(3)定价最高为元.
【知识点】根据回归方程进行数据估计、相关系数的计算、求回归直线方程
【详解】(1),,
故
,
故与完全负相关.
(2),故,
故回归方程为.
(3)由题设,此时,故,故定价最高为元.
【变式7-3】(25-26高二下·上海·期中)绝对零度()是一个只能逼近而不能达到的最低温度,那么这个数据是如何得到的?小张同学通过查询资料了解到:①气体温度和气体压强存在线性关系;②当气体压强为时,气体温度达到绝对零度.小张同学在实验时,记录了某种气体温度和气体压强一组相关数据:
数据
1
2
3
4
5
6
温度
4.07
16.69
29.42
45.67
57.06
73.05
压强
103.095
107.734
112.461
118.469
122.706
128.758
(1)用上表数据建立气体压强与气体温度的线性回归方程,若这组实验数据的拟合误差小于0.05,则认为得到的线性回归是理想的.求出回归方程(精确到0.001),并判断所得回归方程是否理想?附:拟合误差
(2)估计该次实验下绝对零度的数值.(精确到)
【答案】(1),回归方程是理想的
(2)
【知识点】残差的计算、根据回归方程进行数据估计、求回归直线方程
【详解】(1),
,
,
将,即代入,
解得
回归方程为 ,
,
因为 ,所以回归方程是理想的.
(2)回归方程为,
令,解得(),
预估该次实验下绝对零度的数值为.
题型08 非线性回归问题
【典例8】(25-26高二下·湖南长沙·月考)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出关于的回归方程.
(计算结果精确到0.1)
附:回归方程中
参考数据
5215
17713
714
27
81.3
3.6
【答案】(1)更适宜
(2)
【知识点】根据散点图判断是否线性相关、非线性回归、求回归直线方程
【分析】(1)通过观察散点图的增长趋势,判断指数型模型比线性模型更贴合数据分布;
(2)先对指数型模型取对数进行线性转换,再利用线性回归的方法计算系数,最后还原得到原模型的回归方程.
【详解】(1)由散点图可以判断,随温度升高,平均产卵数增长速度越变越快,符合指数函数模型的增长,
所以更适宜作为平均产卵数关于平均温度的回归方程类型.
(2)将两边同时取自然对数,可得,
令,则得到直线方程,
由题中的数据可得,,
所以,
则,
所以关于的线性回归方程为,
故关于的回归方程为.
【变式8-1】(18-19高二下·内蒙古巴彦淖尔·月考)在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得经验回归方程为,则该模型的回归方程为________.
【答案】
【知识点】非线性回归
【分析】由回归直线方程可得:,解出即可求解.
【详解】因为,
所以.
故答案为:.
【变式8-2】(25-26高二下·全国·单元测试)近期,某市公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次.
[参考数据:,,,,,其中,]
【答案】(1)适宜
(2),347十人次
【知识点】根据回归方程进行数据估计、非线性回归、求回归直线方程、根据散点图判断是否线性相关
【分析】(1)根据散点图判断即可.
(2)对两边同时取常用对数,得,进而转化为线性关系,再根据已知数据计算回归方程,并代入数据检验即可.
【详解】(1)由散点图,得适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型.
(2)由,两边同时取常用对数,得,
设,则,由,,
得,,
因此,即,则,
当时,得,
所以y关于x的回归方程为,活动推出第8天使用扫码支付的人次为347十人次.
【变式8-3】(25-26高二下·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
【答案】(1)②合适
(2)
【知识点】求回归直线方程、非线性回归
【分析】(1)利用函数①②③的性质及表中的数据,即可求解;
(2)先将非线性回归方程转化成线性回归方程,再根据题设条件,利用最小二乘法,即可求解.
【详解】(1)由表格可知,增大时,值整体呈上升趋势但存在局部波动,比较函数①②③,
选择②()作为学习时间x和平均成绩y的回归类型最合适.
(2)对()两边取以为底的对数可得,
设,则,
,
,所以,
故,即,所以.
一、单选题
1.(25-26高二下·黑龙江大庆·期中)某商店记录2026年4月(16日至20日)每天的平均气温(单位:℃)与矿泉水日销量(单位:瓶),得到数据如下表:
气温
10
11
12
13
14
销量
65
70
75
80
85
经计算,气温与销量的样本相关系数接近1,经验回归直线方程为,其中斜率,则截距的值为( )
A.20 B.15 C.10 D.5
【答案】B
【知识点】根据样本中心点求参数
【详解】因为,且,
所以,解得.
2.(25-26高二上·江西九江·期末)已知变量与的一组统计数据如下表:
2
4
5
6
8
27
42
62
72
87
若与线性相关,且关于的经验回归方程为.据此估计,当为9时,约为( )
A.95 B.100 C.105 D.110
【答案】B
【知识点】根据回归方程进行数据估计、计算样本的中心点、根据样本中心点求参数、求回归直线方程
【分析】由题意,求出,代入回归方程求出,进而求出回归方程,令,计算即可求解.
【详解】由题意可得,,
由于回归直线过样本的中心点,
所以,解得,
故回归方程为,
当时,.
故选:B.
3.(25-26高三下·上海·月考)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用:(单位:万元)与销售利润(单位:万元)的相关数据,根据下表中数据,得到经验回归方程,则下列结论中错误的是( ).
广告费用
3
4
5
8
销售利润
4
5
7
8
A. B.
C.直线必过点 D.直线必过点
【答案】C
【知识点】求回归直线方程、计算样本的中心点、根据回归方程进行数据估计
【详解】由题意可得,,即样本中心为,所以直线必过点,D正确,C错误;
而,,
因此,,所以AB正确.
4.(25-26高二上·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
【答案】D
【知识点】用回归直线方程对总体进行估计、根据样本中心点求参数、根据回归方程进行数据估计
【详解】由第7天的实际值是,所以预测值为35.6,得 ①,
因为回归直线经过中心点,又,,所以②,
联立①②,解得,,
所以预计第10天的营业收入(千元).
5.(2026·福建莆田·二模)为了探究六年级学生每日自主阅读时间与语文成绩的关系,某研究小组随机调查了50名学生,得到成对样本数据,其中表示每日自主阅读时间(单位:小时),表示语文成绩(单位:分).经计算得回归直线方程为.下列说法正确的是( )
A.该样本数据的相关系数为5.2
B.当阅读时间每增加1小时,语文成绩平均增加5.2分
C.该样本数据中,至少有一个点在回归直线上
D.若某学生每日阅读时间为2小时,则他的语文成绩一定为分
【答案】B
【知识点】相关系数的意义及辨析、根据回归方程进行数据估计、解释回归直线方程的意义
【分析】根据相关系数范围可以判断A;由回归系数定义可以判断B对;根据回归方程性质可以判断C,D.
【详解】对于A,相关系数取值范围是,故错误;
对于B,回归系数的含义是:当自变量每增加1个单位时,因变量平均增加的量。
这里表示每日自主阅读时间(小时),表示语文成绩(分),所以当阅读时间每增加1小时,语文成绩平均增加5.2分,故正确;
对于C,回归直线是对样本的拟合直线,不一定经过样本点,故错误;
对于D,当时,,为预测值,不是确定值,故错误.
6.(2026·安徽六安·模拟预测)已知具有线性相关的两个变量之间的一组数据如表:
0
1
2
3
4
2.5
4.0
4.3
4.2
且回归直线方程是,则( )
A.6.2 B.6.3 C.6.4 D.6.5
【答案】D
【知识点】计算样本的中心点、根据样本中心点求参数
【分析】求出样本中心点,再利用回归直线过样本中心点求解.
【详解】由数据表,得,
依题意,回归直线过点,则,
所以.
故选:D
7.(25-26高二下·全国·课堂例题)若某地财政收入x与支出y满足经验回归方程(单位:亿元),其中,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元 B.9亿元 C.10.5亿元 D.9.5亿元
【答案】C
【知识点】求回归直线方程、根据回归方程进行数据估计
【分析】由参数值可得经验回归方程,令,代入求得的值,再根据求得预计支出的上下限,即可求得选项.
【详解】由题知,
令得,
又因为,所以.
所以年支出预计不会超过10.5亿元.
故选:C.
8.(25-26高二上·陕西汉中·期末)茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,已知变量和满足经验回归方程,且变量和一组相关数据统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
17
则下列说法错误的是( )
A.
B.变量和呈正相关
C.该经验回归方程必过点
D.若某户家庭人口数为8时,预测该户茶产业的年收入为万元
【答案】C
【知识点】求回归直线方程、计算几个数的平均数、根据样本中心点求参数、根据回归方程进行数据估计
【分析】由已知表格中的数据,代入回归直线方程即可求解参数判断A,应用回归直线判断B,C,在回归方程中,将代入,求得值即可判断D.
【详解】由题知,.
代入,得出,
所以,A选项正确;
,变量和呈正相关,B选项正确;
由题知,,该经验回归方程必过点,C选项错误;
当时,,
故当某户家庭人口数为8时,预测该户茶产业的年收入为25.7万元,D选项正确;
故选:C
二、多选题
9.(25-26高二下·河南南阳·开学考试)2024年全民健身运动的主题“全民健身与奥运同行”,为了满足群众健身需求,某健身房近几年陆续购买了几台型跑步机,该型号跑步机已投入使用的时间(单位:年)与当年所需要支出的维修费用(单位:千元)有如下统计资料:
2
3
4
5
6
2.2
3.8
5.5
6.5
7
根据表中的数据可得到线性回归方程为:,则( )
A.与的样本相关系数
B.
C.当每增加一个单位时,平均增加1.23个单位
D.该型跑步机已投入使用的时间为10年时,当年所需要支出的维修费用一定是12.38万元
【答案】ABC
【知识点】用回归直线方程对总体进行估计、根据样本中心点求参数、相关系数的意义及辨析
【详解】,,所以样本中心点为,
A选项,由表中数据可得随着增大而增大,与正相关,所以相关系数,A正确;
B选项,将样本中心点代入回归方程,可得,故B正确;
C选项,由线性回归方程可得C正确;
D选项,根据回归分析的概念,跑步机投入使用的时间为10年时,所需要支出的维修费用大概是千元,故D错误.
10.(24-25高二下·广东广州·期末)用模型去拟合一组数据,设,将其变换后得到线性回归方程,则( )
A. B. C. D.
【答案】AD
【知识点】非线性回归、指数式与对数式的互化
【分析】利用非线性转化为线性,即可求线性回归方程,通过系数对比即可得判断.
【详解】由两边取自然对数得:,
由变换后得到线性回归方程,
则,即,故AD正确,BC错误;
故选:AD.
11.(25-26高二下·河南南阳·月考)对于变量X,Y,经过随机抽样获得成对数据(,2,3,…,10),且,利用最小二乘法得到Y关于X的线性回归方程为,且X与Y的相关系数,则下列结论正确的是( )
A.r越大,X与Y的线性相关性越强
B.若,则
C.若,则
D.若样本点(,2,3,…,10)都在回归直线上,则
【答案】AD
【知识点】相关系数的意义及辨析、根据样本中心点求参数、相关系数的计算
【分析】根据的性质即可求解ABD,根据样本中心在直线上,可求解C.
【详解】由于可得,则,
对于A, r的绝对值越接近1,由于,故的值越大,X与Y的线性相关性越强,故A正确,
对于C,当时,,则,故C错误,
对于D, 若样本点(,2,3,…,10)都在回归直线上,且,则,D正确,
对于B, 当时,无法确定的值,B错误,
三、填空题
12.(25-26高二下·上海·期中)已知、取值如表所示,从散点图分析,与线性相关,且,则__________.
0
1
3
4
0.9
1.9
3.2
4.4
【答案】
【知识点】根据样本中心点求参数
【详解】,,
所以
13.(25-26高二上·全国·随堂练习)某学校开展研究性学习活动,一组同学获得了下面的一组试验数据:
x
1.99
3
4
5.1
8
y
0.99
1.58
2.01
2.35
3.00
现有如下5个模拟函数:①;②;③;④;⑤,请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号).
【答案】④
【知识点】非线性回归
【分析】根据表中提供的数据,可通过描点,连线,画出图象,看哪个函数的图象能接近所画图象,这个函数便可反应这些数据的规律.
【详解】根据表中数据,画出图象如下:
通过图象可看出,能比较近似的反映这些数据的规律.
故答案为:④.
14.(25-26高二上·全国·单元测试)某学习小组用计算机软件对一组数据,进行回归分析,甲同学首先求出线性回归方程为,样本点的中心为.乙同学对甲的计算过程进行检查,发现甲将数据误输成,数据误输成,将这两个数据修正后得到线性回归方程为,则实数______.
【答案】
【知识点】根据样本中心点求参数、计算样本的中心点
【分析】根据样本点的中心为,求得,然后利用样本点的中心,由甲求得,,再由乙求得样本点的中心,代入回归直线方程即可求解.
【详解】修正前样本点的中心为,代入,可知.
假设甲输入的为,为,
则,,
得,,
修正后,,
则样本点的中心为,将其代入线性回归方程,
得.
故答案为:
四、解答题
15.(2026·江苏南京·一模)为研究昼夜温差(单位:)与某植物种子当日的百粒发芽数(单位:粒)之间的关系,实验室记录了6天的每日昼夜温差与种子当日的百粒发芽数,如下表所示:
日期编号
1
2
3
4
5
6
温差
9
13
11
15
10
14
百粒发芽数
23
28
26
31
25
29
(1)根据表中的数据,计算样本相关系数(精确到0.01);
(2)求百粒发芽数关于温差的经验回归方程,并估计昼夜温差为时,这种植物种子当日的百粒发芽数.
参考公式:相关系数,
,,
参考数据:,,,.
【答案】(1)
(2),
【知识点】求回归直线方程、相关系数的计算、根据回归方程进行数据估计
【分析】(1)根据条件,直接计算,即可求解;
(2)根据条件,直接求出,即可求出线性回归方程,再将代入,即可求解.
【详解】(1)相关系数.
(2)由题意得,,
所以,,
所以所求的经验回归方程是,
当时,,
故当昼夜温差为时,这种植物种子当日百粒发芽数为.
16.(25-26高二下·江西·月考)为促进消费,助力经济发展,某市持续开展了共8期政府消费券发放活动,记第期活动发放的消费券总额为百万元,带动的消费为百万元,根据这8期活动的数据,可得,,且和的样本方差分别为,,用最小二乘法得到关于的线性回归方程为.
(1)若下一期活动政府计划发放10.8百万元的消费券,预计可以带动多少消费;
(2)求相关系数.(结果保留2位小数)
(附参考数据及公式:.相关系数,线性回归方程中,,.)
【答案】(1)百万元
(2)
【知识点】求回归直线方程、相关系数的计算、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】(1)求得,,得到样本中心,进而求出回归方程,将代入即可求出预测值.
(2)根据样本方差求出,,结合线性回归方程求出,代入相关系数公式求解即可.
【详解】(1)由,,可得,,
所以数据的样本中心为.
代入回归方程,可得,解得.
所以回归直线方程为.
当时,可得百万元,
故预计可以带动消费百万元.
(2)解:由,,
可得,,
又由,可得,
解得,
所以.
17.(24-25高二下·山东·月考)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
【答案】(1)模型建立y与x的回归方程更合适;
(2);
(3)960万元.
【知识点】求回归直线方程、相关系数的计算、相关系数的意义及辨析、非线性回归
【分析】(1)利用非线性转化为线性,再求相关系数即可得到判断;
(2)利用非线性转化为线性,再求线性回归方程系数即可得解;
(3)利用基本不等式求最大值即可.
【详解】(1)由题意知,,
因为,所以用模型建立y与x的回归方程更合适.
(2)令,回归方程为,因为,,
所以关于x的回归方程为,即.
(3)由题意知,
当且仅当,即时取等号,
则,所以.
所以当研发经费投入为60万元时企业生产的利润最大,最大利润为960万元.
1 / 17
学科网(北京)股份有限公司
$