内容正文:
2025-2026学年高二数学同步知识·题型解题秘籍精讲精练讲义(人教A版2019选择性必修第三册)
8.2一元线性回归模型及其应用6题型分类
一、一元线性回归模型
我们称为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
二、线性回归方程
1.我们将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
2.回归直线方程过样本点的中心(,),是回归直线方程最常用的一个特征.
三、最小二乘法
这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(least squares estimate ),其中.
四、残差的概念
1.对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
2.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
五、刻画回归效果的方式
1.残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
2.残差平方和法:残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
3.利用R2刻画回归效果:决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
(一)
求回归直线方程
1.回归直线方程:
我们将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.其中.
2.求线性回归方程的一般步骤:
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格xi,yi,x,xiyi.
(4)计算,,x,xiyi.
(5)代入公式计算,,公式为
(6)写出线性回归方程=x+.
题型1:求回归直线方程
1.(2026高三·广西桂林·开学考试)春节将至,某商家统计了去年某商品的日营销费用x(单位:百元)与日销售量y(单位:百件),为今年的营销方案制定提供相关的数据参考,得到的数据如下表:
日营销费用x/百元
2
3
4
5
6
日销售量y/百件
1
1.1
1.5
1.8
2.1
已知y与x线性相关.
(1)根据上表数据,求y关于x的经验回归方程;
(2)请利用(1)中的经验回归方程,试估计当今的日销售费用为1000元时,日销售量为多少百件.
参考公式:对于一组具有线性相关关系的数据().其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)
(2)3.24百件
【分析】(1)求出的平均值,利用给定公式计算可求出y关于x的经验回归方程;
(2)将代入回归方程即可估算出结果.
【详解】(1),
,
则,
所以
故关于的经验回归方程为.
(2)将代入,得,
故当今年的日营销费用为1000元时,日销售量约为3.24百件.
2.(2026高二·全国·课后作业)某班10名学生的摸底考试成绩和期末考试成绩如下:
摸底成绩
50
35
40
55
80
60
65
35
90
50
期末成绩
53
51
56
68
87
71
46
31
79
68
计算得:,.
(1)画出散点图;
(2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1).
附:,.
【答案】(1)散点图见解析
(2)
【分析】(1)根据表格中的对应数据作为点的横、纵坐标描点即得;
(2)由表格数据求出,将相关数据分别代入的计算公式计算即得.
【详解】(1)散点图如图所示.
(2)(2)由表格数据,,
,
则.
,
故回归直线方程为.
3.(2026高三·上海·课堂例题)测得10对父子身高[单位:英寸(1英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量与进行相关性检验;
(2)如果与之间具有相关关系,求回归直线方程;
(3)如果父亲身高为73英寸,试估计儿子的身高.
参考数据:,,,,,,.
【答案】(1)与之间具有较强的线性相关关系
(2)
(3)69.9英寸
【分析】(1)根据相关系数的公式代入计算的答案;
(2)根据最小二乘法计算得到回归直线方程;
(3)把代入回归方程得.
【详解】(1),
因为非常接近于1,所以与之间具有较强的线性相关关系;
(2)设回归直线方程为,,,
所以回归直线方程为;
(3)时,,所以父亲身高为73英寸时,儿子的身高约为69.9英寸.
4.(2026高三·上海·单元测试)当前,冷冻冷藏类技术发展迅速且应用广泛.某制冷技术重点实验室研究了不同果蔬在不同冻结速率下的冰点温度,以及低温环境对果蔬热物性的影响.设冻结速率为x(单位:分钟),冰点温度为y(单位:℃),如表为某种水果冰点温度随冻结速率变化的统计数据:
x
10
20
30
40
50
y
-5
-4.5
-2
1
2
根据以上数据,绘制了散点图:
(1)由散点图可以看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;
(2)求y关于x的线性回归方程,并预测当冻结速率为60分钟时,这种水果的冰点温度.
【答案】(1)答案见解析
(2), 4.15℃
【分析】(1)根据所给数据计算相关系数可得.
(2)求出回归方程中系数,得回归方程,代入回归方程可得估计值.
【详解】(1),
,因为,
故两个变量间线性相关性很强,可以用线性回归模型拟合y与x的关系;
(2)由表可知,,,
,,
故y关于x的线性回归方程为,
当时,,
故当冻结速率为60分钟时,这种水果的冰点温度为4.15℃.
5.(2026高二·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
【答案】(1);
(2)
【详解】(1),,
,
则,
所以关于的线性回归方程为;
(2)中,令得,
预测记忆力为9的学生的判断力为.
6.(2026·陕西西安·模拟预测)随着新能源产业的发展,我市近年来新能源汽车保有量快速增长,为了研究我市充电桩建设的情况,能源部门收集到了2021年到2025年充电桩数量(单位:万个),为方便研究,年份代码用表示(用分别表示2021年,2022年,…,2025年),具体参考数据如下表:
统计量
数值
15
21
55
72.6
(1)请根据表中数据,建立关于的回归直线方程;
(2)现对该市某区域现有的9个充电桩进行检查,其中4个为快充桩,随机抽取3个充电桩进行检查,记抽到的快充桩个数为,求的分布列及均值.
(参考公式:)
【答案】(1);
(2)的分布列为:
0
1
2
3
均值.
【分析】(1)代入回归直线方程的计算公式计算回归直线方程;
(2)根据题意可以看出服从超几何分布,根据超几何分布的概率计算公式可得到的分布列及均值.
【详解】(1)由题意可得:;;
故;
;
则关于的回归直线方程为:.
(2)由题意知,随机变量的取值为:0,1,2,3;则:
;
;
;
故的分布列为:
0
1
2
3
所以随机变量的均值.
7.(2026·陕西榆林·模拟预测)下表为品牌新能源汽车2025年月在地区的销售量(单位:百辆):
月份
1
2
3
4
5
6
销售量
5.1
6.6
7.0
7.6
9.8
若关于的经验回归方程为,且相关系数.
(1)求的值(精确到0.01);
(2)求的值(精确到0.1).
附:,相关系数.
参考数据:,.
【答案】(1)0.86
(2)8.6
【分析】(1)根据相关系数公式、的求解公式,结合题中数据进行求解即可;
(2)根据在回归直线上进行求解即可.
【详解】(1)由题意得,
,
所以,
所以,
所以.
(2)由(1)知,关于的经验回归方程为,
,,
因为在回归直线上,所以,
所以.
8.(2026高二·河南周口·阶段检测)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价x(元)与网上月销量y(万件)的数据如下:
x
10
12
14
16
18
y
8
7
6
5
4
(1)求相关系数r,并说明其意义;
(2)建立y关于x的线性回归方程;
(3)若月销量不低于5万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
【答案】(1),与完全负相关
(2)
(3)16元
【详解】(1),,
故,
故与完全负相关.
(2),
故,回归方程为.
(3)由题设,此时,故,故定价最高为16元.
题型2:样本中心的应用
9.(2026高二·河南南阳·阶段检测)已知具有相关关系的变量,它们之间的一组数据如表所示,若关于的回归方程为,则( )
A. B. C. D.
【答案】A
【详解】,,
代入回归方程后可得,故.
10.(2026·辽宁抚顺·模拟预测)若根据样本数据得到的回归直线方程为,且,,则______.
【答案】
【详解】由题意得,
则,
则样本中心点为,将其代入到,
即,解得.
11.(2026高二·江西宜春·期末)根据下表数据得到y关于x的线性回归方程,则=______.
x
4
6
7
8
10
y
2
3
4
5
6
【答案】/
【分析】根据必在线性回归直线上代入求解即得.
线性回归方程中心点性质计算即可.
【详解】,,
因必在线性回归直线上,
则有,解得.
故答案为:.
12.(2026高二·全国·单元测试)已知变量与线性相关,由样本点求得的线性回归方程为,若点在回归直线上,且,则______.
【答案】6
【分析】依题意,可得点在回归直线上,求得,将条件代入回归方程求出,利用平均数公式即可求得
【详解】由题意,点在回归直线上,
代入可得,,解得.
又,且样本点的中心在回归直线上,
故代入得,最后得结果,则,解得.
故答案为:.
13.(2026高二·天津·期末)已知一种服装的销售量y(单位:百件)与第x周的一组相关数据统计如表所示,若两变量x,y的经验回归方程为,则a=______.
x
1
2
3
4
5
y
7.5
6
3.3
a
1
【答案】2.2/
【分析】利用经验回归方程必过点这一性质,即可求解.
【详解】由题意得:,,
根据经验回归方程过点,所以有,
故答案为:2.2
14.(2026高二·河北邢台·期末)用最小二乘法得到的一组数据的经验回归方程为.若,则( )
A.63 B.21 C.28 D.49
【答案】C
【分析】计算,代入即可.
【详解】根据题意可得,所以,
则.
故选:C
15.(2026高二·福建厦门·期末)已知变量的4组相关数据分别为,则关于的线性回归直线必经过点( )
A. B. C. D.
【答案】B
【分析】计算出样本中心点即可求解.
【详解】因为,
线性回归直线必经过样本中心点.
故选:B.
16.(2026高二·广东茂名·期末)已知x与y之间的一组数据:
x
1
2
3
4
y
5.5
4
3.5
3
若y与x满足回归方程,则( )
A. B. C. D.
【答案】A
【分析】求出样本中心点坐标,利用回归直线经过样本中心点代入运算得解.
【详解】由表可得,,
因为线性回归方程过样本中心点,则,解得.
故选:A.
17.(2026高二·湖北·期末)已知一组样本数据的线性回归方程为,若的取值范围依次为2,4,6,8,10,则的值为( )
A.15 B.20 C.25 D.30
【答案】C
【分析】根据回归直线过样本点的中心求解即可.
【详解】,
所以.
故选:.
题型3:根据回归直线方程估计数据
18.(2026·陕西商洛·模拟预测)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下对应数据:
4
6
7
8
根据上表可得经验回归方程,据此估计,当投入万元广告费时,销售额为( )
A.万元 B.万元 C.万元 D.万元
【答案】D
【详解】由上表可知:,,
样本点的中心为,
代入经验回归方程,得,
经验回归方程为,
将代入可得,
当投入万元广告费时,销售额为万元.
19.(2026高二·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
【答案】D
【详解】由第7天的实际值是,所以预测值为35.6,得 ①,
因为回归直线经过中心点,又,,所以②,
联立①②,解得,,
所以预计第10天的营业收入(千元).
20.(2027高三·全国·专题练习)植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期
3
9
11
17
植物高度
2.4
3.4
3.8
5.2
由表中数据可得经验回归方程中,试预测生长期是30天时,植物高度约为________厘米.
【答案】7.7
【分析】先计算和,再代入公式求,得到回归方程后代入预测植物高度.
【详解】解:由题意可得,,
所以,
所以经验回归方程为,
所以预测生长期是30天时,
植物高度约为(厘米).
故答案为:.
21.(2026·湖北随州·模拟预测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.得到数据如下表:
零件个数x
10
20
30
40
50
加工时间y(min)
53
65
71
76
85
根据上表可得经验回归方程中的,则经验回归方程中___________;据此估计,加工的零件个数为60时所花费的时间为__________min.
【答案】 47.5 92.5
【分析】由题中数据可得,,根据经验回归直线必过样本中心点可得,代入运算求解即可.
【详解】由题意可得,,
因为经验回归直线必过样本中心点,且,
则,解得,
即,当时,则,
故估计加工的零件个数为60时,所花费的时间为92.5 min.
22.(2026高三·湖北随州·期末)假设某超市今年上半年每个月的销售额(单位:万元)与广告支出(单位:万元)的经验回归方程为.若该超市计划明年5月份的销售额为10万元,则估计该超市明年5月份的广告支出为________万元.
【答案】2.5/
【分析】在回归方程中令,求得,得解.
【详解】由,得,
则估计该超市明年5月份的广告支出为2.5万元.
故答案为:.
23.(2026高三·全国·一轮复习)假如女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为.已知父亲身高为175 cm,则估计女儿的身高为________cm.
【答案】
【分析】根据经验回归方程概念,直接求出结果;
【详解】由题意得.
故答案为:.
24.(2026高二·新疆乌鲁木齐·期末)某饮料店的日盈利(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
x/℃
0
1
2
y/百元
5
4
2
2
1
由表中数据可得回归方程中.试预测当天平均气温为℃时,饮料店的日盈利约为_________百元.
【答案】
【分析】求出样本中心点,代入得到值,再令即得.
【详解】由已知数据
因为,则,代入,则,
则,
令,则.
故答案为:.
25.(2026·四川德阳·模拟预测)某兴趣小组的同学想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度(℃)的部分数据如下表:
温度(℃)
4
8
10
18
微生物数量(个)
30
22
18
14
由表中数据算得回归方程为,预测当温度为22℃时,微生物数量为______个.
【答案】9
【分析】求出样本点中心,代入回归方程得到,得回归方程,可进行预测.
【详解】由表格数据可知,,,
因为点在直线上,所以,即,
故当时,,即预测当温度为22℃时,微生物数量为9个.
故答案为:9.
(二)
线性回归分析
1.解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
2.刻画回归效果的三种方法
①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.
②残差平方和法:残差平方和 (yi-i)2越小,模型的拟合效果越好.
③决定系数法:R2=1-越接近1,表明回归的效果越好.
3.残差分析及相关指数的应用
(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差1,2,…,n来判断模型拟合的效果.
(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.
题型4:残差分析
26.(2026·湖北孝感·模拟预测)为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
【答案】A
【详解】时的预测值,
时的真实为值,
样本点的残差为.
27.(2026高二·海南省直辖县级单位·期末)已知关于的经验回归方程为,则样本点的残差为( )
A.-2 B.-1 C.1 D.2
【答案】B
【分析】根据给定条件,求出预测值,进而求出残差.
【详解】当时,,所以样本点的残差为.
故选:B
28.(2026高二·河南新乡·月考)若变量与之间存在线性相关关系,且根据最小二乘法得到的经验回归方程为,则样本点的残差为( )
A. B. C. D.2.5
【答案】A
【分析】根据回归直线方程,令,可得,进而求得样本点的残差,得到答案.
【详解】由回归方程为,令,可得,
所以样本点的残差为.
故选:A.
29.(2026·河北石家庄·模拟预测)下列残差图满足一元线性回归模型中对随机误差的假定的是( )
A.
B.
C. D.
【答案】A
【分析】一元线性回归模型中对随机误差的假定是:随机误差是均值为0,且相互独立,方差为常数的正态分布.反映在残差图上,满足假定的残差图的特征是:残差均匀地分布在以横轴(一般为解释变量或观测顺序等)为中心的水平带状区域内,且残差之间没有明显的趋势性或规律性.根据这些特征对每个选项的残差图进行分析判断.
【详解】对于选项A,观察选项A的残差图,可以看到残差均匀地分布在以横轴为中心的水平带状区域内.残差没有明显的上升、下降趋势,也没有呈现出某种曲线形状等规律性.这表明随机误差满足均值为0,相互独立且方差为常数的假定,所以选项A符合一元线性回归模型中对随机误差的假定.
对于选项B,选项B的残差图中,残差呈现出明显的上升趋势.这意味着残差不是相互独立的,且其均值也不是稳定的0,不满足一元线性回归模型中随机误差相互独立且均值为0的假定,所以选项B不符合要求.
对于选项C,选项C的残差图呈现出“U”型曲线的形状.这种形状说明残差具有明显的规律性,不是随机分布的,不满足随机误差相互独立且方差为常数的假定,所以选项C不符合要求.
对于选项D,选项D的残差图虽然看起来大致分布在一定区域内,但仔细观察可以发现,残差在横轴两侧的分布并不是均匀的,在某些区间内残差的波动较大,而在另一些区间内波动较小,这说明方差不是常数,不满足一元线性回归模型中对随机误差方差为常数的假定,所以选项D不符合要求.
故选:A.
30.【多选】(2026高三·四川绵阳·阶段检测)某类汽车在今年1至5月的销量y(单位:千辆)如下表所示(其中2月份销量未知):
月份x
1
2
3
4
5
月销量y
2.4
m
4
5
5.5
若变量y与x之间存在线性相关关系,用最小二乘法估计建立的经验回归方程为,则下列说法正确的是( )
A.
B.残差绝对值最大为0.2
C.样本相关系数
D.当解释变量每增加1,响应变量增加0.85
【答案】AB
【分析】对于A,根据回归直线必过样本中心点可解得;对于B,根据残差的定义计算,即可判断;对于C,根据表格和相关系数的意义,即可判断;对于D,根据相关关系的定义,即可判断.
【详解】由题意知:,又,
代入方程得,所以,解得,故A正确;
1月份的残差为,2月份的残差为,3月份的残差为,4月份的残差为,5月份的残差为,所以残差绝对值最大为,故B正确;
由表格可知变量与呈正线性相关,则,故C不正确;
当解释变量每增加1,响应变量不一定增加0.85,故D不正确,
故选:AB.
31.(2026高二·江苏南京·期中)某学校一同学研究温差与本校当天新增感冒人数(人)的关系,该同学记录了5天的数据:
5
6
8
9
12
17
20
25
28
35
经过拟合,发现基本符合经验回归方程,则下列选项错误的是( )
A.样本中心点为 B.
C.时,残差为 D.相关系数
【答案】B
【分析】由回归直线必过样本中心可判断A项,代入样本中心点即可判断B,由残差公式可判断C项,由线性回归方程的斜率即可相关系数正负可判断D项.
【详解】对于A项,因为,,
所以样本中心点为,故A项正确;
对于B项,由回归直线必过样本中心可得:,解得:,故B项不正确;
对于C项,由B项知,,令,则,
所以残差为,故C项正确;
对于D项,经验回归方程中,斜率,说明与正相关,
故相关系数,故D项正确.
32.(2026高二·重庆·期中)已知变量,线性相关,其一组样本数据 ,满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到修正后的回归直线的斜率为,则数据 相对于修正后的回归直线的残差为( )
A. B. C. D.
【答案】A
【分析】分别求修正前和修正后的样本点中心,再代入回归直线方程求解回归后的直线方程,再代入残差公式.
【详解】.因为,所以,因为经验回归方程过点,
所以,所以增加一个数据后的,,
设修正后的回归直线为,而修正后的回归直线过点,即 ,
所以,
解得,所以修正后的回归直线为 ,
所以数据 相对于修正后的回归直线的残差为 .
33.【多选】(2026高二·浙江舟山·期中)某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下,则下列叙述正确的是( )
1
2
3
4
5
6
7
2
3
5
7
8
8
9
参考公式:.
A.
B.用最小二乘法求得关于的线性回归直线方程为
C.由散点图知变量和正相关,相关系数的绝对值越接近0,表示x,y的线性相关程度越强
D.当时,残差为
【答案】ABD
【详解】对于A,,,故A正确;
对于B,根据公式计算回归系数,
,
所以回归直线方程为,故B正确;
对于C,散点图如下所示,
由图可知,变量x和正相关,但相关系数越接近1,线性相关程度越强,
越接近0,相关程度越弱,故C错误;
对于D当时,预测值,实际值,
残差,故D正确.
34.【多选】(2026·重庆沙坪坝·模拟预测)成对数据和的一元线性回归模型为,依据模型可建立经验回归方程,用回归方程可得到响应变量的预测值及残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果.对下列四幅残差图的描述正确的是( )
A.图甲显示残差的方差随观测时间变大而变大
B.图乙满足一元线性回归模型对随机误差的假设
C.图丙说明残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分
D.图丁说明残差与观测时间有线性相关性,故满足一元线性回归模型对随机误差的假设
【答案】ABC
【分析】根据一元线性回归模型中对随机误差的假定进行判断.
【详解】根据一元线性回归模型中对随机误差的假定,残差应是均值为、方差为的随机变量的观测值.
对于A选项,由图可知残差的方差随观测时间变大而变大,故A正确;
对于B选项,由图可知残差比较均匀地分布在水平带状区域内,满足一元线性回归模型对随机误差的假设,故B正确;
对于C选项,由图知残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分,故C正确;
对于D选项,由图知残差与有线性关系,不符合题意,故D错误.
题型5:相关指数的应用
35.【多选】(2026高三·山东青岛·期末)如果散点图中所有的散点都落在一条斜率为非0的直线上,则( )
A.解释变量和响应变量是线性函数关系 B.解释变量和响应变量是线性相关关系
C.相关系数 D.决定系数
【答案】AD
【分析】根据散点图得这两个变量线性相关,由此逐项判断得解.
【详解】由散点图中所有的散点都落在一条斜率为非0的直线上,
得解释变量和响应变量是线性函数关系,不是线性相关关系,,,BC错误,AD正确.
故选:AD
36.(2026高三·重庆·月考)已知成对样本数据,,…,中,,…,不全相等,且所有样本点都在直线上,则这组成对样本数据的样本相关系数r=______,其决定系数=______.
【答案】 1
【分析】由所有样本点都在一条直线上,结合相关系数的意义,可得出答案.
【详解】由所有样本点都在直线上,
又,
由题易知,.
故答案为:
37.【多选】(2026高二·河北沧州·期中)两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
【答案】AC
【分析】根据相关系数的概念可判定AB,根据决定系数的概念可判定CD.
【详解】对于A:因为r的符号反映相关关系的正负性,故A正确;
对于B:根据相关系数越接近1,变量相关性越强,故B错误;
对于C:决定系数越大,残差平方和越小,效果越好,故C正确,D错误.
故选:AC.
38.(2026·湖南·模拟预测)对两个变量和进行回归分析,得到一组样本数据,下列统计量的数值能够刻画其经验回归方程的拟合效果的是( )
A.平均数 B.相关系数 C.决定系数 D.方差
【答案】C
【分析】根据相关数据的特征可知,决定系数能够刻画其经验回归方程的拟合效果.
【详解】平均数与方差是用来反馈数据集中趋势与波动程度大小的统计量;
变量y和x之间的相关系数的绝对值越大,则变量y和x之间线性相关关系越强;
用决定系数来刻画回归效果,越大说明拟合效果越好.
故选:C
39.(2026·全国·模拟预测)某试验小组收集了部分父亲和儿子的身高数据,通过测量与回归方程计算得到如下五组儿子身高的观测值与估计值,则该组统计数据的决定系数______.
儿子身高观测值/
161.3
167.7
170.0
173.5
177.5
儿子身高估计值/
161.3
167.7
170.0
173.5
177.5
【答案】1
【分析】根据决定系数的意义及表格中的数据即可求解.
【详解】因为决定系数,其值越接近1,说明模型拟合效果越好,误差越小,从表中数据可知没有误差,所以.
40.【多选】(2026高二·广东东莞·期末)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第-组成对数据的样本相关系数、残差平方和、决定系数分别为,,,第二组成对数据的样本相关系数、残差平方和、决定系数分别为,,,则( )
A.若,则第一组成对数据的线性相关关系比第二组的强
B.若,则第一组成对数据的线性相关关系比第二组的强
C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
【答案】BC
【分析】根据题意 ,由相关系数、残差平方和、决定系数的意义,依次分析选项,即可求解.
【详解】根据题意,依次分析选项:
对于A中,由,则第一组成对数据的线性相关关系比第二组的强,所以A错误;
对于B中,若,可得,则第一组成对数据的线性相关关系比第二组的强,所以B正确;
对于C中,若,则第二组成对数据的经验回归模型拟合效果比第一组的好,所以C正确;
对于D中,若,则第一组成对数据的经验回归模型拟合效果比第二组的好,
所以D错误.
故选:BC.
41.(2026·广东广州·模拟预测)某公司为了了解A商品销售收入(单位:万元)与广告支出(单位:万元)之间的关系,现收集的5组样本数据如下表所示,且经验回归方程为.
2
5
6
8
9
16
20
21
28
10.96
19.24
22
27.52
30.28
(1)求的值;
(2)现从这5组数据的残差中抽取2组进行分析(观测值减去预测值称为残差),记X表示抽到数据的残差为负的组数,求X的分布列和期望;
(3)已知,且当时,回归方程的拟合效果良好,试结合数据,判断经验回归方程的拟合效果是否良好.
【答案】(1)
(2)分布列见解析,
(3)经验回归方程的拟合效果不良好
【分析】(1)求出根据回归直线必过样本中心点求解即可;
(2)可能取值为,求出对应概率,进而得到分布列和期望;
(3)求出代入公式,即可得到答案.
【详解】(1),
,
因为,即,
解得.
(2)5组数据中,两组数据残差为正值,三组数据残差为负值,
所以可能取值为,
,
,
,
所以X的分布列为
0
1
2
期望.
(3),
,
所以经验回归方程的拟合效果是不良好.
42.(2026高三·湖南长沙·阶段检测)海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的经验回归方程为.
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
(1)请你估计:当浇灌海水浓度为8‰时,该品种海水稻的亩产量;
(2)(i)完成上述残差表;
(ii)在统计学中,常用决定系数来刻画回归效果,越大,模型拟合效果越好,并用它来说明响应变量与解释变量的相关性.你能否利用以上表格中的数据,计算决定系数,并判断模型的拟合效果.(计算中数据精确到0.01)
(附:残差,决定系数)
【答案】(1)吨.
(2)残差表见解析;,拟合效果较好.
【分析】(1)先求出平均数,代入经验回归方程即可求出b,从而求解.
(2)(i)根据经验回归方程求解,从而可得;
(ii)根据公式求出决定系数,进而判断.
【详解】(1)根据题中数据可知,,
将样本中心点的坐标代入经验回归方程得
,解得,
所以经验回归方程为.
当时,,
即当浇灌海水浓度为8‰时,该品种海水稻的亩产量为吨.
(2)(i)由经验回归方程可得
,;
,;
,;
,;
,.
所以残差表如下:
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
(ii)由上数据可知,
,
所以决定系数,与1比较接近,
所以拟合效果较好.
43.(2026高二·全国·课后作业)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
【答案】(1),;
(2),拟合程度更好.
【分析】(1)根据经验回归方程过样本中心点,先由经验回归方程和的平均数,求出的平均数,再根据平均数的定义求出;然后根据残差定义计算8月份的残差.
(2)先求出残差平方和,再代入公式计算,最后与非线性回归模型的比较大小,即可判断.
【详解】(1)因为,,,
则,解得;
8月份对应的残差值.
(2)因为,
所以,
所以,
所以线性回归模型拟合程度更好.
(三)
非线性回归分析
求非线性回归方程的步骤
(1)确定变量,作出散点图.
(2)根据散点图,选择恰当的拟合函数.
(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.
(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.
(5)根据相应的变换,写出非线性回归方程.
题型6:非线性回归分析
44.(2026高三·福建厦门·月考)某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
【答案】D
【分析】根据散点图的变化规律,寻求合适的特征函数.
【详解】由图可知,随着温度的增加,发芽率的增长速度越来越慢,符合对数型函数的特征.
故选:D.
45.(2026高二·全国·专题练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
【答案】B
【分析】先根据散点图确定函数图象的趋势,再结合5个函数图象,进行判断选择.
【详解】从散点图知,样本点分布在抛物线上或对数型曲线上,结合所给5个的曲线类型,所以或较适宜.
故选:B
46.(2026高二·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
【答案】(1)
(2)644.6;258.3
【分析】(1)根据散点图分析得出回归方程类型,结合非线性回归模型转化线性回归方程分析求解即可;
(2)根据(1)中的方程代入相关变量计算分析即可.
【详解】(1)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型,
令,先建立关于的线性回归方程,
由于 ,
则,
所以关于的线性回归方程为,
因此关于的回归方程为.
(2)当时,年销售量的预报值,
年利润的预报值.
47.(2026·辽宁沈阳·模拟预测)某农业技术站研究化肥施用量对大棚青菜产量的影响.在一定范围内,施肥量(单位kg/亩)越大,青菜产量(单位kg/亩)越高.实验测得具体数据如下表:
施肥量
2
3
4
5
6
青菜产量
4200
4300
4350
4380
4400
根据散点数据特征,研究人员分析得出产量与施肥量近似满足的关系,取,经计算可知,,,,
(1)请根据上述数据,计算得出产量y关于施肥量x的回归方程,并结合常识描述的实际意义,为简化计算,计算过程中、均精确到个位数.
(2)若青菜的收购价格为2元/kg,化肥的采购价格为12元/kg,请从利润最大的角度给出大棚的最优施肥量.
参考公式:,.
【答案】(1),实际意义是当化肥使用量无限增加时,青菜产量的理论上限为/亩
(2)当施肥量为10kg/亩时利润最大
【分析】(1)根据题意,利用回归系数的公式,求得,进而得出回归直线方程,结合的值,得出的实际意义;
(2)由利润为,结合基本不等式,即可求解.
【详解】(1)根据题意,可得,
又由,
所以产量y关于施肥量x的回归方程为,
其中的实际意义是当化肥使用量无限增加时,青菜产量的理论上限为/亩.
(2)设利润为元/亩,
当且仅当kg/亩时取等,即当施肥量为10kg/亩时利润最大.
48.(2026高二·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
【答案】(1)②合适
(2)
【分析】(1)利用函数①②③的性质及表中的数据,即可求解;
(2)先将非线性回归方程转化成线性回归方程,再根据题设条件,利用最小二乘法,即可求解.
【详解】(1)由表格可知,增大时,值整体呈上升趋势但存在局部波动,比较函数①②③,
选择②()作为学习时间x和平均成绩y的回归类型最合适.
(2)对()两边取以为底的对数可得,
设,则,
,
,所以,
故,即,所以.
49.(2026高二·山东·阶段检测)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
【答案】(1)模型建立y与x的回归方程更合适;
(2);
(3)960万元.
【分析】(1)利用非线性转化为线性,再求相关系数即可得到判断;
(2)利用非线性转化为线性,再求线性回归方程系数即可得解;
(3)利用基本不等式求最大值即可.
【详解】(1)由题意知,,
因为,所以用模型建立y与x的回归方程更合适.
(2)令,回归方程为,因为,,
所以关于x的回归方程为,即.
(3)由题意知,
当且仅当,即时取等号,
则,所以.
所以当研发经费投入为60万元时企业生产的利润最大,最大利润为960万元.
50.(2026高三·湖南衡阳·专题练习)脑机接口,即指在人或动物大脑与外部设备之间创建的直接连接,实现脑与设备的信息交换.近日埃隆.马斯克宣布,脑机接口公司正在接收第二位植入者申请,该试验可以实现意念控制手机和电脑.未来10到20年,我国脑机接口产业将产生数百亿元的经济价值.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量y(单位:亿元)与研发人员增量x(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中,.
7.5
2.25
82.50
4.50
12.14
2.88
(1)根据残差图,判断应选择哪个模型,并说明理由.
(2)根据(1)中所选模型,求出y关于x的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1)
附:对于一组具有线性相关关系的数据,,…,,其经验回归直线的斜率及截距的最小二乘估计分别为,.
【答案】(1)选择模型②,理由见解析
(2),10人
【分析】(1)通过观察两个模型残差的波动幅度和集中程度来选择模型;
(2)结合所选模型,令,则可转化为线性回归模型,利用最小二乘法公式计算和;再将代回,得到关于的经验回归方程,进而求解的最小值.
【详解】(1)选择模型②,理由如下:
由于模型②残差点比较均匀在落在水平的带状区域中,且带状区域的宽度比模型①带状宽度窄,所以模型②的拟合精度更高,回归方程的预报精度相应就会越高,故模型②比较合适.
(2)根据模型②,令,y与t可用线性回归来拟合,有.
则,
所以,
则y关于t的经验回归方程为,
所以y关于x的经验回归方程为.
由题意,,解得,又x为整数,所以.
所以,要使年收益增量超过8亿元,研发人员增量至少为10人.
1.(2026高二·全国·课后作业)甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数分别如下表:
甲
乙
丙
丁
0.98
0.78
0.50
0.85
故( )同学建立的回归模型拟合效果最好.
A.甲 B.乙 C.丙 D.丁
【答案】A
【分析】越接近于1的回归模型拟合效果最好.
【详解】决定系数越接近于1,表示回归模型的拟合效果越好.
由,可知甲同学建立的回归模型拟合效果最好.
故选:A.
2.(2026·湖南)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是
A. B.
C. D.
【答案】A
【详解】试题分析:因为商品销售量与销售价格负相关,所以排除B,D选项,
将代入可得,不符合实际.故A正确.
考点:线性回归方程.
【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程当时负相关;当时正相关.
3.(2026·全国)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B.
C. D.
【答案】D
【分析】根据散点图的分布可选择合适的函数模型.
【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率和温度的回归方程类型的是.
故选:D.
【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.
4.(2026高二·河南濮阳·期末)某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第天的高度为,测得一些数据如下表所示
第天
1
2
3
4
5
6
7
高度
1
4
6
9
11
12
13
由表格数据可得到关于的经验回归方程为,则第6天的残差为( )
A. B.2.12 C. D.0.08
【答案】A
【分析】根据样本中心得回归直线方程,由残差的计算即可求解.
【详解】
根据线性经验回归方程过样本中心,故有,则有,
此时,当时,,残差,
故选:A.
5.(2026高二·全国·课堂例题)下表是某旅游区游客数量与平均气温的对比表:
平均气温/℃
-1
4
10
13
18
26
数量/万个
0.2
0.24
0.34
0.38
0.5
0.64
若已知游客数量与平均气温是线性相关的,求经验回归方程.
【答案】
【分析】利用公式求出,,得到经验回归方程
【详解】,
,
,
.
,,
即所求的经验回归方程为.
6.(2026·江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为
A.y = x-1 B.y = x+1 C.y =88+ D.y = 176
【答案】C
【详解】试题分析:由已知可得中心点为,
代入回归方程验证可知,只有方程y =88+成立,故选C
7.(2026高一·全国·课后作业)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:
转速/(转/秒)
16
14
12
8
每小时生产有缺点的零件数/件
11
9
8
5
(1)画出散点图;
(2)如果对有线性相关关系,请画出一条直线近似地表示这种线性关系;
(3)在实际生产中,若它们的近似方程为,允许每小时生产的产品中有缺点的零件最多为件,那么机器的运转速度应控制在什么范围内?
【答案】(1)散点图见解析
(2)近似图见解析
(3)转/秒内
【分析】(1)根据题意画出散点图;
(2)根据散点图画出近似直线;
(3)结合题意得到,从而得解.
【详解】(1)散点图如图所示:
(2)近似直线如图所示:
(3)由得,解得,
所以机器的运转速度应控制在转/秒内.
8.(2026高二·全国·课堂例题)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速(转/秒)
16
14
12
8
每小时生产有缺点的零件数(件)
11
9
8
5
在实际生产中,若关于的经验回归方程为,若每增加一个单位的转速,生产有缺点的零件数平均增加多少?
【答案】个.
【分析】由,当时,即可求解.
【详解】因为,所以当增加一个单位时,大约增加,即每增加一个单位的转速,生产有缺点的零件数平均增加个.
9.(2026高二·全国·课堂例题)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速(转/秒)
16
14
12
8
每小时生产有缺点的零件数(件)
11
9
8
5
在实际生产中,若关于的经验回归方程为,每小时生产有缺点的零件件数是7,估计机器的转速.
【答案】11转/秒.
【分析】由回归方程,代入数据即可求解;
【详解】因为,
所以当时,,解得,
即估计机器的转速约为11转/秒.
10.(2026高二·山东烟台·期中)第十四届湿地公约缔约方大会2022年11月5日至13日在湖北武汉举办,承办此次大会,有助于进一步展示中国促进经济社会与环境协调发展的负责任大国形象,是强化“一带一路”国家生态交流与合作、增强中国在广大发展中国家凝聚力的重要契机.国内某企业以此为契机,研发了一款环保产品,为保证成本,每件产品售价不低于43元,经调研,产品售价x(单位:元/件)与月销售量y(单位:万件)等情况如下表所示:
售价x(元/件)
52
50
48
45
44
43
月销售量y(万件)
5
6
7
8
10
12
(1)求相关系数r(结果保留两位小数),并说明是否可以用线性回归模型拟合y与x的关系,(当,时,可以认为两个变量有很强的线性相关性;否则,没有很强的线性相关性.)(参考数据:)
(2)建立y关于x的经验回归方程,并估计当售价为46元/件时,该产品的月销售量约为多少?
参考公式:对于一组数据,相关系数,其回归直线的斜率和截距的最小二乘估计分别为:,.
【答案】(1),可以用线性回归模型拟合y与x的关系
(2);86875件
【分析】(1)由表中数据计算相关系数,从而作出判断;
(2)由最小二乘法得出y关于x的经验回归方程,进而估计当售价为46元/件时,该产品的月销售量.
【详解】(1),
,
,
,
则相关系数.
因为,所以可以用线性回归模型拟合y与x的关系.
(2)设y关于x的经验回归方程为.
,.
则y关于x的经验回归方程为,
当时,(万件).
故当售价为46元/件时,该产品的月销售量约为86875件.
11.(2026高二·全国·课后作业)在一次抽样调查中测得样本的5个样本点,数值如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
【答案】
【分析】根据所给数据作出散点图,选取反比例函数,换元后转化为直线回归方程求解即可.
【详解】作出变量y与x之间的散点图如图D-4-5所示.
由图可知变量y与x近似地呈反比例函数关系.
设,令,则.由y与x的数据表可得y与t的数据表:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
作出y与t的散点图如图D-4-6所示.
由图可知y与t呈近似的线性相关关系.
又,,,,
,,
,
即y与x之间的回归方程为.
12.(2026高二·全国·单元测试)电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
t(s)
0
1
2
3
4
5
6
7
8
9
10
U(V)
100
75
55
40
30
20
15
10
10
5
5
试求:电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)
【答案】.
【分析】对表达式,两边同时取对数,令y=ln U,a=ln A,x=t把非线性方程转化为线性方程.根据题目的数据求解y,x的值,利用线性回归方程中的的计算公式,得出线性回归方程,再还原为非线性回归方程.
【详解】对U=Aebt两边取对数得ln U=ln A+bt,令y=ln U,a=ln A,x=t,
则y=a+bx,得y与x的数据如下表:
x
0
1
2
3
4
5
6
7
8
9
10
y
4.6
4.3
4.0
3.7
3.4
3.0
2.7
2.3
2.3
1.6
1.6
根据表中数据作出散点图,如图所示,
从图中可以看出,y与x具有较强的线性相关关系,
由表中数据求得=5,≈3.045,进而可以求得≈-0.313,=-=4.61.
所以y对x的线性回归方程为y=4.61-0.313x.
由y=ln U,得U=ey,U=e4.61-0.313x=e4.16·e-0.313x.
因此电压U对时间t的回归方程为.
13.(2026高二·全国·课堂例题)假定小麦基本苗数与成熟期有效穗之间存在相关关系,今测得5组数据如下:
15.0
25.8
30.0
36.6
44.4
39.4
42.9
42.9
43.1
49.2
(1)以为解释变量,为预报变量,作出散点图;
(2)求关于的经验回归方程,对于基本苗数56.7预报成熟期有效穗;
(3)计算各组残差,并计算残差平方和;
(4)求,并说明(2)中求出的回归模型的拟合程度.
【答案】(1)答案见解析
(2)
(3),残差平方和:8.43.
(4)0.832,(2)中求出的回归模型的拟合效果较好.
【分析】(1)根据题意作出散点图即可;
(2)根据题意计算,即可得,即得回归方程,当时,即可预报成熟期有效穗;
(3)由,可以算得,即可计算残差平方和;
(4)计算出决定系数即可得解.
【详解】(1)散点图如下.
(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用经验回归方程刻画它们之间的关系.
该回归方程为,又,
.
则.
故所求的经验回归方程为.
当时,.故估计成熟期有效穗为51.143.
(3)由,可以算得,分别为
,残差平方和:.
(4),故.
所以(2)中求出的回归模型的拟合效果较好.
14.(2026高二·全国·课堂例题)耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究浇灌海水浓度(单位:‰)对亩产量(单位:吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与浇灌海水浓度的有关数据如下表.绘制散点图发现,可用线性回归模型拟合亩产量与浇灌海水浓度之间的相关关系,用最小二乘法计算得与之间的经验回归方程为.
浇灌海水浓度
3
4
5
6
7
亩产量吨
0.62
0.58
0.49
0.4
0.31
残差
(1)求,并估计当浇灌海水浓度为8‰时该品种的亩产量;
(2)①将上表补充完整;
②统计学中常用决定系数来刻画回归效果,越大,模型拟合效果越好,如假设,就说明响应变量的差异有是由解释变量引起的.请计算决定系数(精确到0.01),并指出亩产量的变化多大程度上是由浇灌海水浓度引起的?
【答案】(1),0.24吨.
(2)①答案见解析;②0.98,亩产量的变化有是由浇灌海水浓度引起的
【分析】(1)计算,代入得,当时,代入计算即可求解;
(2)①根据残差计算即可;②根据公式可求相关指数,从而可得亩产量的变化多大程度上是由浇灌海水浓度引起的.
【详解】(1)经计算,得,由可得,,则当时,,所以估计当浇灌海水浓度为8‰时,该品种的亩产量为0.24吨.
(2)①由(1)知,从而有
浇灌海水浓度/‰
3
4
5
6
7
亩产量吨
0.62
0.58
0.49
0.4
0.31
残差
-0.02
0.02
0.01
0
-0.01
②,所以亩产量的变化有是由浇灌海水浓度引起的.
15.(9-10高二·河南南阳·期中)设有一个回归方程为,则变量增加一个单位时( )
A.平均增加1.5个单位 B.平均增加2个单位
C.平均减少1.5个单位 D.平均减少2个单位
【答案】C
【分析】根据所给的回归直线的方程把自变量由变为时,表示出变化后的值,两式相减即可求解.
【详解】因为直线回归方程为:①,
当变量增加一个单位时②,
由②①可得:,
所以变量增加一个单位时平均减少1.5个单位,
故选:C.
16.(2026高二·广东深圳·期中)对具有线性相关关系的变量、有一组观测数据,其线性回归方程是,且,,则实数的值是( )
A. B. C. D.
【答案】C
【分析】求出样本的中心点的坐标,再将点的坐标代入回归直线方程,由此可求得实数的值.
【详解】由题意可得,,
回归直线过点,则,解得.
故选:C.
【点睛】本题考查利用回归直线过样本中心点求参数,考查计算能力,属于基础题.
17.(2026高二·浙江杭州·期末),两个学科兴趣小组在实验室研究某粒子的运动轨迹,共同记录到粒子的一组坐标信息.小组根据表中数据,直接对作线性回归分析,得到:回归方程,决定系数.小组先将数据按照变换,进行整理,再对,作线性回归分析,得到:回归方程,决定系数.根据统计学知识,下列方程中,最有可能是该粒子运动轨迹方程的是( )
A. B.
C. D.
【答案】C
【分析】由统计学知识可知,越大,拟合效果越好,由此可得回归方程,整理得结论.
【详解】由统计学知识可知,越大,拟合效果越好,
又小组的决定系数,小组的决定系数,
小组的拟合效果好,则回归方程为,
又,即.
故选:C.
18.(2026高三·全国·专题练习)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则________同学的试验结果体现A,B两变量有更强的线性相关性.
【答案】丁
【解析】根据数据直接判断即可.
【详解】解:越大,越小,线性相关性越强,易知丁同学的试验结果体现A,B两变量的线性相关性较强.
故答案为:丁.
19.(2026高三·全国·专题练习)下表给出的是某城市2017年至2020年,人均存款x(万元)与人均消费y(万元)的几组对照数据.
年份
2017
2018
2019
2020
人均存款x(万元)
0.6
0.7
0.8
0.9
人均消费y(万元)
0.35
0.45
0.45
0.55
(1)试建立y关于x的线性回归方程;如果该城市2021年的人均存款为1.1万元,请根据线性回归方程预测2021年该城市的人均消费;
附:回归方程中斜率和截距的最小二乘估计公式分别为:,.
(2)计算,并说明线性回归方程的拟合效果.
【答案】(1),万元
(2),具有较好的拟合效果
【分析】(1)根据题意,求得,以及,,利用公式,求得,得到的值,求得回归直线方程,令时,求得,即可得到预测值;
(2)由(1)求得,,,,进而求得,进而得到结论.
【详解】(1)解:由表格中的数据,可得,
,
,
,
所以,则,
所以所求回归直线方程为,
当时,,预计该城市2021年的人均消费为万元.
(2)解:由回归方程计算得,,,,
所以,
,
所以,
说明人均存款解释了90%的人均消费的变化,即回归方程具有较好的拟合效果.
20.(2026高三·安徽淮北·月考)为研究某种图书每册的成本费元与印刷数册的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断:与哪一个更适宜作为每册成本费元与印刷数册的回归方程类型?只要求给出判断,不必说明理由
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)若每册书定价为元,则至少应该印刷多少册才能使销售利润不低于元?假设能够全部售出
(附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,)
【答案】(1)
(2).
(3)册
【分析】(1)因为散点图呈现的是非线性趋势,所以选择更合适;
(2)令,将转化为线性回归方程,利用最小二乘估计公式计算和,进而得到关于的回归方程;
(3)根据利润公式,结合回归方程列出不等式,求解不等式得到印刷数的取值范围,确定至少印刷的册数.
【详解】(1)由散点图的分布是非线性的,故适宜作为每册成本费与印刷册数的回归方程;
(2)令,先建立关于的线性回归方程,
由于,
,
关于的线性回归方程为,
从而关于的回归方程为;
(3)假设印刷册,依题意,,
,
至少印刷册.
21.(2026高三·河南新乡·月考)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为x分钟)和他们的数学平均成绩(设为y)做出了以下数据统计,请根据表格回答问题:
x
60
70
80
90
100
110
120
130
y
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间x和平均成绩y的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出y与x的回归方程(系数精确到0.01).
(3)请根据此回归方程,阐述你对花在课后的学习时间和成绩之间关系的看法.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
【答案】(1)②合适
(2);
(3)答案见解析
【分析】(1)根据题意,经比较可得最合适的函数模型;
(2)由(1)中模型可得,设,,则,利用公式可求后者,从而得到前者;
(3)根据回归方程可得相应的看法.
【详解】(1)根据题意,经比较可知,选择②()作为学习时间x和平均成绩y的回归类型最合适;
(2)对()两边取以e为底的对数可得,
设,则,
,所以,
故,即,
所以;
(3)此回归方程为关于学习时间的增函数,说明随着课后的学习时间的增加,学习成绩是提高的,但是函数的增速先快后慢,说明如果原来成绩较低,通过增加课后的学习时间可以有效提高成绩,但是当成绩提高到120分左右时,想要通过延长课后的学习时间来提高学习成绩就比较困难了,需要想别的办法.
22.(2026高三·全国·专题练习)水体富营养化导致藻类大量繁殖,以2017年中国太湖蓝藻爆发为例:5月初监测发现湖体中蓝藻细胞密度为每升50万个,随着气温升高至25-30℃且氮磷营养盐浓度超标(总磷浓度达),蓝藻进入增长期.5月10日细胞密度增至每升200万个,5月15日突破每升800万个,5月20日达到每升3200万个,形成面积超150平方公里的绿色水华带.此次爆发导致湖区溶解氧骤降至以下,大量鱼类死亡,自来水厂被迫停产,所以对水资源的保护刻不容缓.现对某区域的藻类面积y(单位:平方公里)与时间x(单位:年)的关系,进行监测,得到如下数据:
x/年
1
2
3
4
5
6
7
y/平方公里
6
11
21
34
66
101
196
根据以上数据,绘制成如图所示的散点图:
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断与(a,b,c,d均为常数)哪一个更适合作为藻类面积y(单位:平方公里)与时间x(单位:年)的关系的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中的数据,求出y关于x的回归方程.
参考数据:
62.14
1.54
2535
50.12
3.47
其中,
参考公式:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)更适合;
(2).
【分析】(1)由散点图的递增趋势选择更适宜的模型;
(2)先根据所取模型进行线性变换,再代入公式求解回归模型.
【详解】(1)由散点图得,藻类面积随时间的增加其增长速度越来越快,
所以更适宜作为藻类面积y与时间x的关系的回归方程类型.
(2)由,两边同时取常用对数得,
设,,,则,
由,,
得,
则,
因此,即
,
所以y关于x的回归方程为.
23.(2026高三·广东深圳·阶段检测)某市近6年的新能源汽车保有量数据如下表
年份代号x
1
2
3
4
5
6
保有量y(万辆)
1
1.8
2.7
4
5.9
9.2
(1)从这6年中任意选取2年,在已知至少有1年的新能源汽车保有量大于3万辆的前提下,求这2年的新能源汽车保有量全都大于3万辆的概率;
(2)用函数模型对变量x,y的关系进行拟合,根据表中数据求出y关于x的回归方程(参数d的估计值精确到0.01).
参考数据:,,,;
设,,
参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:,
【答案】(1)
(2)
【分析】(1)先确定保有量大于3万辆的年份数量,用对立事件求至少1年大于3万辆的概率,再结合2年都大于3万辆的概率,通过条件概率公式计算结果;
(2)将非线性回归模型取对数转化为线性回归模型,利用给定数据计算斜率和截距,再还原得到原模型的参数.
【详解】(1)保有量大于3万辆的年份有第4,5,6年,共3年,
保有量不大于3万辆的年份有第1,2,3年,共3年,
设至少有1年保有量大于3万辆为事件,2年保有量全都大于3万辆为事件,
事件的对立事件为2年都不大于3万辆,总选法有,
两年都不大于3万辆的选法为,所以,
两年都大于3万辆的选法为,所以,
则.
(2)已知模型,两边取对数得,
令,则,即转化为线性回归方程,
其中,由题意得,
则,
,
因为,所以,
则.
学科网(北京)股份有限公司1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$2025-2026学年高二数学同步知识·题型解题秘籍精讲精练讲义(人教A版2019选择性必修第三册)
8.2一元线性回归模型及其应用6题型分类
一、一元线性回归模型
我们称为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
二、线性回归方程
1.我们将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
2.回归直线方程过样本点的中心(,),是回归直线方程最常用的一个特征.
三、最小二乘法
这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(least squares estimate ),其中.
四、残差的概念
1.对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
2.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
五、刻画回归效果的方式
1.残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
2.残差平方和法:残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
3.利用R2刻画回归效果:决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
(一)
求回归直线方程
1.回归直线方程:
我们将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.其中.
2.求线性回归方程的一般步骤:
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格xi,yi,x,xiyi.
(4)计算,,x,xiyi.
(5)代入公式计算,,公式为
(6)写出线性回归方程=x+.
题型1:求回归直线方程
1.(2026高三·广西桂林·开学考试)春节将至,某商家统计了去年某商品的日营销费用x(单位:百元)与日销售量y(单位:百件),为今年的营销方案制定提供相关的数据参考,得到的数据如下表:
日营销费用x/百元
2
3
4
5
6
日销售量y/百件
1
1.1
1.5
1.8
2.1
已知y与x线性相关.
(1)根据上表数据,求y关于x的经验回归方程;
(2)请利用(1)中的经验回归方程,试估计当今的日销售费用为1000元时,日销售量为多少百件.
参考公式:对于一组具有线性相关关系的数据().其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
2.(2026高二·全国·课后作业)某班10名学生的摸底考试成绩和期末考试成绩如下:
摸底成绩
50
35
40
55
80
60
65
35
90
50
期末成绩
53
51
56
68
87
71
46
31
79
68
计算得:,.
(1)画出散点图;
(2)建立一个回归直线方程,用摸底考试成绩来预测期末考试成绩(精确到0.1).
附:,.
3.(2026高三·上海·课堂例题)测得10对父子身高[单位:英寸(1英寸)如下:
父亲身高()
60
62
64
65
66
67
68
70
72
74
儿子身高()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量与进行相关性检验;
(2)如果与之间具有相关关系,求回归直线方程;
(3)如果父亲身高为73英寸,试估计儿子的身高.
参考数据:,,,,,,.
4.(2026高三·上海·单元测试)当前,冷冻冷藏类技术发展迅速且应用广泛.某制冷技术重点实验室研究了不同果蔬在不同冻结速率下的冰点温度,以及低温环境对果蔬热物性的影响.设冻结速率为x(单位:分钟),冰点温度为y(单位:℃),如表为某种水果冰点温度随冻结速率变化的统计数据:
x
10
20
30
40
50
y
-5
-4.5
-2
1
2
根据以上数据,绘制了散点图:
(1)由散点图可以看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;
(2)求y关于x的线性回归方程,并预测当冻结速率为60分钟时,这种水果的冰点温度.
5.(2026高二·辽宁朝阳·期中)某高中,高二数学备课组对学生记忆力和判断力进行统计分析,所得数据如下表所示:
4
6
8
10
12
2
3
5
6
8
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:.
6.(2026·陕西西安·模拟预测)随着新能源产业的发展,我市近年来新能源汽车保有量快速增长,为了研究我市充电桩建设的情况,能源部门收集到了2021年到2025年充电桩数量(单位:万个),为方便研究,年份代码用表示(用分别表示2021年,2022年,…,2025年),具体参考数据如下表:
统计量
数值
15
21
55
72.6
(1)请根据表中数据,建立关于的回归直线方程;
(2)现对该市某区域现有的9个充电桩进行检查,其中4个为快充桩,随机抽取3个充电桩进行检查,记抽到的快充桩个数为,求的分布列及均值.
(参考公式:)
7.(2026·陕西榆林·模拟预测)下表为品牌新能源汽车2025年月在地区的销售量(单位:百辆):
月份
1
2
3
4
5
6
销售量
5.1
6.6
7.0
7.6
9.8
若关于的经验回归方程为,且相关系数.
(1)求的值(精确到0.01);
(2)求的值(精确到0.1).
附:,相关系数.
参考数据:,.
8.(2026高二·河南周口·阶段检测)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价x(元)与网上月销量y(万件)的数据如下:
x
10
12
14
16
18
y
8
7
6
5
4
(1)求相关系数r,并说明其意义;
(2)建立y关于x的线性回归方程;
(3)若月销量不低于5万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
题型2:样本中心的应用
9.(2026高二·河南南阳·阶段检测)已知具有相关关系的变量,它们之间的一组数据如表所示,若关于的回归方程为,则( )
A. B. C. D.
10.(2026·辽宁抚顺·模拟预测)若根据样本数据得到的回归直线方程为,且,,则______.
11.(2026高二·江西宜春·期末)根据下表数据得到y关于x的线性回归方程,则=______.
x
4
6
7
8
10
y
2
3
4
5
6
12.(2026高二·全国·单元测试)已知变量与线性相关,由样本点求得的线性回归方程为,若点在回归直线上,且,则______.
13.(2026高二·天津·期末)已知一种服装的销售量y(单位:百件)与第x周的一组相关数据统计如表所示,若两变量x,y的经验回归方程为,则a=______.
x
1
2
3
4
5
y
7.5
6
3.3
a
1
14.(2026高二·河北邢台·期末)用最小二乘法得到的一组数据的经验回归方程为.若,则( )
A.63 B.21 C.28 D.49
15.(2026高二·福建厦门·期末)已知变量的4组相关数据分别为,则关于的线性回归直线必经过点( )
A. B. C. D.
16.(2026高二·广东茂名·期末)已知x与y之间的一组数据:
x
1
2
3
4
y
5.5
4
3.5
3
若y与x满足回归方程,则( )
A. B. C. D.
17.(2026高二·湖北·期末)已知一组样本数据的线性回归方程为,若的取值范围依次为2,4,6,8,10,则的值为( )
A.15 B.20 C.25 D.30
题型3:根据回归直线方程估计数据
18.(2026·陕西商洛·模拟预测)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下对应数据:
4
6
7
8
根据上表可得经验回归方程,据此估计,当投入万元广告费时,销售额为( )
A.万元 B.万元 C.万元 D.万元
19.(2026高二·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
20.(2027高三·全国·专题练习)植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期
3
9
11
17
植物高度
2.4
3.4
3.8
5.2
由表中数据可得经验回归方程中,试预测生长期是30天时,植物高度约为________厘米.
21.(2026·湖北随州·模拟预测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.得到数据如下表:
零件个数x
10
20
30
40
50
加工时间y(min)
53
65
71
76
85
根据上表可得经验回归方程中的,则经验回归方程中___________;据此估计,加工的零件个数为60时所花费的时间为__________min.
22.(2026高三·湖北随州·期末)假设某超市今年上半年每个月的销售额(单位:万元)与广告支出(单位:万元)的经验回归方程为.若该超市计划明年5月份的销售额为10万元,则估计该超市明年5月份的广告支出为________万元.
23.(2026高三·全国·一轮复习)假如女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为.已知父亲身高为175 cm,则估计女儿的身高为________cm.
24.(2026高二·新疆乌鲁木齐·期末)某饮料店的日盈利(单位:百元)与当天平均气温(单位:℃)之间有如下数据:
x/℃
0
1
2
y/百元
5
4
2
2
1
由表中数据可得回归方程中.试预测当天平均气温为℃时,饮料店的日盈利约为_________百元.
25.(2026·四川德阳·模拟预测)某兴趣小组的同学想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度(℃)的部分数据如下表:
温度(℃)
4
8
10
18
微生物数量(个)
30
22
18
14
由表中数据算得回归方程为,预测当温度为22℃时,微生物数量为______个.
(二)
线性回归分析
1.解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
2.刻画回归效果的三种方法
①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.
②残差平方和法:残差平方和 (yi-i)2越小,模型的拟合效果越好.
③决定系数法:R2=1-越接近1,表明回归的效果越好.
3.残差分析及相关指数的应用
(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差1,2,…,n来判断模型拟合的效果.
(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.
题型4:残差分析
26.(2026·湖北孝感·模拟预测)为了研究物理成绩与数学成绩之间的关系,随机抽取名学生的成绩,用最小二乘法得到关于的线性回归方程为,则样本点的残差为( )
A. B. C. D.
27.(2026高二·海南省直辖县级单位·期末)已知关于的经验回归方程为,则样本点的残差为( )
A.-2 B.-1 C.1 D.2
28.(2026高二·河南新乡·月考)若变量与之间存在线性相关关系,且根据最小二乘法得到的经验回归方程为,则样本点的残差为( )
A. B. C. D.2.5
29.(2026·河北石家庄·模拟预测)下列残差图满足一元线性回归模型中对随机误差的假定的是( )
A.
B.
C. D.
30.【多选】(2026高三·四川绵阳·阶段检测)某类汽车在今年1至5月的销量y(单位:千辆)如下表所示(其中2月份销量未知):
月份x
1
2
3
4
5
月销量y
2.4
m
4
5
5.5
若变量y与x之间存在线性相关关系,用最小二乘法估计建立的经验回归方程为,则下列说法正确的是( )
A.
B.残差绝对值最大为0.2
C.样本相关系数
D.当解释变量每增加1,响应变量增加0.85
31.(2026高二·江苏南京·期中)某学校一同学研究温差与本校当天新增感冒人数(人)的关系,该同学记录了5天的数据:
5
6
8
9
12
17
20
25
28
35
经过拟合,发现基本符合经验回归方程,则下列选项错误的是( )
A.样本中心点为 B.
C.时,残差为 D.相关系数
32.(2026高二·重庆·期中)已知变量,线性相关,其一组样本数据 ,满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到修正后的回归直线的斜率为,则数据 相对于修正后的回归直线的残差为( )
A. B. C. D.
33.【多选】(2026高二·浙江舟山·期中)某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下,则下列叙述正确的是( )
1
2
3
4
5
6
7
2
3
5
7
8
8
9
参考公式:.
A.
B.用最小二乘法求得关于的线性回归直线方程为
C.由散点图知变量和正相关,相关系数的绝对值越接近0,表示x,y的线性相关程度越强
D.当时,残差为
34.【多选】(2026·重庆沙坪坝·模拟预测)成对数据和的一元线性回归模型为,依据模型可建立经验回归方程,用回归方程可得到响应变量的预测值及残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果.对下列四幅残差图的描述正确的是( )
A.图甲显示残差的方差随观测时间变大而变大
B.图乙满足一元线性回归模型对随机误差的假设
C.图丙说明残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分
D.图丁说明残差与观测时间有线性相关性,故满足一元线性回归模型对随机误差的假设
题型5:相关指数的应用
35.【多选】(2026高三·山东青岛·期末)如果散点图中所有的散点都落在一条斜率为非0的直线上,则( )
A.解释变量和响应变量是线性函数关系 B.解释变量和响应变量是线性相关关系
C.相关系数 D.决定系数
36.(2026高三·重庆·月考)已知成对样本数据,,…,中,,…,不全相等,且所有样本点都在直线上,则这组成对样本数据的样本相关系数r=______,其决定系数=______.
37.【多选】(2026高二·河北沧州·期中)两个具有线性相关关系的变量的一组数据为,,,,则下列说法正确的是( )
A.若相关系数,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数越大,残差平方和越小,模型的拟合效果越好
D.决定系数越小,残差平方和越小,模型的拟合效果越好
38.(2026·湖南·模拟预测)对两个变量和进行回归分析,得到一组样本数据,下列统计量的数值能够刻画其经验回归方程的拟合效果的是( )
A.平均数 B.相关系数 C.决定系数 D.方差
39.(2026·全国·模拟预测)某试验小组收集了部分父亲和儿子的身高数据,通过测量与回归方程计算得到如下五组儿子身高的观测值与估计值,则该组统计数据的决定系数______.
儿子身高观测值/
161.3
167.7
170.0
173.5
177.5
儿子身高估计值/
161.3
167.7
170.0
173.5
177.5
40.【多选】(2026高二·广东东莞·期末)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第-组成对数据的样本相关系数、残差平方和、决定系数分别为,,,第二组成对数据的样本相关系数、残差平方和、决定系数分别为,,,则( )
A.若,则第一组成对数据的线性相关关系比第二组的强
B.若,则第一组成对数据的线性相关关系比第二组的强
C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
41.(2026·广东广州·模拟预测)某公司为了了解A商品销售收入(单位:万元)与广告支出(单位:万元)之间的关系,现收集的5组样本数据如下表所示,且经验回归方程为.
2
5
6
8
9
16
20
21
28
10.96
19.24
22
27.52
30.28
(1)求的值;
(2)现从这5组数据的残差中抽取2组进行分析(观测值减去预测值称为残差),记X表示抽到数据的残差为负的组数,求X的分布列和期望;
(3)已知,且当时,回归方程的拟合效果良好,试结合数据,判断经验回归方程的拟合效果是否良好.
42.(2026高三·湖南长沙·阶段检测)海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的经验回归方程为.
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
(1)请你估计:当浇灌海水浓度为8‰时,该品种海水稻的亩产量;
(2)(i)完成上述残差表;
(ii)在统计学中,常用决定系数来刻画回归效果,越大,模型拟合效果越好,并用它来说明响应变量与解释变量的相关性.你能否利用以上表格中的数据,计算决定系数,并判断模型的拟合效果.(计算中数据精确到0.01)
(附:残差,决定系数)
43.(2026高二·全国·课后作业)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
(三)
非线性回归分析
求非线性回归方程的步骤
(1)确定变量,作出散点图.
(2)根据散点图,选择恰当的拟合函数.
(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.
(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.
(5)根据相应的变换,写出非线性回归方程.
题型6:非线性回归分析
44.(2026高三·福建厦门·月考)某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10℃至35℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B. C. D.
45.(2026高二·全国·专题练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
46.(2026高二·海南·期中)椰树集团为确定下一年度投入椰树椰汁的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
298.8
1.6
1469
108.8
表中
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?根据判断结果及表中数据,建立关于的回归方程;
(2)已知椰树椰汁的年利润与的关系为.根据(1)的结果求年宣传费时,年销售量及年利润的预报值是多少?
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
47.(2026·辽宁沈阳·模拟预测)某农业技术站研究化肥施用量对大棚青菜产量的影响.在一定范围内,施肥量(单位kg/亩)越大,青菜产量(单位kg/亩)越高.实验测得具体数据如下表:
施肥量
2
3
4
5
6
青菜产量
4200
4300
4350
4380
4400
根据散点数据特征,研究人员分析得出产量与施肥量近似满足的关系,取,经计算可知,,,,
(1)请根据上述数据,计算得出产量y关于施肥量x的回归方程,并结合常识描述的实际意义,为简化计算,计算过程中、均精确到个位数.
(2)若青菜的收购价格为2元/kg,化肥的采购价格为12元/kg,请从利润最大的角度给出大棚的最优施肥量.
参考公式:,.
48.(2026高二·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
49.(2026高二·山东·阶段检测)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据(,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
50.(2026高三·湖南衡阳·专题练习)脑机接口,即指在人或动物大脑与外部设备之间创建的直接连接,实现脑与设备的信息交换.近日埃隆.马斯克宣布,脑机接口公司正在接收第二位植入者申请,该试验可以实现意念控制手机和电脑.未来10到20年,我国脑机接口产业将产生数百亿元的经济价值.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量y(单位:亿元)与研发人员增量x(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
根据收集到的数据,计算得到下表数据,其中,.
7.5
2.25
82.50
4.50
12.14
2.88
(1)根据残差图,判断应选择哪个模型,并说明理由.
(2)根据(1)中所选模型,求出y关于x的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1)
附:对于一组具有线性相关关系的数据,,…,,其经验回归直线的斜率及截距的最小二乘估计分别为,.
1.(2026高二·全国·课后作业)甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数分别如下表:
甲
乙
丙
丁
0.98
0.78
0.50
0.85
故( )同学建立的回归模型拟合效果最好.
A.甲 B.乙 C.丙 D.丁
2.(2026·湖南)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是
A. B.
C. D.
3.(2026·全国)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B.
C. D.
4.(2026高二·河南濮阳·期末)某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第天的高度为,测得一些数据如下表所示
第天
1
2
3
4
5
6
7
高度
1
4
6
9
11
12
13
由表格数据可得到关于的经验回归方程为,则第6天的残差为( )
A. B.2.12 C. D.0.08
5.(2026高二·全国·课堂例题)下表是某旅游区游客数量与平均气温的对比表:
平均气温/℃
-1
4
10
13
18
26
数量/万个
0.2
0.24
0.34
0.38
0.5
0.64
若已知游客数量与平均气温是线性相关的,求经验回归方程.
6.(2026·江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为
A.y = x-1 B.y = x+1 C.y =88+ D.y = 176
7.(2026高一·全国·课后作业)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:
转速/(转/秒)
16
14
12
8
每小时生产有缺点的零件数/件
11
9
8
5
(1)画出散点图;
(2)如果对有线性相关关系,请画出一条直线近似地表示这种线性关系;
(3)在实际生产中,若它们的近似方程为,允许每小时生产的产品中有缺点的零件最多为件,那么机器的运转速度应控制在什么范围内?
8.(2026高二·全国·课堂例题)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速(转/秒)
16
14
12
8
每小时生产有缺点的零件数(件)
11
9
8
5
在实际生产中,若关于的经验回归方程为,若每增加一个单位的转速,生产有缺点的零件数平均增加多少?
9.(2026高二·全国·课堂例题)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速(转/秒)
16
14
12
8
每小时生产有缺点的零件数(件)
11
9
8
5
在实际生产中,若关于的经验回归方程为,每小时生产有缺点的零件件数是7,估计机器的转速.
10.(2026高二·山东烟台·期中)第十四届湿地公约缔约方大会2022年11月5日至13日在湖北武汉举办,承办此次大会,有助于进一步展示中国促进经济社会与环境协调发展的负责任大国形象,是强化“一带一路”国家生态交流与合作、增强中国在广大发展中国家凝聚力的重要契机.国内某企业以此为契机,研发了一款环保产品,为保证成本,每件产品售价不低于43元,经调研,产品售价x(单位:元/件)与月销售量y(单位:万件)等情况如下表所示:
售价x(元/件)
52
50
48
45
44
43
月销售量y(万件)
5
6
7
8
10
12
(1)求相关系数r(结果保留两位小数),并说明是否可以用线性回归模型拟合y与x的关系,(当,时,可以认为两个变量有很强的线性相关性;否则,没有很强的线性相关性.)(参考数据:)
(2)建立y关于x的经验回归方程,并估计当售价为46元/件时,该产品的月销售量约为多少?
参考公式:对于一组数据,相关系数,其回归直线的斜率和截距的最小二乘估计分别为:,.
11.(2026高二·全国·课后作业)在一次抽样调查中测得样本的5个样本点,数值如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的回归方程.
12.(2026高二·全国·单元测试)电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
t(s)
0
1
2
3
4
5
6
7
8
9
10
U(V)
100
75
55
40
30
20
15
10
10
5
5
试求:电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)
13.(2026高二·全国·课堂例题)假定小麦基本苗数与成熟期有效穗之间存在相关关系,今测得5组数据如下:
15.0
25.8
30.0
36.6
44.4
39.4
42.9
42.9
43.1
49.2
(1)以为解释变量,为预报变量,作出散点图;
(2)求关于的经验回归方程,对于基本苗数56.7预报成熟期有效穗;
(3)计算各组残差,并计算残差平方和;
(4)求,并说明(2)中求出的回归模型的拟合程度.
14.(2026高二·全国·课堂例题)耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究浇灌海水浓度(单位:‰)对亩产量(单位:吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与浇灌海水浓度的有关数据如下表.绘制散点图发现,可用线性回归模型拟合亩产量与浇灌海水浓度之间的相关关系,用最小二乘法计算得与之间的经验回归方程为.
浇灌海水浓度
3
4
5
6
7
亩产量吨
0.62
0.58
0.49
0.4
0.31
残差
(1)求,并估计当浇灌海水浓度为8‰时该品种的亩产量;
(2)①将上表补充完整;
②统计学中常用决定系数来刻画回归效果,越大,模型拟合效果越好,如假设,就说明响应变量的差异有是由解释变量引起的.请计算决定系数(精确到0.01),并指出亩产量的变化多大程度上是由浇灌海水浓度引起的?
15.(9-10高二·河南南阳·期中)设有一个回归方程为,则变量增加一个单位时( )
A.平均增加1.5个单位 B.平均增加2个单位
C.平均减少1.5个单位 D.平均减少2个单位
16.(2026高二·广东深圳·期中)对具有线性相关关系的变量、有一组观测数据,其线性回归方程是,且,,则实数的值是( )
A. B. C. D.
17.(2026高二·浙江杭州·期末),两个学科兴趣小组在实验室研究某粒子的运动轨迹,共同记录到粒子的一组坐标信息.小组根据表中数据,直接对作线性回归分析,得到:回归方程,决定系数.小组先将数据按照变换,进行整理,再对,作线性回归分析,得到:回归方程,决定系数.根据统计学知识,下列方程中,最有可能是该粒子运动轨迹方程的是( )
A. B.
C. D.
18.(2026高三·全国·专题练习)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则________同学的试验结果体现A,B两变量有更强的线性相关性.
19.(2026高三·全国·专题练习)下表给出的是某城市2017年至2020年,人均存款x(万元)与人均消费y(万元)的几组对照数据.
年份
2017
2018
2019
2020
人均存款x(万元)
0.6
0.7
0.8
0.9
人均消费y(万元)
0.35
0.45
0.45
0.55
(1)试建立y关于x的线性回归方程;如果该城市2021年的人均存款为1.1万元,请根据线性回归方程预测2021年该城市的人均消费;
附:回归方程中斜率和截距的最小二乘估计公式分别为:,.
(2)计算,并说明线性回归方程的拟合效果.
20.(2026高三·安徽淮北·月考)为研究某种图书每册的成本费元与印刷数册的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.
表中,.
(1)根据散点图判断:与哪一个更适宜作为每册成本费元与印刷数册的回归方程类型?只要求给出判断,不必说明理由
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)若每册书定价为元,则至少应该印刷多少册才能使销售利润不低于元?假设能够全部售出
(附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,)
21.(2026高三·河南新乡·月考)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为x分钟)和他们的数学平均成绩(设为y)做出了以下数据统计,请根据表格回答问题:
x
60
70
80
90
100
110
120
130
y
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间x和平均成绩y的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出y与x的回归方程(系数精确到0.01).
(3)请根据此回归方程,阐述你对花在课后的学习时间和成绩之间关系的看法.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
22.(2026高三·全国·专题练习)水体富营养化导致藻类大量繁殖,以2017年中国太湖蓝藻爆发为例:5月初监测发现湖体中蓝藻细胞密度为每升50万个,随着气温升高至25-30℃且氮磷营养盐浓度超标(总磷浓度达),蓝藻进入增长期.5月10日细胞密度增至每升200万个,5月15日突破每升800万个,5月20日达到每升3200万个,形成面积超150平方公里的绿色水华带.此次爆发导致湖区溶解氧骤降至以下,大量鱼类死亡,自来水厂被迫停产,所以对水资源的保护刻不容缓.现对某区域的藻类面积y(单位:平方公里)与时间x(单位:年)的关系,进行监测,得到如下数据:
x/年
1
2
3
4
5
6
7
y/平方公里
6
11
21
34
66
101
196
根据以上数据,绘制成如图所示的散点图:
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断与(a,b,c,d均为常数)哪一个更适合作为藻类面积y(单位:平方公里)与时间x(单位:年)的关系的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中的数据,求出y关于x的回归方程.
参考数据:
62.14
1.54
2535
50.12
3.47
其中,
参考公式:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计公式分别为,.
23.(2026高三·广东深圳·阶段检测)某市近6年的新能源汽车保有量数据如下表
年份代号x
1
2
3
4
5
6
保有量y(万辆)
1
1.8
2.7
4
5.9
9.2
(1)从这6年中任意选取2年,在已知至少有1年的新能源汽车保有量大于3万辆的前提下,求这2年的新能源汽车保有量全都大于3万辆的概率;
(2)用函数模型对变量x,y的关系进行拟合,根据表中数据求出y关于x的回归方程(参数d的估计值精确到0.01).
参考数据:,,,;
设,,
参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:,
学科网(北京)股份有限公司1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$