内容正文:
第10讲 一元线性回归模型及其应用
知识清单
知识点01:经验回归方程
题型讲解
(举一反三)
题型1:根据散点图判断是否线性相关
题型2:解释回归直线方程的意义
题型3:计算样本的中心点
题型4:根据回归方程进行数据估计
题型5:根据样本中心点求参数
题型6:求回归直线方程
题型7:残差的计算
题型8:非线性回归
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点1.经验回归方程
1. 一元线性回归模型
称为Y关于x的一元线性回归模型.其中Y称为因变量或响应变量,x称为自变量或解释变量,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,如果e=0,那么Y与x之间的关系就可以用一元线性函数模型来描述.
2.经验回归方程:
(1)相关概念:
经验回归直线:经验回归方程也称经验回归函数或经验回归公式,图形称为经验回归直线.
最小二乘估计:求经验回归方程的方法叫做最小二乘法,求得的叫做的最小二乘估计.
残差:对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
(2)
(3)决定系数:
越大,表示残差平方和越小,即模型的拟合效果越好;
越小,表示残差平方和越大,即模型的拟合效果越差;
方法技巧 经验回归方程的求法及应用
在散点图中,样本点大致分布在一条直线附近,利用公式求出, 可写出经验回归方程,利用经验回归模型进行研究,可近似地利用经验回归方程来预测 。
方法技巧 一元线性回归模型拟合问题的求解策略
在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.|r|越大,R2就越大,用模型拟合数据的效果就越好.
题型1:根据散点图判断是否线性相关
【例1-1】(24-25高二下·河南洛阳·期末)变量x与y的成对样本数据的散点图如下图所示,据此可以推断变量x与y之间( )
A.很可能存在负相关 B.一定存在负相关
C.很可能存在正相关 D.一定不存在正相关
【变式1-1】(24-25高二下·全国·课后作业)下图是根据的观测数据得到的散点图,则变量能用一元线性回归模型来刻画,且的是( )
A. B. C. D.
【变式1-2】(24-25高二下·山西·期中)以下是标号分别为①,②,③的三幅散点图,它们的样本相关系数分别为,那么相关系数的大小关系为__________.(按由小到大的顺序排列).
【变式1-3】(24-25高二下·全国·课后作业)某公司利润与销售总额之间有如下对应数据:
亿元
1.0
1.5
1.7
2.0
2.5
2.8
3.2
万元
1000
1300
1800
2000
2600
2700
3300
(1)画出散点图;
(2)判断与是否具有线性相关关系.
题型2:解释回归直线方程的意义
【例2-1】(24-25高二下·辽宁抚顺·期末)已知两个变量和之间有线性相关关系,经调查得到的样本数据如下表所示,根据表格中的数据求得回归直线方程,则( ).
1
2
4
6
7
4
3
2
0
-2
A., B.,
C., D.,
【变式2-1】(2025高二下·全国·专题练习)由一组样本数据,利用最小二乘法得到两个变量的回归直线方程为,记,,则下面说法不正确的是( )
A.直线至少经过点中的一个点
B.直线必经过点
C.样本相关系数与回归系数同号
D.对样本相关系数,越大,两个变量之间的线性相关性越强
【变式2-2】(24-25高二下·黑龙江·期中)研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
【变式2-3】(2025高二·全国·专题练习)由一组样本数据得到经验回归方程,则下列说法中正确的是_______.(填序号)①直线一定经过点;②直线至少经过点中的一个;③直线的斜率为;④经验回归方程最能代表样本数据中,、之间的线性关系,当时,与正相关,当时,与负相关.
题型3:计算样本的中心点
【例3-1】(24-25高二下·河北邢台·期末)用最小二乘法得到的一组数据的经验回归方程为.若,则( )
A.63 B.21 C.28 D.49
【变式3-1】(24-25高二下·福建厦门·期末)已知变量的4组相关数据分别为,则关于的线性回归直线必经过点( )
A. B. C. D.
【变式3-2】(24-25高二下·安徽·期末)由样本点得到关于的线性回归方程为,若,则( )
A.-5 B.-3 C. D.2
【变式3-3】已知变量x与y的取值如下表:
x
2
3
5
6
y
7
12
若y对x呈现线性相关关系,则y与x的线性回归直线必经过的定点为____________
题型4:根据回归方程进行数据估计
【例4-1】(24-25高二下·湖南长沙·期末)假如女儿的身高(单位:cm)关于父亲的身高(单位:cm)的经验回归方程,已知父亲的身高175cm,则女儿的身高:( )
A.一定是167.57cm B.高于167.57cm
C.低于167.57cm D.可能是167.57cm
【变式4-1】(24-25高二下·广东深圳·期末)已知根据如下数据,可得到关于的经验回归方程为,则3号观测的残差(精确到0.1)为( )
编号
1
2
3
4
5
6
7
8
9
10
11
12
18.1
20.1
22.2
24.4
26.0
28.3
29.6
32.4
33.7
35.7
38.3
40.2
18.8
19.2
21.0
21.0
22.1
22.1
22.4
22.6
23.0
24.3
23.9
24.7
A.0.5 B. C.0.6 D.
【变式4-2】随着夏季的来临,遮阳帽开始畅销,某商家为了解某种遮阳帽如何定价才可以获得最大利润,现对这种遮阳帽进行试销售,经过统计发现销售量(单位:顶)与单价(单位:元)具有线性相关关系,且线性回归方程为,若想要销售量为80顶,则预计该遮阳帽的单价定为_____________元.
【变式4-3】(24-25高二·全国·课堂例题)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速(转/秒)
16
14
12
8
每小时生产有缺点的零件数(件)
11
9
8
5
在实际生产中,若关于的经验回归方程为,每小时生产有缺点的零件件数是7,估计机器的转速.
题型5:根据样本中心点求参数
【例5-1】(25-26高二下·全国·单元测试)某饮料店某5天的日销售收入(单位:百元)与当天平均气温(单位:℃)之间的数据如下表:
0
1
2
5
4
2
2
1
若与之间是线性相关关系,且关于的经验回归方程是,则实数的值是( )
A.3 B.2.8 C.2.6 D.2.4
【变式5-1】(25-26高二上·陕西渭南·期末)已知两个随机变量的4组成对数据为.由这4组数据可得关于的线性回归方程为,则( )
A.2.8 B.3 C.3.3 D.4
【变式5-2】(25-26高二上·江西南昌·期末)根据表中数据,得到关于的线性回归方程,且,则______.
2
4
5
6
8
【变式5-3】(2025高二上·全国·专题练习)某软件科技公司近8年的年利润额y与投入的年研发经费x(单位:千万元)如表所示.
x
3
4
5
6
6
7
8
9
y
根据散点图可以认为x与y之间存在线性相关关系,且相关系数,用最小二乘法求线性回归方程(,用分数表示),________.(参考数据:.)
题型6:求回归直线方程
【例6-1】(25-26高二下·全国·单元测试)已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
【变式6-1】(2025高二·全国·专题练习)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李某月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( )
A.0.04 B.0.03 C.0.02 D.0.01
【变式6-2】(24-25高二下·山东青岛·期末)新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期x和全国累计报告确诊病例数量y(单位:万人)之间的关系如下表:
日期x
1
2
3
4
5
6
7
确诊病例数量y(万人)
1.4
1.7
2.0
2.4
2.8
3.1
3.5
根据表中的数据,适宜作为确诊病例数量关于日期的回归方程类型,则此线性回归方程___________;(精确到0.01)
参考数据:①;②.其中,.
参考公式:对于一组数据,,…,其回归方程中斜率和截距的最小二乘估计公式分别为:①,②.
【变式6-3】(25-26高二上·黑龙江齐齐哈尔·期末)茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
14
17
(1)已知与具有较强的线性相关关系,求关于的经验回归方程;
(2)若某户家庭人口数为8,预测该户茶产业年收入.
参考公式:经验回归方程,其中,.
题型7:残差的计算
【例7-1】(24-25高二下·海南省直辖县级单位·期末)已知关于的经验回归方程为,则样本点的残差为( )
A.-2 B.-1 C.1 D.2
【变式7-1】(24-25高二下·山东青岛·期末)已知变量,线性相关,其一组样本数据满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到新的经验回归方程,则此时数据的残差为( )
A. B. C.1 D.2
【变式7-2】(24-25高二下·福建泉州·月考)已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则_____.
【变式7-3】(24-25高二下·山东·月考)某市组织宣传小分队进行法律法规宣传,某宣传小分队记录了前9天每天普及的人数,得到下表:
时间(天)
1
2
3
4
5
6
7
8
9
每天普及的人数
80
98
129
150
203
190
258
292
310
(1)设是因变量每天普及人数的第个观测值,是通过线性回归方程得到的第个预测值,则称为残差,求;
(2)由于统计人员的疏忽,第6天的数据统计有误,如果去掉第6天的数据,试用剩下的数据求出每天普及的人数y关于天数x的线性回归方程(计算过程精确到小数点后一位,最终结果精确到整数.
参考数据:,x的方差为,.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
题型8:非线性回归
【例8-1】(2025高二·全国·专题练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
【变式8-1】(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
1
2
3
4
5
4
7
12
20
33
经计算:,,令,,,,,,经分析.与呈线性相关关系,用最小二乘法求得线性回归方程,则关于的回归方程为( )(参考公式:,)
A. B. C. D.
【变式8-2】(24-25高二下·全国·单元测试)在一组样本数据的散点图中,若所有样本点都在曲线附近波动,经计算,则实数___________.
【变式8-3】(25-26高二下·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
一、单选题
1.(25-26高二上·江西·期末)根据3对数据绘制的散点图呈直线趋势,且线性回归方程为,则( )
A.9.5 B.10 C.10.5 D.11
2.(25-26高二上·江西赣州·期末)已知变量x,y的数据如下若x与y的回归直线方程为,则( )
x
3
4
6
7
y
2.5
3
m
5.9
A.3.5 B.4 C.4.2 D.5
3.(25-26高二上·江西九江·期末)已知变量与的一组统计数据如下表:
2
4
5
6
8
27
42
62
72
87
若与线性相关,且关于的经验回归方程为.据此估计,当为9时,约为( )
A.95 B.100 C.105 D.110
4.(25-26高二上·江西新余·期末)为了更好地适应市场需求,某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
1
2
3
4
5
6
7
2
3
5
7
8
8
9
参考公式:,
则下列选项不正确的是( )
A.
B.由散点图知变量和正相关
C.相关系数的绝对值越接近0,表示的线性相关程度越弱
D.用最小二乘法求得关于的线性回归直线方程为
5.(25-26高二下·辽宁沈阳·月考)如图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( ).
A. B. C. D.
6.(25-26高二上·广西梧州·期末)为了研究关于的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程,则下列选项中不正确的是( )
1
2
3
4
5
0.5
0.9
1
1.1
1.5
A.由题中数据可知,变量与正相关
B.
C.当时,的预估值为2.1
D.去掉样本点后,与的样本相关系数必会改变
7.(25-26高二下·重庆·期中)已知变量,线性相关,其一组样本数据 ,满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到修正后的回归直线的斜率为,则数据 相对于修正后的回归直线的残差为( )
A. B. C. D.
8.(25-26高二上·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
二、多选题
9.(25-26高二上·江苏常州·期末)某单位通过对数据的统计与分析得知,日用电量(单位:)与当天平均气温(单位:)之间线性相关,且线性回归方程为.已知数据样本的相关系数为,则下列说法正确的有( )
A.日用电量与平均气温成负相关,气温每升高,日用电量平均减少
B.可以预测到当平均气温为时,日用电量约为
C.如果样本的相关系数,则说明用电量与平均气温的线性相关性很弱
D.该回归直线必经过样本点的平均值点
10.(25-26高二上·安徽淮北·期末)为调查本班学生的身高体重情况,班主任在学生中随机抽测了人的身高和体重,统计数据制作成如下所示的散点图:
由最小二乘法计算得到回归直线的方程为,样本相关系数为.经过分析确定为异常数据,把它去掉后,再用剩下的组数据计算得到回归直线的方程为,样本相关系数为,且必经过点.找到该异常数据的同学后重新测量为,用该组数据与剩下的组数据计算得到回归直线的方程为,样本相关系数为,则以下结论正确的有( )
A. B.
C. D.
11.(25-26高二下·河南南阳·月考)对于变量X,Y,经过随机抽样获得成对数据(,2,3,…,10),且,利用最小二乘法得到Y关于X的线性回归方程为,且X与Y的相关系数,则下列结论正确的是( )
A.r越大,X与Y的线性相关性越强
B.若,则
C.若,则
D.若样本点(,2,3,…,10)都在回归直线上,则
三、填空题
12.(24-25高二下·陕西咸阳·期末)经验表明,一般树的胸径(树的主干在地面以上处的直径)越大,树就越高.在研究树高与胸径之间的关系时,某同学收集了某种树的5组观测数据(如下表):
胸径
8
9
10
11
12
树高
8.2
10
11
12
13.8
假设树高与胸径满足的经验回归方程为,则当胸径时,树高的预测值为______.
13.(25-26高二下·辽宁朝阳·月考)某产品的研发投入费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:
/万元
2.2
2.6
4.3
5.0
5.9
/万件
3.8
5.4
7.0
10.35
12.2
根据表中的数据,可得回归直线方程,则___________;
14.(25-26高二下·全国·单元测试)某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
四、解答题
15.(25-26高二上·全国·单元测试)据统计,某省2018年~2024年水果人均占有量(单位:kg)和年份代码绘制的散点图(2018年~2024年的年份代码分别为1~7)如图所示.
(1)根据散点图分析与之间的相关关系;
(2)根据散点图相应数据计算得,,求关于的线性回归方程.
16.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
2
4
6
8
10
40
45
50
55
60
经计算:,,,
(1)求关于的线性回归方程;(参考公式:,)
(2)若明年计划投入宣传费12万元,预测年利润.
17.(25-26高二下·全国·单元测试)近期,某市公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次.
[参考数据:,,,,,其中,]
18.(25-26高二上·江西南昌·期末)某车间为了确定合理的工时定额,需要确定加工零件所花费的时间,为此做了五次试验,得到数据如下:
零件的个数(个)
1
2
3
4
5
加工的时间(小时)
1.5
2.4
3.2
3.9
4.5
(1)求出关于的回归方程;
(2)试预测加工9个零件需要多少时间?
参考公式:,
19.(24-25高二下·辽宁鞍山·期末)自2021年起,我国居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表所示:
年份
2021
2022
2023
2024
2025
时间代号
1
2
3
4
5
储蓄存款(千亿元)
4.76
4.61
5.32
5.41
5.38
(表中部分数据已精确至0.0001,表中数据可直接代入公式进行运算) 可能用到的估计值:,,
9
25.9692
130.4246
78.48
1554.2872
(1)求关于的回归方程;
(2)用(1)所求回归方程预测该地2027年()的人民币储蓄存款额;
(3)求样本的相关系数.(精确至0.01)
附:,,
1
学科网(北京)股份有限公司
$
第10讲 一元线性回归模型及其应用
知识清单
知识点01:经验回归方程
题型讲解
(举一反三)
题型1:根据散点图判断是否线性相关
题型2:解释回归直线方程的意义
题型3:计算样本的中心点
题型4:根据回归方程进行数据估计
题型5:根据样本中心点求参数
题型6:求回归直线方程
题型7:残差的计算
题型8:非线性回归
强化训练
一、单选题(8)
二、多选题(3)
三、填空题(3)
四、解答题(5)
知识点1.经验回归方程
1. 一元线性回归模型
称为Y关于x的一元线性回归模型.其中Y称为因变量或响应变量,x称为自变量或解释变量,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差,如果e=0,那么Y与x之间的关系就可以用一元线性函数模型来描述.
2.经验回归方程:
(1)相关概念:
经验回归直线:经验回归方程也称经验回归函数或经验回归公式,图形称为经验回归直线.
最小二乘估计:求经验回归方程的方法叫做最小二乘法,求得的叫做的最小二乘估计.
残差:对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
(2)
(3)决定系数:
越大,表示残差平方和越小,即模型的拟合效果越好;
越小,表示残差平方和越大,即模型的拟合效果越差;
方法技巧 经验回归方程的求法及应用
在散点图中,样本点大致分布在一条直线附近,利用公式求出, 可写出经验回归方程,利用经验回归模型进行研究,可近似地利用经验回归方程来预测 。
方法技巧 一元线性回归模型拟合问题的求解策略
在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.|r|越大,R2就越大,用模型拟合数据的效果就越好.
题型1:根据散点图判断是否线性相关
【例1-1】(24-25高二下·河南洛阳·期末)变量x与y的成对样本数据的散点图如下图所示,据此可以推断变量x与y之间( )
A.很可能存在负相关 B.一定存在负相关
C.很可能存在正相关 D.一定不存在正相关
【答案】A
【分析】根据散点图以及相关关系的定义判断即可.
【详解】从散点图看,这些点在一条线的附近,且从左上角到右下角呈递减的趋势,
所以据此可以推断变量x与y之间可能存在负相关.
故选:A.
【变式1-1】(24-25高二下·全国·课后作业)下图是根据的观测数据得到的散点图,则变量能用一元线性回归模型来刻画,且的是( )
A. B. C. D.
【答案】A
【分析】由一元线性回归模型的散点图特征判断.
【详解】根据变量具有线性相关关系,则散点在某条直线附近,又,所以散点从左上至右下.
故选:A.
【变式1-2】(24-25高二下·山西·期中)以下是标号分别为①,②,③的三幅散点图,它们的样本相关系数分别为,那么相关系数的大小关系为__________.(按由小到大的顺序排列).
【答案】
【分析】根据给定的散点图,结合相关性强弱及正负相关求得大小关系.
【详解】图①散点线性相关关系较弱,接近于0;
图②散点数据负相关,且线性相关程度很强,接近于;
图③散点数据正相关,且线性相关程度较强,接近于1,
所以相关系数的大小关系为.
故答案为:
【变式1-3】(24-25高二下·全国·课后作业)某公司利润与销售总额之间有如下对应数据:
亿元
1.0
1.5
1.7
2.0
2.5
2.8
3.2
万元
1000
1300
1800
2000
2600
2700
3300
(1)画出散点图;
(2)判断与是否具有线性相关关系.
【答案】(1)散点图见解析
(2)与具有线性相关关系
【分析】(1)依据数据描点得到散点图;
(2)根据散点图判断线性相关.
【详解】(1)根据表中数据,画出散点图如图所示.
(2)根据散点图中点的分布呈带状,且在一条直线的附近,判断与具有线性相关关系.
题型2:解释回归直线方程的意义
【例2-1】(24-25高二下·辽宁抚顺·期末)已知两个变量和之间有线性相关关系,经调查得到的样本数据如下表所示,根据表格中的数据求得回归直线方程,则( ).
1
2
4
6
7
4
3
2
0
-2
A., B.,
C., D.,
【答案】D
【分析】根据回归方程系数所表示的含义和表格中的数据进行判断即可.
【详解】由样本数据得随着的增大呈现减小的趋势,
所以和之间存在负相关的关系,所以,易得.
故选:D.
【变式2-1】(2025高二下·全国·专题练习)由一组样本数据,利用最小二乘法得到两个变量的回归直线方程为,记,,则下面说法不正确的是( )
A.直线至少经过点中的一个点
B.直线必经过点
C.样本相关系数与回归系数同号
D.对样本相关系数,越大,两个变量之间的线性相关性越强
【答案】A
【分析】根据回归直线性质、相关系数、回归系数的概念逐项分析可得答案.
【详解】回归直线是由点拟合而成的,可能不过任何一个样本点,但必过数据的中心点,A错误,B正确.
样本相关系数为正时,两个变量为正相关,回归系数为正;样本相关系数为负时,两个变量为负相关,回归系数为负.
故样本相关系数与回归系数同号,C正确.
样本相关系数,越大,两个变量之间的线性相关性越强,D正确.
故选:A.
【变式2-2】(24-25高二下·黑龙江·期中)研究表明某地的山高(km)与该山的年平均气温(℃)具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是( )
A.年平均气温为5℃时该山高估计为5km
B.该山高为8km处的年平均气温估计为10℃
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
【答案】B
【分析】根据回归直线方程逐个验证选项可得答案.
【详解】对于A,因为时,,即山高估计为5km,A正确;
对于B,令,解得,即山高为8km处的年平均气温估计为℃,B错误;
对于C,由线性回归方程的系数的含义可知C正确;
对于D,因为,所以该地的山高与该山的年平均气温成负相关关系.
故选:B
【变式2-3】(2025高二·全国·专题练习)由一组样本数据得到经验回归方程,则下列说法中正确的是_______.(填序号)①直线一定经过点;②直线至少经过点中的一个;③直线的斜率为;④经验回归方程最能代表样本数据中,、之间的线性关系,当时,与正相关,当时,与负相关.
【答案】①③④
【分析】利用线性回归直线的性质逐个分析判断即可.
【详解】经验回归直线一定经过点,故①正确;经验回归直线可以不经过所有的样本点,故②不正确;
由最小二乘法知③是正确的:经验回归方程是一次函数,由一次函数性质知④也正确.故填①③④
故答案为:①③④
题型3:计算样本的中心点
【例3-1】(24-25高二下·河北邢台·期末)用最小二乘法得到的一组数据的经验回归方程为.若,则( )
A.63 B.21 C.28 D.49
【答案】C
【分析】计算,代入即可.
【详解】根据题意可得,所以,
则.
故选:C
【变式3-1】(24-25高二下·福建厦门·期末)已知变量的4组相关数据分别为,则关于的线性回归直线必经过点( )
A. B. C. D.
【答案】B
【分析】计算出样本中心点即可求解.
【详解】因为,
线性回归直线必经过样本中心点.
故选:B.
【变式3-2】(24-25高二下·安徽·期末)由样本点得到关于的线性回归方程为,若,则( )
A.-5 B.-3 C. D.2
【答案】B
【分析】将代入线性回归方程,求出.
【详解】由题意得在上,即.
故选;B
【变式3-3】已知变量x与y的取值如下表:
x
2
3
5
6
y
7
12
若y对x呈现线性相关关系,则y与x的线性回归直线必经过的定点为____________
【答案】
【分析】根据线性回归方程必过样本中心点求解.
【详解】因为,,
所以线性回归方程必过定点.
故答案为:
题型4:根据回归方程进行数据估计
【例4-1】(24-25高二下·湖南长沙·期末)假如女儿的身高(单位:cm)关于父亲的身高(单位:cm)的经验回归方程,已知父亲的身高175cm,则女儿的身高:( )
A.一定是167.57cm B.高于167.57cm
C.低于167.57cm D.可能是167.57cm
【答案】D
【分析】根据回归方程估计女儿的身高,结合实际意义即可得答案.
【详解】由题设cm,女儿的身高大约为167.57cm.
故选:D
【变式4-1】(24-25高二下·广东深圳·期末)已知根据如下数据,可得到关于的经验回归方程为,则3号观测的残差(精确到0.1)为( )
编号
1
2
3
4
5
6
7
8
9
10
11
12
18.1
20.1
22.2
24.4
26.0
28.3
29.6
32.4
33.7
35.7
38.3
40.2
18.8
19.2
21.0
21.0
22.1
22.1
22.4
22.6
23.0
24.3
23.9
24.7
A.0.5 B. C.0.6 D.
【答案】C
【分析】根据经验回归方程求出3号观测的预测值,再由残差的定义求解.
【详解】根据经验回归方程为,
3号观测的预测值为,
则3号观测的残差为.
故选:C
【变式4-2】随着夏季的来临,遮阳帽开始畅销,某商家为了解某种遮阳帽如何定价才可以获得最大利润,现对这种遮阳帽进行试销售,经过统计发现销售量(单位:顶)与单价(单位:元)具有线性相关关系,且线性回归方程为,若想要销售量为80顶,则预计该遮阳帽的单价定为_____________元.
【答案】40
【分析】线性回归方程中,当,求的值.
【详解】若销售量为80顶,则,解得,所以预计单价应定为40元.
故答案为:40
【变式4-3】(24-25高二·全国·课堂例题)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:
转速(转/秒)
16
14
12
8
每小时生产有缺点的零件数(件)
11
9
8
5
在实际生产中,若关于的经验回归方程为,每小时生产有缺点的零件件数是7,估计机器的转速.
【答案】11转/秒.
【分析】由回归方程,代入数据即可求解;
【详解】因为,
所以当时,,解得,
即估计机器的转速约为11转/秒.
题型5:根据样本中心点求参数
【例5-1】(25-26高二下·全国·单元测试)某饮料店某5天的日销售收入(单位:百元)与当天平均气温(单位:℃)之间的数据如下表:
0
1
2
5
4
2
2
1
若与之间是线性相关关系,且关于的经验回归方程是,则实数的值是( )
A.3 B.2.8 C.2.6 D.2.4
【答案】B
【分析】根据表格中的数据,求得样本点的中心是,将其代入回归方程,即可求解.
【详解】由统计表格中的数据,可得,,
所以统计数据的样本点的中心为,
因为关于的经验回归方程是,
代入可得,解得.
故选:B.
【变式5-1】(25-26高二上·陕西渭南·期末)已知两个随机变量的4组成对数据为.由这4组数据可得关于的线性回归方程为,则( )
A.2.8 B.3 C.3.3 D.4
【答案】B
【分析】根据回归直线必过样本中心点求解即可.
【详解】,,
∵,∴,
∴.
故选:B.
【变式5-2】(25-26高二上·江西南昌·期末)根据表中数据,得到关于的线性回归方程,且,则______.
2
4
5
6
8
【答案】
【分析】求出样本中心点的坐标代入直线方程即可得解.
【详解】由表格数据可知,
所以.
故答案为:17.5
【变式5-3】(2025高二上·全国·专题练习)某软件科技公司近8年的年利润额y与投入的年研发经费x(单位:千万元)如表所示.
x
3
4
5
6
6
7
8
9
y
根据散点图可以认为x与y之间存在线性相关关系,且相关系数,用最小二乘法求线性回归方程(,用分数表示),________.(参考数据:.)
【答案】
【分析】首先计算和 ,再根据相关系数公式以及参考数据,即可求解.
【详解】,
,
由条件可知,
得,所以,
故答案为:.
题型6:求回归直线方程
【例6-1】(25-26高二下·全国·单元测试)已知经验回归方程的斜率的估计值是1.23,样本点的中心为,则经验回归的方程是( )
A. B. C. D.
【答案】C
【分析】先根据斜率值设经验回归方程,再代入样本中心点求出参数得出经验回归方程即可.
【详解】由条件知,,设经验回归方程为,
则,
∴经验回归的方程是.
故选:C.
【变式6-1】(2025高二·全国·专题练习)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,统计出小李某月1号到5号每天打篮球时间(单位:h)与当天投篮命中率的成对数据满足的关系式:,,.若与满足线性回归方程,则回归系数( )
A.0.04 B.0.03 C.0.02 D.0.01
【答案】D
【分析】根据回归系数公式,代入数据求出结果即可.
【详解】由题意,已知,则,,
则,
故选:D.
【变式6-2】(24-25高二下·山东青岛·期末)新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期x和全国累计报告确诊病例数量y(单位:万人)之间的关系如下表:
日期x
1
2
3
4
5
6
7
确诊病例数量y(万人)
1.4
1.7
2.0
2.4
2.8
3.1
3.5
根据表中的数据,适宜作为确诊病例数量关于日期的回归方程类型,则此线性回归方程___________;(精确到0.01)
参考数据:①;②.其中,.
参考公式:对于一组数据,,…,其回归方程中斜率和截距的最小二乘估计公式分别为:①,②.
【答案】
【分析】利用给定的已知数据,结合公式即可求解.
【详解】由题意得:,,
根据公式得:,
再由,
则此线性回归方程为,
故答案为:
【变式6-3】(25-26高二上·黑龙江齐齐哈尔·期末)茶产业不仅是产业发展的新引擎,更是实现乡村振兴的关键力量.某山区农村茶产业合作社统计了村民每户家庭人口数与每户茶产业年收入的情况,统计结果如下表:
每户家庭人口数(人)
3
4
5
6
每户茶产业年收入(万元)
5
8
14
17
(1)已知与具有较强的线性相关关系,求关于的经验回归方程;
(2)若某户家庭人口数为8,预测该户茶产业年收入.
参考公式:经验回归方程,其中,.
【答案】(1)
(2)25.7万元
【分析】(1)由已知表格中的数据结合给定公式求得的值,代入回归直线方程即可;
(2)在(1)求得的线性回归方程中,将代入,求得值即可.
【详解】(1)由题知,.
,.
所以,
,
所以关于的经验回归方程为.
(2)当时,,
故当某户家庭人口数为8时,预测该户茶产业的年收入为25.7万元.
题型7:残差的计算
【例7-1】(24-25高二下·海南省直辖县级单位·期末)已知关于的经验回归方程为,则样本点的残差为( )
A.-2 B.-1 C.1 D.2
【答案】B
【分析】根据给定条件,求出预测值,进而求出残差.
【详解】当时,,所以样本点的残差为.
故选:B
【变式7-1】(24-25高二下·山东青岛·期末)已知变量,线性相关,其一组样本数据满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到新的经验回归方程,则此时数据的残差为( )
A. B. C.1 D.2
【答案】D
【分析】根据已知数据求原数据的样本中心,再确定新数据的样本中心,进而得出新的回归直线方程,再结合残差的定义计算即可.
【详解】由题意可知,旧数据,则,
增加数据后,,,
将点代入中得, ,即,则,
当时,,故残差为.
故选:D
【变式7-2】(24-25高二下·福建泉州·月考)已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则_____.
【答案】
【分析】根据残差计算公式计算即可.
【详解】根据题意得,解得.
故答案为:
【变式7-3】(24-25高二下·山东·月考)某市组织宣传小分队进行法律法规宣传,某宣传小分队记录了前9天每天普及的人数,得到下表:
时间(天)
1
2
3
4
5
6
7
8
9
每天普及的人数
80
98
129
150
203
190
258
292
310
(1)设是因变量每天普及人数的第个观测值,是通过线性回归方程得到的第个预测值,则称为残差,求;
(2)由于统计人员的疏忽,第6天的数据统计有误,如果去掉第6天的数据,试用剩下的数据求出每天普及的人数y关于天数x的线性回归方程(计算过程精确到小数点后一位,最终结果精确到整数.
参考数据:,x的方差为,.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
【答案】(1)0
(2)
【分析】(1)先对展开,再利用样本均值定义变形,最后根据线性回归方程过样本中心点得出结果.
(2)对比去掉点前后分子的表达式,通过化简得出去掉点后分子与原分子相等,再由方差求出,进而算出去掉点后的分母;再根据和样本中心点关系求出,得到回归方程.
【详解】(1)已知,则.
又因为样本均值,则;,则,
所以.
对于线性回归方程,它过样本中心点,即,那么,
所以,即残差和.
(2)先证明去掉后的分子不变:
设原来有个数据点,.原来的分子公式为.
去掉后,新的的均值,新的分子为.
对进行化简:,
已知,所以去掉后的分子不变,仍为1800.
再计算去掉后的分母变化:
已知的方差,则.
已知,所以.
去掉后,新的分母为,其中,这里,.
则分母
.
最后计算和及回归方程的确定:
.
.
则线性回归方程.
则每天普及的人数y关于天数x的线性回归方程为.
题型8:非线性回归
【例8-1】(2025高二·全国·专题练习)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:万元)对年销售量y(单位:吨)和年利润z(单位:万元)的影响.对近8年的年宣传费和年销售量数据进行初步处理后,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量y关于年宣传费x的回归方程的是( )
A.①② B.②③ C.②④ D.③⑤
【答案】B
【分析】先根据散点图确定函数图象的趋势,再结合5个函数图象,进行判断选择.
【详解】从散点图知,样本点分布在抛物线上或对数型曲线上,结合所给5个的曲线类型,所以或较适宜.
故选:B
【变式8-1】(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
1
2
3
4
5
4
7
12
20
33
经计算:,,令,,,,,,经分析.与呈线性相关关系,用最小二乘法求得线性回归方程,则关于的回归方程为( )(参考公式:,)
A. B. C. D.
【答案】A
【分析】根据给定数据,利用最小二乘法求出关于的线性回归方程,进而求出关于的回归方程.
【详解】令,,由与呈线性相关关系,得线性回归方程,
则,,
因此,即,所以关于的回归方程为.
【变式8-2】(24-25高二下·全国·单元测试)在一组样本数据的散点图中,若所有样本点都在曲线附近波动,经计算,则实数___________.
【答案】/
【分析】利用回归直线过样本中心点求解即得.
【详解】依题意,,
则,所以.
故答案为:
【变式8-3】(25-26高二下·河南南阳·期中)学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的自主学习,包括提前预习,复习巩固等等,现在人们普遍认为花在课后的学习时间越多越好.某教研机构抽查了部分高中学生,对学生花在课后的学习时间(设为分钟)和他们的数学平均成绩(设为)做出了以下数据统计,请根据表格回答问题:
60
70
80
90
100
110
120
130
92
109
114
120
119
121
121
122
(1)从三个函数①.②().③中选择一个作为学习时间和平均成绩的回归类型,判断哪个类型更加符合,不必说明理由.
(2)根据(1)中选择的回归类型,求出与的回归方程(系数精确到).
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为.
参考数据:,,,
【答案】(1)②合适
(2)
【分析】(1)利用函数①②③的性质及表中的数据,即可求解;
(2)先将非线性回归方程转化成线性回归方程,再根据题设条件,利用最小二乘法,即可求解.
【详解】(1)由表格可知,增大时,值整体呈上升趋势但存在局部波动,比较函数①②③,
选择②()作为学习时间x和平均成绩y的回归类型最合适.
(2)对()两边取以为底的对数可得,
设,则,
,
,所以,
故,即,所以.
一、单选题
1.(25-26高二上·江西·期末)根据3对数据绘制的散点图呈直线趋势,且线性回归方程为,则( )
A.9.5 B.10 C.10.5 D.11
【答案】C
【分析】根据题意,求得样本中心,将其代入回归方程,列出方程,求得的值,得到答案.
【详解】由3对数据,可得,
将代入回归直线方程,
可得,解得.
故选:C.
2.(25-26高二上·江西赣州·期末)已知变量x,y的数据如下若x与y的回归直线方程为,则( )
x
3
4
6
7
y
2.5
3
m
5.9
A.3.5 B.4 C.4.2 D.5
【答案】B
【分析】由题意可得,求,,并代入求解即可.
【详解】由题意可得,,,
将,代入,
可得,解得.
故选:B.
3.(25-26高二上·江西九江·期末)已知变量与的一组统计数据如下表:
2
4
5
6
8
27
42
62
72
87
若与线性相关,且关于的经验回归方程为.据此估计,当为9时,约为( )
A.95 B.100 C.105 D.110
【答案】B
【分析】由题意,求出,代入回归方程求出,进而求出回归方程,令,计算即可求解.
【详解】由题意可得,,
由于回归直线过样本的中心点,
所以,解得,
故回归方程为,
当时,.
故选:B.
4.(25-26高二上·江西新余·期末)为了更好地适应市场需求,某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
1
2
3
4
5
6
7
2
3
5
7
8
8
9
参考公式:,
则下列选项不正确的是( )
A.
B.由散点图知变量和正相关
C.相关系数的绝对值越接近0,表示的线性相关程度越弱
D.用最小二乘法求得关于的线性回归直线方程为
【答案】D
【分析】对于A,根据条件,直接求出,即可求解;对于B,根据条件,画出散点图,即可求解;对于C,根据相关系数的定义判断即可;对于D,利用线性回归直线方程过样本中心,代入计算,即可求解.
【详解】对于选项A,由题知,
,故选项A正确;
对于选项B,由图表可得散点图如下,由散点图知变量和正相关,所以选项B正确;
对于选项C,相关系数的绝对值越接近0,表示的线性相关程度越弱,故选项C正确;
对于选项D,因为样本中心点为,又,
所以不是关于的线性回归直线方程,故选项D不正确.
故选:D
5.(25-26高二下·辽宁沈阳·月考)如图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是( ).
A. B. C. D.
【答案】A
【详解】选项A的散点分布杂乱,没有明显的线性趋势,即散点不集中在一条直线附近,因此不适合用线性回归模型拟合;
选项B、C、D的散点都大致分布在一条直线附近,存在明显线性相关关系,适合线性回归模型拟合.
6.(25-26高二上·广西梧州·期末)为了研究关于的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程,则下列选项中不正确的是( )
1
2
3
4
5
0.5
0.9
1
1.1
1.5
A.由题中数据可知,变量与正相关
B.
C.当时,的预估值为2.1
D.去掉样本点后,与的样本相关系数必会改变
【答案】D
【分析】对于A:根据回归方程结合正相关的概念分析判断即可;对于B:根据线性回归方程过样本中心点运算求解;对于C:代入运算即可;对于D:根据相关系数的公式分析判断即可.
【详解】由题意可知:,,
则样本中心点为.
对于选项A:因回归方程斜率为正值,则变量与正相关,故A正确;
对于选项B:因为线性回归方程过样本中心点,
则,解得,故B正确;
对于选项C:由选项B可知:,
当时,的预估值为,故C正确;
对于选项D:由相关系数公式知,去掉样本中心点后,与的样本相关系数不会改变,故D错误.
故选:D.
7.(25-26高二下·重庆·期中)已知变量,线性相关,其一组样本数据 ,满足,用最小二乘法得到的经验回归方程为,若增加一个数据后,得到修正后的回归直线的斜率为,则数据 相对于修正后的回归直线的残差为( )
A. B. C. D.
【答案】A
【分析】分别求修正前和修正后的样本点中心,再代入回归直线方程求解回归后的直线方程,再代入残差公式.
【详解】.因为,所以,因为经验回归方程过点,
所以,所以增加一个数据后的,,
设修正后的回归直线为,而修正后的回归直线过点,即 ,
所以,
解得,所以修正后的回归直线为 ,
所以数据 相对于修正后的回归直线的残差为 .
8.(25-26高二上·安徽淮北·期末)李华新开了一家便利店,开业第一周的营业收入(单位:千元)统计如下:
天数序号X
1
2
3
4
5
6
7
营业收入Y/千元
11
13
18
※
28
※
35
其中第4天和第6天的数据由于某种原因而模糊,但知道7天的营业收入的平均值是23.已知营业收入Y与天数序号X可以用线性回归方程拟合,且第7天的实际值比预测值小0.6,则预计第10天的营业收入是( )
A.38.4千元 B.44.8千元 C.46.2千元 D.48.2千元
【答案】D
【详解】由第7天的实际值是,所以预测值为35.6,得 ①,
因为回归直线经过中心点,又,,所以②,
联立①②,解得,,
所以预计第10天的营业收入(千元).
二、多选题
9.(25-26高二上·江苏常州·期末)某单位通过对数据的统计与分析得知,日用电量(单位:)与当天平均气温(单位:)之间线性相关,且线性回归方程为.已知数据样本的相关系数为,则下列说法正确的有( )
A.日用电量与平均气温成负相关,气温每升高,日用电量平均减少
B.可以预测到当平均气温为时,日用电量约为
C.如果样本的相关系数,则说明用电量与平均气温的线性相关性很弱
D.该回归直线必经过样本点的平均值点
【答案】ABD
【详解】A、因为线性回归方程为,,两个变量成负相关,
即当气温每升高,日用电量平均减少,故A正确;
B、因为线性回归方程为,当时,,
则当平均气温为时,日用电量的度数约为68,故B正确;
C、,,非常接近1,
说明用电量与平均气温的线性相关性很强,故C错误;
D、回归直线必经过样本中心,
所以回归直线必经过样本点的平均值点,故D正确.
10.(25-26高二上·安徽淮北·期末)为调查本班学生的身高体重情况,班主任在学生中随机抽测了人的身高和体重,统计数据制作成如下所示的散点图:
由最小二乘法计算得到回归直线的方程为,样本相关系数为.经过分析确定为异常数据,把它去掉后,再用剩下的组数据计算得到回归直线的方程为,样本相关系数为,且必经过点.找到该异常数据的同学后重新测量为,用该组数据与剩下的组数据计算得到回归直线的方程为,样本相关系数为,则以下结论正确的有( )
A. B.
C. D.
【答案】AC
【分析】求出身高的平均数,再根据、、的意义逐项判断即可.
【详解】身高的平均值为,
从散点图分析可知,异常数据的横坐标小于平均值,纵坐标相对过大,
所以去掉异常数据后回归直线的斜率变大,所以,
因为去掉异常数据后成对样本数据的线性相关程度更强,拟合效果会更好,所以,
又因为重新测量后的数据恰好为余下组数据的平均值,所以,,
综上,,.
11.(25-26高二下·河南南阳·月考)对于变量X,Y,经过随机抽样获得成对数据(,2,3,…,10),且,利用最小二乘法得到Y关于X的线性回归方程为,且X与Y的相关系数,则下列结论正确的是( )
A.r越大,X与Y的线性相关性越强
B.若,则
C.若,则
D.若样本点(,2,3,…,10)都在回归直线上,则
【答案】AD
【分析】根据的性质即可求解ABD,根据样本中心在直线上,可求解C.
【详解】由于可得,则,
对于A, r的绝对值越接近1,由于,故的值越大,X与Y的线性相关性越强,故A正确,
对于C,当时,,则,故C错误,
对于D, 若样本点(,2,3,…,10)都在回归直线上,且,则,D正确,
对于B, 当时,无法确定的值,B错误,
三、填空题
12.(24-25高二下·陕西咸阳·期末)经验表明,一般树的胸径(树的主干在地面以上处的直径)越大,树就越高.在研究树高与胸径之间的关系时,某同学收集了某种树的5组观测数据(如下表):
胸径
8
9
10
11
12
树高
8.2
10
11
12
13.8
假设树高与胸径满足的经验回归方程为,则当胸径时,树高的预测值为______.
【答案】17.6
【分析】根据经验回归方程必过样本中心点,即将平均数求出代入即可解,再将代入即可求解.
【详解】根据表中数据可求:,.
将其代入方程解得.
所以经验回归方程为.
将代入解得.
所以树高的预测值为 .
故答案为:
13.(25-26高二下·辽宁朝阳·月考)某产品的研发投入费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表所示:
/万元
2.2
2.6
4.3
5.0
5.9
/万件
3.8
5.4
7.0
10.35
12.2
根据表中的数据,可得回归直线方程,则___________;
【答案】1.33
【分析】根据回归直线方程经过样本中心点即可求解.
【详解】(万元),(万件),
由回归直线方程经过可得,,解得.
14.(25-26高二下·全国·单元测试)某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
【答案】
【分析】根据题意,求得的值,代入回归方程,求得,得到回归方程,进而求得答案.
【详解】由表格中的数据,可得,
因为回归方程中的,代入可得,
所以经验回归方程为,
当时,,即每天的销售量约为个.
故答案为:;.
四、解答题
15.(25-26高二上·全国·单元测试)据统计,某省2018年~2024年水果人均占有量(单位:kg)和年份代码绘制的散点图(2018年~2024年的年份代码分别为1~7)如图所示.
(1)根据散点图分析与之间的相关关系;
(2)根据散点图相应数据计算得,,求关于的线性回归方程.
【答案】(1)与呈正线性相关关系
(2)
【分析】(1)根据散点图结合相关性的性质可得;
(2)根据数据及公式可得回归方程.
【详解】(1)根据散点图可知,与呈正线性相关关系
(2)由题中的数据可知,,,
,
所以关于的线性回归方程为
16.(25-26高二下·内蒙古呼和浩特·月考)某企业研究年宣传费(万元)对年利润(万元)的影响,得到近5年的数据如下:
2
4
6
8
10
40
45
50
55
60
经计算:,,,
(1)求关于的线性回归方程;(参考公式:,)
(2)若明年计划投入宣传费12万元,预测年利润.
【答案】(1)
(2)万元
【分析】(1)根据所给的数据,结合所给的公式进行求解即可;
(2)利用代入法,结合(1)中的结论进行求解即可.
【详解】(1)
,
,
所以,
因此,
所以关于的线性回归方程;
(2)把代入中,得,
所以预测明年利润为万元.
17.(25-26高二下·全国·单元测试)近期,某市公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如表所示:
1
2
3
4
5
6
7
6
11
21
34
66
101
196
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的经验回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立关于的回归方程,并预测活动推出第8天使用扫码支付的人次.
[参考数据:,,,,,其中,]
【答案】(1)适宜
(2),347十人次
【分析】(1)根据散点图判断即可.
(2)对两边同时取常用对数,得,进而转化为线性关系,再根据已知数据计算回归方程,并代入数据检验即可.
【详解】(1)由散点图,得适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型.
(2)由,两边同时取常用对数,得,
设,则,由,,
得,,
因此,即,则,
当时,得,
所以y关于x的回归方程为,活动推出第8天使用扫码支付的人次为347十人次.
18.(25-26高二上·江西南昌·期末)某车间为了确定合理的工时定额,需要确定加工零件所花费的时间,为此做了五次试验,得到数据如下:
零件的个数(个)
1
2
3
4
5
加工的时间(小时)
1.5
2.4
3.2
3.9
4.5
(1)求出关于的回归方程;
(2)试预测加工9个零件需要多少时间?
参考公式:,
【答案】(1)
(2)
【分析】(1)根据参考公式:,计算即可;
(2)将代入回归直线方程求的即可.
【详解】(1)由表中数据得:,,,
则,,
所以回归直线方程为.
(2)将代入回归直线方程得,,
所以预测加工9个零件需要小时.
19.(24-25高二下·辽宁鞍山·期末)自2021年起,我国居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表所示:
年份
2021
2022
2023
2024
2025
时间代号
1
2
3
4
5
储蓄存款(千亿元)
4.76
4.61
5.32
5.41
5.38
(表中部分数据已精确至0.0001,表中数据可直接代入公式进行运算) 可能用到的估计值:,,
9
25.9692
130.4246
78.48
1554.2872
(1)求关于的回归方程;
(2)用(1)所求回归方程预测该地2027年()的人民币储蓄存款额;
(3)求样本的相关系数.(精确至0.01)
附:,,
【答案】(1)
(2)5.912
(3)0.85
【分析】利用最小二乘法求出回归方程的系数,再代入方程预测未来值,最后通过协方差和标准方差计算相关系数.
【详解】(1),,
,,,
,
.
所以.
(2)当时,.
(3)
1
学科网(北京)股份有限公司
$