内容正文:
11一元线性回归模型及其应用(人教2019A版专用)
目录
【自学概念】 2
【自学考点】 3
考点一:一元线性回归模型 3
考点二:一元线性回归模型参数的最小二乘法 7
【自学检测】 12
自学概念
1. 一元线性回归模型
(1)我们称为Y关于x的一元线性回归模型,其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
(2)将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中==,且=-.
2. 残差分析
(1)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(2)残差图中,若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(3)R2的计算公式为R2=1-.在R2表达式中, (yi-)2与经验回归方程无关,残差平方和 (yi-i)2与经验回归方程有关.因此R2越大,表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟合效果越差.
自学考点
考点一:一元线性回归模型
一、单选题
1.(23-24高二上·江西·期末)根据3对数据,,绘制的散点图知,样本点呈直线趋势,且线性回归方程为,则( )
A.11 B.10 C.9 D.8
2.(23-24高二下·河南南阳·阶段练习)某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出下面的散点图,该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的是( )
A.变量与负相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.变量与有较强的线性相关性
D.若选择模型二,的图象不一定经过点
3.(24-25高三上·天津河东·期中)第19届亚运会的吉祥物琮琮、莲莲、宸宸深受大家喜爱,某商家统计了最近5个月销量,如下表所示:( )
时间
1
2
3
4
5
销售量/万只
5
4.5
4
3.5
2.5
若与线性相关,且线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,变量与负相关
B.当时,残差为0.2
C.可以预测当时销量约为2.1万只
D.线性回归方程中
二、多选题
4.(21-22高二下·福建莆田·期末)为预测某电子商务平台2022年的销售额(单位:亿元),建立了年销售额y与年份代码x的两个回归模型,根据该平台2012年至2021年的数据(年份代码x的值依次为1,2,…,10)作出散点图,建立模型①:和模型②:,如下图,则下列说法正确的是( )
A.模型②更适合作为回归模型
B.年销售额y与年份代码x呈正相关关系
C.根据模型②计算得,当时,,可预测该平台2022年的年销售额为6252亿元
D.若模型①过样本中心,该平台2012年至2021年间年销售额的平均值为1845亿元,则
5.(2024高三·全国·专题练习) (多选)下列说法中正确的有( )
A.经验回归直线必过点
B.经验回归直线就是散点图中经过样本数据点最多的那条直线
C.当样本相关系数时,两个变量正相关
D.如果两个变量的相关性越弱,则就越接近于0
6.(24-25高三上·江苏常州·阶段练习)下列说法中,正确的是( )
A.某组数据的经验回归方程一定过点
B.数据,,,,,,19,的分位数是
C.甲、乙、丙三种个体按的比例分层抽样,如果抽取的乙个体数为6,则样本容量为18
D.若一组数据的方差为16,则另一组数据的方差为4
三、填空题
7.(2023·四川德阳·一模)某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度的部分数据如下表:
温度
4
8
10
18
微生物数量(个)
30
22
18
14
由表中数据算得回归方程为,预测当温度为时,微生物数量为 个.
8.(23-24高二下·河南·阶段练习)已知根据下表数据用最小二乘法得到关于的线性回归方程为,则 .
2
3
4
5
1.1
1.9
4.2
5.5
9.(24-25高三上·广东江门·阶段练习)已知,之间的一组数据:若与满足经验回归方程,则此曲线必过点 .
x
y
四、解答题
10.(23-24高二下·宁夏银川·阶段练习)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
参考数据
17713
714
27
81.3
(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度()的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出关于的回归方程.(计算结果精确到0.1)
附:回归方程中
11.(23-24高二下·宁夏石嘴山·期中)红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度()的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
25
2.9
646
168
422688
50.4
70308
表中;;;
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)根据(1)中所选择的模型,求出关于的回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,,
12.(23-24高二下·河南南阳·期末)扬子鳄是中国特有的一种小型鳄类,是国家一级重点保护野生动物,活动区域主要在长江下游流域.研究人员为了解扬子鳄的生长发育情况,随机抽取了6只扬子鳄,测量它们的头长(单位与体长(单位:),得到如下数据:
样本编号
1
2
3
4
5
6
头长
15
15.3
15.3
16.6
16.8
17
体长
125
128
130
138
142
153
并计算得
(1)求这6只扬子鳄的平均头长与平均体长;
(2)求扬子鳄的头长与体长的样本相关系数;(精确到0.01)
(3)已知与可以用模型进行拟合,若某只扬子鳄的头长为,利用所给数据估计这只扬子鳄的体长.
附:相关系数.
考点二:一元线性回归模型参数的最小二乘法
一、单选题
1.(23-24高三上·湖南邵阳·阶段练习)某品牌手机商城统计了开业以来前5个月的手机销量情况如下表所示:
时间x
1
2
3
4
5
销售量y(千只)
0.5
0.7
1.0
1.2
1.6
若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,变量y与x正相关
B.线性回归方程中,
C.时,残差为0.06
D.可以预测时,该商场手机销量约为1.81千只
2.(2023·河北衡水·一模)某新能源汽车生产公司,为了研究某生产环节中两个变量之间的相关关系,统计样本数据得到如下表格:
由表格中的数据可以得到与的经验回归方程为,据此计算,下列选项中残差的绝对值最小的样本数据是( )
A. B.
C. D.
3.(24-25高二上·黑龙江哈尔滨·期中)下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
二、多选题
4.(24-25高三上·浙江·阶段练习)某地区5家超市销售额(单位:万元)与广告支出(单位:万元)有如下一组数据:
超市
A
B
C
D
E
广告支出(万元)
1
4
6
10
14
销售额(万元)
6
20
36
40
48
下列说法正确的是( )
参考公式:样本相关系数
A.根据表中数据计算得到与之间的经验回归方程为,则
B.与之间的样本相关系数
C.若残差的平方和越小,则模型的拟合效果越好
D.若该地区某超市的广告支出是3万元,则该超市的销售额一定是17.6万元
5.(2023·辽宁·模拟预测)随着我国碳减排行动的逐步推进,我国新能源汽车市场快速发展,新能源汽车产销量大幅上升,2017-2021年全国新能源汽车保有量y(单位:万辆)统计数据如下表所示:
年份
2017年
2018年
2019年
2020年
2021年
年份代码x
1
2
3
4
5
保有量y/万辆
153.4
260.8
380.2
492
784
由表格中数据可知y关于x的经验回归方程为,则( )
A.
B.预测2023年底我国新能源汽车保有量高于1000万辆
C.2017-2021年全国新能源汽车保有量呈增长趋势
D.2021年新能源汽车保有量的残差(观测值与预测值之差)为71.44
6.(24-25高三上·四川绵阳·阶段练习)已知变量和变量的一组成对样本数据的散点落在一条直线附近,,,相关系数为,线性回归方程为,则( )
参考公式:,
A.当时,
B.当越大时,成对样本数据的线性相关程度越强
C.,时,成对样本数据的相关系数满足
D.,时,成对样本数据的线性回归方程满足
三、填空题
7.(2024·江西·一模)已知变量y与x线性相关,由样本点求得的回归方程为,若点在回归直线上,且,,则 .
8.(2024·上海宝山·二模)某公司为了了解某商品的月销售量单位:万件与月销售单价单位:元件之间的关系,随机统计了个月的销售量与销售单价,并制作了如下对照表:
月销售单价元件
月销售量万件
由表中数据可得回归方程中,试预测当月销售单价为元件时,月销售量为 万件.
9.(2023·山东·模拟预测)某公司在2016-2021年的销售额(万元)如下表,根据表中数据用最小二乘法得到的回归方程为.
2016
2017
2018
2019
2020
2021
则当关于的表达式取最小值时, .
四、解答题
10.(24-25高三上·江苏徐州·期中)下表提供了某厂进行技术改造后生产产品过程中记录的产能(单位:)与相应的生产能耗(单位:标准煤)的几组对应数据:
3
4
5
6
标准煤
3.5
4
5
5.5
(1)求关于的经验回归方程;
(2)已知该厂技术改造前产品的生产能耗为标准煤,试根据(1)中求出的经验回经验回归方程,预测该厂技术改造后产品的生产能耗比技术改造前降低了多少标准煤.
参考公式:
11.(24-25高三上·广东·阶段练习)仙人掌别名老鸦舌,神仙掌,这一独特的仙人掌科草本植物,以其顽强的生命力和独特的形态在自然界中独树一帜,以其形似并拢手指的手掌,且带有刺的特征而得名.仙人掌不仅具有极高的观赏价值,还具有一定的药用价值,被誉为“夜间氧吧”,其根茎深入土壤或者干燥的黄土中使其能够吸收足够多的水分进行储藏来提高生存能力,我国某农业大学植物研究所相关人员为了解仙人掌的植株高度y(单位:cm),与其根茎长度x(单位:cm)之间是否存在线性相关的关系,通过采样和数据记录得到如下数据:
样本编号
1
2
3
4
根茎长度
10
12
14
16
植株高度
62
86
112
132
参考数据:.
(1)由上表数据计算相关系数,并说明是否可用线性回归模型拟合与的关系(若,则可用线性回归模型拟合,计算结果精确到0.001);
(2)求关于的线性回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为.
12.(24-25高三上·新疆喀什·阶段练习)某机构统计了新驾驶员一年内扣除的驾照分(单位:分)及该年对应的新驾驶员数量(单位:万人),得到如下数据表格:
新驾驶员一年内扣除的驾照分(分)
3
4
5
6
7
新驾驶员数量(万人)
1
1.1
1.5
1.9
2.2
已知与线性相关.
(1)求关于的线性回归方程;
(2)求与的相关系数(精确到0.01).
参考数据:.
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为
自学检测
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(22-23高三下·浙江杭州·阶段练习)某公司在x年的销售额(万元)如下表,根据表中数据用最小二乘法得到的回归方程为,则当关于a,b的表达式取到最小值时,( )
x
2017
2018
2019
2020
2021
2022
A.5 B.13
C.8059 D.8077
2.(24-25高三上·云南普洱·阶段练习)近日我国相关企业研究表明,随着锂离子电池充放电循环次数的增加,电池内阻增大,可用容量和能量衰减,削弱了电动汽车的续航里程.相关科研团队利用数学建模的方法构建理离子电池充放电循环次数单位:百次与锂离子电池性能指数的回归模型,通过实验得到部分数据如下表:
充放电循环次数x
3
4
5
6
电池性能指数y
91
88
82
79
由上表中的数据求得回归方程为,则计算可得( )(参考公式及数据:,)
A. B. C. D.
3.(24-25高二上·黑龙江哈尔滨·期中)某学校为了解校庆期间不同时段的校门人流量,从上午8点开始第一次反馈校门人流量,以后每过2小时反馈一次,共统计了前3次的数据,其中,2,3,为第i次人流量数据(单位:千人),由此得到y关于i的回归方程.已知,根据回归方程,可预测下午2点时校门人流量为( )千人.
参考数据:
A.9.6 B.10.8 C.12 D.13.2
4.(24-25高二上·河南南阳·阶段练习)某产品的广告费用与销售额的统计数据如下表:
广告费用/万元
4
2
3
5
销售额/万元
49
26
39
54
根据上表可得线性回归方程 中的为9.4,据此模型预测广告费用为6万元时销售额为( )
A.9.1万元 B.9.2万元
C.67.7万元 D.65.5万元
5.(23-24高三上·广东广州·期中)某学校数学兴趣小组在探究姜撞奶随着时间变化的降温及凝固情况的数学建模活动中,将时间分钟与温度(摄氏度)的关系用模型(其中为自然对数的底数)拟合.设,变换后得到一组数据:
2
2.5
3
3.5
4
4.04
4.01
3.98
3.96
3.91
由上表可得线性回归方程,则等于( )
A.-4 B. C.4.16 D.
6.(23-24高三上·内蒙古呼和浩特·期末)用模型拟合一组数据组,其中,设,得变换后的线性回归方程为,则( )
A. B. C.35 D.21
7.(23-24高三上·四川成都·期中)某公司一种型号的产品近期销售情况如表:
月份
2
3
4
5
6
销售额(万元)
15.1
16.3
17.0
17.2
18.4
根据上表可得到回归直线方程,据此估计,该公司7月份这种型号产品的销售额为( )
A.18.85万元 B.19.3万元 C.19.25万元 D.19.05万元
8.(24-25高二下·全国·单元测试)小明同学在做市场调查时得到如下样本数据:
x
1
3
6
10
y
8
a
4
2
他由此得到回归直线方程为,则下列说法不正确的是( )
A.变量x与y线性负相关 B.当时可以估计
C. D.变量x与y之间是函数关系
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(23-24高三下·全国·阶段练习)某个国家某种病毒传播的中期,感染人数和时间(单位:天)在18天里的散点图如图所示,下面四个回归方程类型中有可能适宜作为感染人数和时间的回归方程类型的是( )
A. B. C. D.
10.(23-24高二上·全国·单元测试)如图是从2013年到2018年六年间我国公共图书馆业机构数与对应年份编号的散点图(为便于计算,将2013年编号为1,2014年编号为2,…,2018年编号为6,把每年的公共图书馆业机构数作为预报变量,把年份编号作为解释变量进行回归分析),得到回归直线方程为,其相关系数,下列结论正确的是( )
A.公共图书馆业机构数与年份编号的正相关性较强
B.在2014—2018年间,2016年公共图书馆业机构数增加量最多
C.公共图书馆业机构数平均每年约增加14
D.可预测2022年公共图书馆业机构数为3232
11.(22-23高三上·江苏常州·阶段练习)某小区通过开设公益讲座以提高居民的环境保护意识,为了解讲座的效果,随机抽取10位小区居民,让他们在讲座前和讲座后各回答一份环境保护的知识问卷,这10位小区居民在讲座前和讲座后问卷答题的正确率如图所示,则以下结论正确的是( )
A.讲座前问卷答题的正确率的中位数大于
B.讲座后问卷答题的正确率的极差小于讲座前问卷答题的正确率的极差
C.讲座前问卷答题的正确率的方差大于讲座后问卷答题的正确率的方差
D.讲座后问卷答题的正确率的平均数大于
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(2022·四川成都·模拟预测)假设关于某设备的使用年限和所支出的维修费用万元统计数据如下:
使用年限
维修费用
若有数据知对呈线性相关关系.其线形回归方程为,请估计使用年时的维修费用是 万元.
13.(2024·四川成都·模拟预测)已知关于x的一组数据:
x
1
m
3
4
5
y
0.5
0.6
n
1.3
1.4
根据表中数据得到的线性回归直线方程为,则的值 .
14.(23-24高二下·江苏苏州·期末)已知随机变量,的五组观测数据如下表:
1
2
3
4
5
由表中数据通过模型得到经验回归方程为,则实数的值为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (24-25高三上·江苏常州·期中)某研究性学习小组为研究两个变量x和y之间的关系,测量了对应的五组数据如下表:
2
3
4
5
6
4
7
12
13
14
(1)求y关于x的经验回归方程;
(2)请估计时,对应的y值.
附:在经验回归方程中,,其中为样本平均值.
16. (15分) (2023·陕西榆林·一模)为了研究美国人用餐消费与小费支出的关系,随机抽取了7位用餐顾客进行调查,得样本数据如下:
消费(单元:美元)
32
40
50
86
63
100
133
小费(单位:美元)
5
6
7
9
8
9
12
相关公式:,.
参考数据:,.
(1)求小费(单位:美元)关于消费(单位:美元)的线性回归方程(其中的值精确到0.001);
(2)试用(1)中的回归方程估计当消费200美元时,要付多少美元的小费(结果精确到整数)?
17. (15分) (23-24高三上·河南焦作·阶段练习)有人收集了春节期间平均气温与某取暖商品销售额的有关数据,如下表所示.
平均气温
-3
-4
-5
-6
-7
销售额/万元
20
23
27
30
50
(1)根据以上数据,用最小二乘法求出回归方程;
(2)预测平均气温为时,该商品的销售额为多少万元.
18. (17分) (24-25高三上·四川达州·开学考试)近些年来,促进新能源汽车产业发展政策频出,新能源市场得到很大发展,销量及渗透率远超预期,新能源几乎成了各个汽车领域的热点.在对某品牌10个子工厂投资及利润的统计后,得到如下表格,分别表示第个子工厂的投资(单位:万元)和纯利润(单位:万元).
投入万元
32
31
33
36
37
38
39
43
45
46
纯利润万元
25
30
34
37
39
41
42
44
48
50
(1)依据表中的统计数据,请判断投资与纯利润是否具有较强的线性相关程度?(参考:若,则线性相关程度一般;若,则线性相关程度较强.计算时精确度为0.01)
(2)求关于的经验回归方程(精确到0.01).
参考数据:,.
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为.
19. (17分) (2024·广东·模拟预测)某大学生参加社会实践活动,对某公司月份至月份销售某种配件的销售量及销售单价进行了调查,销售单价和销售量之间的一组数据如下表所示:
月份
销售单价元
销售量件
(1)根据至月份的数据,求出关于的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过元,则认为所得到的回归直线方程是理想的,试问中所得到的回归直线方程是否理想?
(3)预计在今后的销售中,销售量与销售单价仍然服从中的关系,若该种机器配件的成本是元件,那么该配件的销售单价应定为多少元才能获得最大利润?注:利润销售收入成本.
参考公式:回归直线方程,其中,
学科网(北京)股份有限公司
$$
11一元线性回归模型及其应用(人教2019A版专用)
目录
【自学概念】 2
【自学考点】 3
考点一:一元线性回归模型 3
考点二:一元线性回归模型参数的最小二乘法 12
【自学检测】 22
自学概念
1. 一元线性回归模型
(1)我们称为Y关于x的一元线性回归模型,其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
(2)将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中==,且=-.
2. 残差分析
(1)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(2)残差图中,若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(3)R2的计算公式为R2=1-.在R2表达式中, (yi-)2与经验回归方程无关,残差平方和 (yi-i)2与经验回归方程有关.因此R2越大,表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟合效果越差.
自学考点
考点一:一元线性回归模型
一、单选题
1.(23-24高二上·江西·期末)根据3对数据,,绘制的散点图知,样本点呈直线趋势,且线性回归方程为,则( )
A.11 B.10 C.9 D.8
2.(23-24高二下·河南南阳·阶段练习)某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出下面的散点图,该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的是( )
A.变量与负相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.变量与有较强的线性相关性
D.若选择模型二,的图象不一定经过点
3.(24-25高三上·天津河东·期中)第19届亚运会的吉祥物琮琮、莲莲、宸宸深受大家喜爱,某商家统计了最近5个月销量,如下表所示:( )
时间
1
2
3
4
5
销售量/万只
5
4.5
4
3.5
2.5
若与线性相关,且线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,变量与负相关
B.当时,残差为0.2
C.可以预测当时销量约为2.1万只
D.线性回归方程中
二、多选题
4.(21-22高二下·福建莆田·期末)为预测某电子商务平台2022年的销售额(单位:亿元),建立了年销售额y与年份代码x的两个回归模型,根据该平台2012年至2021年的数据(年份代码x的值依次为1,2,…,10)作出散点图,建立模型①:和模型②:,如下图,则下列说法正确的是( )
A.模型②更适合作为回归模型
B.年销售额y与年份代码x呈正相关关系
C.根据模型②计算得,当时,,可预测该平台2022年的年销售额为6252亿元
D.若模型①过样本中心,该平台2012年至2021年间年销售额的平均值为1845亿元,则
5.(2024高三·全国·专题练习) (多选)下列说法中正确的有( )
A.经验回归直线必过点
B.经验回归直线就是散点图中经过样本数据点最多的那条直线
C.当样本相关系数时,两个变量正相关
D.如果两个变量的相关性越弱,则就越接近于0
6.(24-25高三上·江苏常州·阶段练习)下列说法中,正确的是( )
A.某组数据的经验回归方程一定过点
B.数据,,,,,,19,的分位数是
C.甲、乙、丙三种个体按的比例分层抽样,如果抽取的乙个体数为6,则样本容量为18
D.若一组数据的方差为16,则另一组数据的方差为4
三、填空题
7.(2023·四川德阳·一模)某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度的部分数据如下表:
温度
4
8
10
18
微生物数量(个)
30
22
18
14
由表中数据算得回归方程为,预测当温度为时,微生物数量为 个.
8.(23-24高二下·河南·阶段练习)已知根据下表数据用最小二乘法得到关于的线性回归方程为,则 .
2
3
4
5
1.1
1.9
4.2
5.5
9.(24-25高三上·广东江门·阶段练习)已知,之间的一组数据:若与满足经验回归方程,则此曲线必过点 .
x
y
四、解答题
10.(23-24高二下·宁夏银川·阶段练习)红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数(个)和平均温度有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
参考数据
17713
714
27
81.3
(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适合作为平均产卵数(个)关于平均温度()的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出关于的回归方程.(计算结果精确到0.1)
附:回归方程中
11.(23-24高二下·宁夏石嘴山·期中)红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度()的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
25
2.9
646
168
422688
50.4
70308
表中;;;
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)根据(1)中所选择的模型,求出关于的回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,,
12.(23-24高二下·河南南阳·期末)扬子鳄是中国特有的一种小型鳄类,是国家一级重点保护野生动物,活动区域主要在长江下游流域.研究人员为了解扬子鳄的生长发育情况,随机抽取了6只扬子鳄,测量它们的头长(单位与体长(单位:),得到如下数据:
样本编号
1
2
3
4
5
6
头长
15
15.3
15.3
16.6
16.8
17
体长
125
128
130
138
142
153
并计算得
(1)求这6只扬子鳄的平均头长与平均体长;
(2)求扬子鳄的头长与体长的样本相关系数;(精确到0.01)
(3)已知与可以用模型进行拟合,若某只扬子鳄的头长为,利用所给数据估计这只扬子鳄的体长.
附:相关系数.
参考答案:
题号
1
2
3
4
5
6
答案
B
D
B
ABC
ACD
ACD
1.B
【分析】由回归方程比过样本中心点即可列方程求解.
【详解】由已知,得,,又经过点,所以,解得.
故选:B.
2.D
【分析】对于ABC,由散点图的变化趋势分析判断;对于D,由线性回归方程的性判断.
【详解】对于 A,由散点图可知 随年份 的增大而增大,所以变量 与 正相关,所以 A 错误;
对于 BC,由散点图可知变量 与 的变化趋向于一条曲线,所以模型二能更好地 拟合 GDP 值随年份的变化情况,所以 B 错误,C错误;
对于 D,若选择模型二:,令,则的图像一定过点,不一定过点,故D正确.
故选:D.
3.B
【分析】对于选项A,利用表中数据变化情况或看回归方程的正负均可求解;对于选项B,利用样本中心点求出线性回归方程,再利用回归方程即可求出预测值,进而可求出残差;对于选项C,利用回归方程即可求出预测值;对于选项D,利用回归方程一定过样本中心点即可求解.
【详解】对于选项A,从数据看,随的增大而减小,所以变量与负相关,
故正确,A不符合题意;
对于选项B,由表中数据知,,
所以样本中心点为,将样本中心点代入中得,
所以线性回归方程为,
所以,残差,故错误,B符合题意;
对于选项C,当时销量约为(万只),故正确,C不符合题意;
对于选项D,由B选项可知,故正确,D不符合题意.
故选:B.
4.ABC
【分析】由散点图可判断选项A,B,结合回归方程可判断选项C,D.
【详解】由散点图可知年销售额y与年份代码x呈正相关关系;模型②更适合作为回归模型,故选项A,B正确.
当时,
当时,对应的年份为2022,可预测该平台2022年的年销售额为6252亿元,故选项C正确.
,解得,故选项D不正确.
故选:ABC
5.ACD
【分析】A选项,经验回归直线必过样本中心点,A正确;B选项,根据经验回归方程的定义知B错误;CD选项,由相关系数的定义知CD选项正确.
【详解】对于A,经验回归直线必过点,故A正确;
对于B,经验回归直线在散点图中可能不经过任一样本数据点,故B不正确;
对于C,当样本相关系数时,则两个变量正相关,故C正确;
对于D,如果两个变量的相关性越弱,则就越接近于0,故D正确.
故选:ACD
6.ACD
【分析】根据经验回归方程必过样本中心点即可判断A;根据百分位数的定义即可判断B;根据分层抽样的性质即可判断C;根据方差的性质即可判断D.
【详解】对于A,经验回归方程必过样本中心点,故A正确;
对于B,将数据按从小到大的顺序排列为,
因为,
所以分位数是,故B错误;
对于C,由题意,各层人数分别为,
所以样本容量为18,故C正确;
对于D,若一组数据的方差为16,
则另一组数据的方差为,故D正确.
故选:ACD.
7.9
【分析】求出样本点中心,代入回归方程得到,得回归方程,可进行预测.
【详解】由表格数据可知,,,
因为点在直线上,所以,
即,故当时,,
即预测当温度为时,微生物数量为9个.
故答案为:9
8.3.3
【分析】根据给定的数表求出样本的中心点,再利用回归直线方程求出值.
【详解】由数表知,,,
由回归直线过点,得,即,
所以.
故答案为:3.3
9.
【分析】设,则,根据回归方程性质可得回归直线所过定点.
【详解】由已知,
设,则,
由回归直线性质可得在直线上,
又,,
所以点在直线上,故点在曲线上.
故答案为:.
10.(1)更适宜
(2)
【分析】(1)根据指数型函数图象的特征、一次函数图象的特征进行判断即可;
(2)运用对数的运算性质,结合题中所给的公式进行求解即可.
【详解】(1)由散点图可以判断,随温度升高,产卵数增长速度变快,符合指数函数模型的增长,
所以更适宜作为平均产卵数关于平均温度的回归方程类型.
(2)将两边同时取自然对数,可得,
由题中的数据可得,,
所以,则,
所以关于的线性回归方程为,故关于的回归方程为;
11.(1)①;
(2).
【分析】(1)根据残差点的分布情况分析即可;
(2)取对数,将非线性回归转化为线性回归,然后根据所给数据代入公式即可得回归方程.
【详解】(1)模型①更合适.
模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,
所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适.
(2)令与温度x可以用线性回归方程来拟合,则.
,
则关于的线性回归方程为,即,
产卵数y关于温度x的回归方程为.
12.(1)16cm,136cm
(2)0.94
(3).
【分析】(1)利用平均值公式求解即可;
(2)利用相关系数公式求解即可;
(3)先利用自变量和因变量的均值均在回归曲线上,求解出,进而估计这只扬子鳄的体长.
【详解】(1)平均头长为,
平均体长为.
(2)由题可知
(3)由题意知.所以,
所以,令,得,
因此估计这只扬子鳄的体长为.
考点二:一元线性回归模型参数的最小二乘法
一、单选题
1.(23-24高三上·湖南邵阳·阶段练习)某品牌手机商城统计了开业以来前5个月的手机销量情况如下表所示:
时间x
1
2
3
4
5
销售量y(千只)
0.5
0.7
1.0
1.2
1.6
若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,变量y与x正相关
B.线性回归方程中,
C.时,残差为0.06
D.可以预测时,该商场手机销量约为1.81千只
2.(2023·河北衡水·一模)某新能源汽车生产公司,为了研究某生产环节中两个变量之间的相关关系,统计样本数据得到如下表格:
由表格中的数据可以得到与的经验回归方程为,据此计算,下列选项中残差的绝对值最小的样本数据是( )
A. B.
C. D.
3.(24-25高二上·黑龙江哈尔滨·期中)下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
二、多选题
4.(24-25高三上·浙江·阶段练习)某地区5家超市销售额(单位:万元)与广告支出(单位:万元)有如下一组数据:
超市
A
B
C
D
E
广告支出(万元)
1
4
6
10
14
销售额(万元)
6
20
36
40
48
下列说法正确的是( )
参考公式:样本相关系数
A.根据表中数据计算得到与之间的经验回归方程为,则
B.与之间的样本相关系数
C.若残差的平方和越小,则模型的拟合效果越好
D.若该地区某超市的广告支出是3万元,则该超市的销售额一定是17.6万元
5.(2023·辽宁·模拟预测)随着我国碳减排行动的逐步推进,我国新能源汽车市场快速发展,新能源汽车产销量大幅上升,2017-2021年全国新能源汽车保有量y(单位:万辆)统计数据如下表所示:
年份
2017年
2018年
2019年
2020年
2021年
年份代码x
1
2
3
4
5
保有量y/万辆
153.4
260.8
380.2
492
784
由表格中数据可知y关于x的经验回归方程为,则( )
A.
B.预测2023年底我国新能源汽车保有量高于1000万辆
C.2017-2021年全国新能源汽车保有量呈增长趋势
D.2021年新能源汽车保有量的残差(观测值与预测值之差)为71.44
6.(24-25高三上·四川绵阳·阶段练习)已知变量和变量的一组成对样本数据的散点落在一条直线附近,,,相关系数为,线性回归方程为,则( )
参考公式:,
A.当时,
B.当越大时,成对样本数据的线性相关程度越强
C.,时,成对样本数据的相关系数满足
D.,时,成对样本数据的线性回归方程满足
三、填空题
7.(2024·江西·一模)已知变量y与x线性相关,由样本点求得的回归方程为,若点在回归直线上,且,,则 .
8.(2024·上海宝山·二模)某公司为了了解某商品的月销售量单位:万件与月销售单价单位:元件之间的关系,随机统计了个月的销售量与销售单价,并制作了如下对照表:
月销售单价元件
月销售量万件
由表中数据可得回归方程中,试预测当月销售单价为元件时,月销售量为 万件.
9.(2023·山东·模拟预测)某公司在2016-2021年的销售额(万元)如下表,根据表中数据用最小二乘法得到的回归方程为.
2016
2017
2018
2019
2020
2021
则当关于的表达式取最小值时, .
四、解答题
10.(24-25高三上·江苏徐州·期中)下表提供了某厂进行技术改造后生产产品过程中记录的产能(单位:)与相应的生产能耗(单位:标准煤)的几组对应数据:
3
4
5
6
标准煤
3.5
4
5
5.5
(1)求关于的经验回归方程;
(2)已知该厂技术改造前产品的生产能耗为标准煤,试根据(1)中求出的经验回经验回归方程,预测该厂技术改造后产品的生产能耗比技术改造前降低了多少标准煤.
参考公式:
11.(24-25高三上·广东·阶段练习)仙人掌别名老鸦舌,神仙掌,这一独特的仙人掌科草本植物,以其顽强的生命力和独特的形态在自然界中独树一帜,以其形似并拢手指的手掌,且带有刺的特征而得名.仙人掌不仅具有极高的观赏价值,还具有一定的药用价值,被誉为“夜间氧吧”,其根茎深入土壤或者干燥的黄土中使其能够吸收足够多的水分进行储藏来提高生存能力,我国某农业大学植物研究所相关人员为了解仙人掌的植株高度y(单位:cm),与其根茎长度x(单位:cm)之间是否存在线性相关的关系,通过采样和数据记录得到如下数据:
样本编号
1
2
3
4
根茎长度
10
12
14
16
植株高度
62
86
112
132
参考数据:.
(1)由上表数据计算相关系数,并说明是否可用线性回归模型拟合与的关系(若,则可用线性回归模型拟合,计算结果精确到0.001);
(2)求关于的线性回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为.
12.(24-25高三上·新疆喀什·阶段练习)某机构统计了新驾驶员一年内扣除的驾照分(单位:分)及该年对应的新驾驶员数量(单位:万人),得到如下数据表格:
新驾驶员一年内扣除的驾照分(分)
3
4
5
6
7
新驾驶员数量(万人)
1
1.1
1.5
1.9
2.2
已知与线性相关.
(1)求关于的线性回归方程;
(2)求与的相关系数(精确到0.01).
参考数据:.
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为
参考答案:
题号
1
2
3
4
5
6
答案
B
C
D
AC
BCD
ACD
1.B
【分析】利用回归直线方程的概念一一判断求解.
【详解】对A,由图表可知,变量y与x正相关,
且,即变量y与x正相关,A正确;
对B,由图表数据可得,
因为样本中心满足回归直线,所以,解得,B错误;
对C,时,残差为,C正确;
对D,时,该商场手机销量约为千只,D正确;
故选:B.
2.C
【分析】根据最小二乘法可求得的值,从而得到经验回归方程;根据残差的求法依次验证各选项中的残差的绝对值即可.
【详解】由表格数据知:,,
,经验回归方程为;
对于A,残差的绝对值为;
对于B,残差的绝对值为;
对于C,残差的绝对值为;
对于D,残差的绝对值为;
残差绝对值最小的样本数据是.
故选:C.
3.D
【分析】根据经验回归方程、相关系数、决定系数、残差等知识确定正确答案.
【详解】对于A,经验回归方程是由最小二乘法计算出来的,它不一定经过其样本数据点,一定经过,所以A错误;
对于B,由相关系数的意义,当越接近1时,表示变量y与x之间的线性相关程度越强,所以B错误;
对于C,用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,所以C是错误;
对于D,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,
模型的拟合效果越好,故D正确.
故选:D.
4.AC
【分析】计算样本中心点并代入线性回归方程可得从而判断A,利用可判断B,由残差的概念可判断C,由线性回归方程只能进行数据估计可判断D.
【详解】由题意,,,
样本中心点为,代入中,可得,故A正确;
由,得,
,,
所以,故B错误;
由残差的计算可知,若残差的平方和越小,则模型的拟合效果越好,故C正确;
若该地区某超市的广告支出是3万元,则该超市的销售额估计值为(万元),但不一定是17.6万元,故D错误.
故选:AC.
5.BCD
【分析】因为经验回归方程为,恒过代入求出可判断A;将代入可判断B;由题知,2017-2021年全国新能源汽车保有量呈增长趋势可判断C;将x=5,计算出2021年新能源汽车保有量的预测值,求观测值与预测值之差可判断D.
【详解】由题得,,代入可得,A项错误;
2023年的年份代码为7,代入得,高于1000万辆,B项正确;
2017-2021年全国新能源汽车保有量呈增长趋势,C项显然正确;
将x=5,代入得,相应的残差为784-712.56=71.44,D项正确,
故选:BCD.
6.ACD
【分析】根据相关系数的正负、绝对值大小与变量相关性之间关系可知AB正误;根据,,代入相关系数和最小二乘法公式中,可知CD正误.
【详解】对于A,当时,变量和变量正相关,则,A正确;
对于B,当越大时,成对样本数据的线性相关程度越强;
当,时,对应的样本数据的线性相关程度更强,B错误;
对于C,当,时,不变且,
,C正确;
对于D,当,时,不变且,
,D正确.
故选:ACD.
7.6
【分析】依题意,可得点在回归直线上,求得,将条件代入回归方程求出,利用平均数公式即可求得.
【详解】由题意,点在回归直线上,代入可得,,解得,
因,且样本中心点在回归直线上,将条件代入得:,
故,解得.
故答案为:6.
8.
【分析】根据给定数表求出样本中心点,再代入回归直线求出参数即可求得结果.
【详解】依题意,,,
所以样本中心点坐标为,代入回归方程得,,
解得,
所以回归方程为,
当时,,
即当月销售单价为元件时,月销售量约为万件.
故答案为:
9.4067
【分析】根据题意结合最小二乘法可得取到最小值时,,换元令,分析运算即可.
【详解】根据题意结合最小二乘法可知:取到最小值时,,
令,即,
则取到最小,
即,所以.
故答案为:4067.
10.(1)
(2)
【分析】直接利用公式求解即可.
【详解】(1)
(2),即改造后预测生产能耗为
.
预测该厂改造后100t产品的生产能耗比技术改造前降低了标准煤.
11.(1),可用
(2)
【分析】(1)利用相关系数公式结合条件即得;
(2)根据最小二乘法可得线性回归直线方程.
【详解】(1)易得,
,
故.
则,故可用线性回归模型模拟.
(2),
,
故线性回归方程为.
12.(1)
(2)0.99
【分析】(1)代入公式,计算出,得到关于的线性回归方程;
(2)代入相关系数公式,求出答案.
【详解】(1)由,
有,
故关于的线性回归方程为.
(2)与的相关系数
.
自学检测
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(22-23高三下·浙江杭州·阶段练习)某公司在x年的销售额(万元)如下表,根据表中数据用最小二乘法得到的回归方程为,则当关于a,b的表达式取到最小值时,( )
x
2017
2018
2019
2020
2021
2022
A.5 B.13
C.8059 D.8077
2.(24-25高三上·云南普洱·阶段练习)近日我国相关企业研究表明,随着锂离子电池充放电循环次数的增加,电池内阻增大,可用容量和能量衰减,削弱了电动汽车的续航里程.相关科研团队利用数学建模的方法构建理离子电池充放电循环次数单位:百次与锂离子电池性能指数的回归模型,通过实验得到部分数据如下表:
充放电循环次数x
3
4
5
6
电池性能指数y
91
88
82
79
由上表中的数据求得回归方程为,则计算可得( )(参考公式及数据:,)
A. B. C. D.
3.(24-25高二上·黑龙江哈尔滨·期中)某学校为了解校庆期间不同时段的校门人流量,从上午8点开始第一次反馈校门人流量,以后每过2小时反馈一次,共统计了前3次的数据,其中,2,3,为第i次人流量数据(单位:千人),由此得到y关于i的回归方程.已知,根据回归方程,可预测下午2点时校门人流量为( )千人.
参考数据:
A.9.6 B.10.8 C.12 D.13.2
4.(24-25高二上·河南南阳·阶段练习)某产品的广告费用与销售额的统计数据如下表:
广告费用/万元
4
2
3
5
销售额/万元
49
26
39
54
根据上表可得线性回归方程 中的为9.4,据此模型预测广告费用为6万元时销售额为( )
A.9.1万元 B.9.2万元
C.67.7万元 D.65.5万元
5.(23-24高三上·广东广州·期中)某学校数学兴趣小组在探究姜撞奶随着时间变化的降温及凝固情况的数学建模活动中,将时间分钟与温度(摄氏度)的关系用模型(其中为自然对数的底数)拟合.设,变换后得到一组数据:
2
2.5
3
3.5
4
4.04
4.01
3.98
3.96
3.91
由上表可得线性回归方程,则等于( )
A.-4 B. C.4.16 D.
6.(23-24高三上·内蒙古呼和浩特·期末)用模型拟合一组数据组,其中,设,得变换后的线性回归方程为,则( )
A. B. C.35 D.21
7.(23-24高三上·四川成都·期中)某公司一种型号的产品近期销售情况如表:
月份
2
3
4
5
6
销售额(万元)
15.1
16.3
17.0
17.2
18.4
根据上表可得到回归直线方程,据此估计,该公司7月份这种型号产品的销售额为( )
A.18.85万元 B.19.3万元 C.19.25万元 D.19.05万元
8.(24-25高二下·全国·单元测试)小明同学在做市场调查时得到如下样本数据:
x
1
3
6
10
y
8
a
4
2
他由此得到回归直线方程为,则下列说法不正确的是( )
A.变量x与y线性负相关 B.当时可以估计
C. D.变量x与y之间是函数关系
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(23-24高三下·全国·阶段练习)某个国家某种病毒传播的中期,感染人数和时间(单位:天)在18天里的散点图如图所示,下面四个回归方程类型中有可能适宜作为感染人数和时间的回归方程类型的是( )
A. B. C. D.
10.(23-24高二上·全国·单元测试)如图是从2013年到2018年六年间我国公共图书馆业机构数与对应年份编号的散点图(为便于计算,将2013年编号为1,2014年编号为2,…,2018年编号为6,把每年的公共图书馆业机构数作为预报变量,把年份编号作为解释变量进行回归分析),得到回归直线方程为,其相关系数,下列结论正确的是( )
A.公共图书馆业机构数与年份编号的正相关性较强
B.在2014—2018年间,2016年公共图书馆业机构数增加量最多
C.公共图书馆业机构数平均每年约增加14
D.可预测2022年公共图书馆业机构数为3232
11.(22-23高三上·江苏常州·阶段练习)某小区通过开设公益讲座以提高居民的环境保护意识,为了解讲座的效果,随机抽取10位小区居民,让他们在讲座前和讲座后各回答一份环境保护的知识问卷,这10位小区居民在讲座前和讲座后问卷答题的正确率如图所示,则以下结论正确的是( )
A.讲座前问卷答题的正确率的中位数大于
B.讲座后问卷答题的正确率的极差小于讲座前问卷答题的正确率的极差
C.讲座前问卷答题的正确率的方差大于讲座后问卷答题的正确率的方差
D.讲座后问卷答题的正确率的平均数大于
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(2022·四川成都·模拟预测)假设关于某设备的使用年限和所支出的维修费用万元统计数据如下:
使用年限
维修费用
若有数据知对呈线性相关关系.其线形回归方程为,请估计使用年时的维修费用是 万元.
13.(2024·四川成都·模拟预测)已知关于x的一组数据:
x
1
m
3
4
5
y
0.5
0.6
n
1.3
1.4
根据表中数据得到的线性回归直线方程为,则的值 .
14.(23-24高二下·江苏苏州·期末)已知随机变量,的五组观测数据如下表:
1
2
3
4
5
由表中数据通过模型得到经验回归方程为,则实数的值为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (24-25高三上·江苏常州·期中)某研究性学习小组为研究两个变量x和y之间的关系,测量了对应的五组数据如下表:
2
3
4
5
6
4
7
12
13
14
(1)求y关于x的经验回归方程;
(2)请估计时,对应的y值.
附:在经验回归方程中,,其中为样本平均值.
16. (15分) (2023·陕西榆林·一模)为了研究美国人用餐消费与小费支出的关系,随机抽取了7位用餐顾客进行调查,得样本数据如下:
消费(单元:美元)
32
40
50
86
63
100
133
小费(单位:美元)
5
6
7
9
8
9
12
相关公式:,.
参考数据:,.
(1)求小费(单位:美元)关于消费(单位:美元)的线性回归方程(其中的值精确到0.001);
(2)试用(1)中的回归方程估计当消费200美元时,要付多少美元的小费(结果精确到整数)?
17. (15分) (23-24高三上·河南焦作·阶段练习)有人收集了春节期间平均气温与某取暖商品销售额的有关数据,如下表所示.
平均气温
-3
-4
-5
-6
-7
销售额/万元
20
23
27
30
50
(1)根据以上数据,用最小二乘法求出回归方程;
(2)预测平均气温为时,该商品的销售额为多少万元.
18. (17分) (24-25高三上·四川达州·开学考试)近些年来,促进新能源汽车产业发展政策频出,新能源市场得到很大发展,销量及渗透率远超预期,新能源几乎成了各个汽车领域的热点.在对某品牌10个子工厂投资及利润的统计后,得到如下表格,分别表示第个子工厂的投资(单位:万元)和纯利润(单位:万元).
投入万元
32
31
33
36
37
38
39
43
45
46
纯利润万元
25
30
34
37
39
41
42
44
48
50
(1)依据表中的统计数据,请判断投资与纯利润是否具有较强的线性相关程度?(参考:若,则线性相关程度一般;若,则线性相关程度较强.计算时精确度为0.01)
(2)求关于的经验回归方程(精确到0.01).
参考数据:,.
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为.
19. (17分) (2024·广东·模拟预测)某大学生参加社会实践活动,对某公司月份至月份销售某种配件的销售量及销售单价进行了调查,销售单价和销售量之间的一组数据如下表所示:
月份
销售单价元
销售量件
(1)根据至月份的数据,求出关于的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过元,则认为所得到的回归直线方程是理想的,试问中所得到的回归直线方程是否理想?
(3)预计在今后的销售中,销售量与销售单价仍然服从中的关系,若该种机器配件的成本是元件,那么该配件的销售单价应定为多少元才能获得最大利润?注:利润销售收入成本.
参考公式:回归直线方程,其中,
参考答案:
题号
1
2
3
4
5
6
7
8
9
10
答案
D
D
B
D
D
B
D
D
BD
AC
题号
11
答案
ABC
1.D
【分析】表达式表示的是样本点与回归直线方程的整体接近程度,故可根据此意义逆向分析的意义,结合条件即可解决之.
【详解】由题意得,,
表示样本点与回归直线的整体接近程度,
且由样本点构成的表为
k
1
2
3
4
5
6
对应的回归直线方程为:,
由表知,所以,
由题意可知:在散点图中,样本点是将样本点整体向左平移了2016个单位,
故取到最小值时,回归直线与必平行,则有,
所以,所以.
故选:D.
2.D
【分析】由是意,结合公式,利用最小二乘法,可得答案.
【详解】由,,
且,,
故
故选:D.
3.B
【分析】令,由,求出,得回归方程,可求预测值.
【详解】令,则,
,又,
由,得,所以,
则,
下午2点时对应,可得.
故选:B.
4.D
【分析】线性回归方程一定过样本中心,得到线性回归方程,然后带值求结果.
【详解】,,
∵线性归回方程经过样本中心,
∴,∴,
∴,当时,,
故选:D.
5.D
【分析】根据给定的数据求出样本中心点,求出即可.
【详解】由表格中数据,得,
则,解得,因此,
由两边取对数,得,又,
所以,即.
故选:D
6.B
【分析】求出,即,得到答案.
【详解】由题意得,
故,
即,
故,解得.
故选:B
7.D
【分析】根据题意,由回归直线方程过样本点的中心,即可求得,然后代入计算,即可得到结果.
【详解】由表中数据可得,,
因为回归直线过样本点的中心,所以,解得,
所以回归直线方程为,
则该公司7月份这种型号产品的销售额为万元.
故选:D
8.D
【分析】由回归系数,可判定A正确;当时,求得,可判定B正确;求得样本中心,代入回归直线方程,求得的值,可判定C正确;由回归直线方程的意义可判定D不正确.
【详解】对于A中,由回归直线方程,可得,
所以变量x与y线性负相关,所以A正确;
对于B中,当时,可得,所以B正确;
对于C中,由统计图表中的数据,可得,,
即样本中心为,代入回归直线方程,
可得,解得,所以C正确;
对于D中,变量x与y是线性负相关关系,不是函数关系,所以D不正确.
故选:D
9.BD
【分析】由题意结合所给图象的变化趋势,结合选项,即可求解.
【详解】根据图象可知,函数图象随着自变量的变大,函数值增长速度越来越快,
结合选项,可判定为指数函数或的特征.
故选:BD.
10.AC
【分析】
根据散点图和回归方程逐个分析判断即可.
【详解】
因为散点图中各点散布在从左下角到右上角的区域内,所以为正相关,因为接近于1,所以公共图书馆业机构数与年份编号的相关性较强,故A正确;
由图可知,在2014—2018年间,2015年公共图书馆业机构数增加量最多,故B错误;
因为回归直线的斜率为13.743,所以公共图书馆业机构数平均每年约增加14,故C正确;
将代入回归直线方程,解得,所以可预测2022年公共图书馆业机构数为,故D错误.
故选:AC
11.ABC
【分析】根据中位数、极差、方差、平均数等知识确定正确答案.
【详解】讲座前问卷答题的正确率排序为,
,中位数,A正确.
讲座前极差,讲座后极差,B正确.
讲座后,
所以D错误.
讲座前后比较:讲座前极差较大,并且讲座前数据较分散,所以讲座前方差较大,所以C正确.
故选:ABC
12.
【分析】求出,根据回归方程过求出,代入得解.
【详解】由题意可得,,
由回归方程过点可得,解得,
故方程为,
把代入可得,
故答案为:.
13.0.64
【分析】先计算出,代入回归直线方程,得到.
【详解】,,
又题意得在上,
故,故.
故答案为:0.64
14.
【分析】令,则,求出,再根据线性回归方程必过样本中心点即可得解.
【详解】令,
则,
因为,所以,
所以,解得.
故答案为:.
15.(1)
(2)
【分析】(1)根据回归方程的求法求得正确答案.
(2)利用回归方程求得预测值.
【详解】(1),
,
,所以回归方程为.
(2)时,.
16.(1)
(2)
【分析】(1)根据表中数据,计算、,求出、,写出回归方程;
(2)用(1)中的回归方程,计算时的值.
【详解】(1)依题意可得,
,
,
;
,
,
关于的线性回归方程为;
(2)由(1)可得当时,;
估计消费200美元时,要付美元的小费.
17.(1)
(2)56.8万元
【分析】(1)根据已知条件,结合最小二乘法,以及线性回归方程的特征,即可求解;
(2)利用(1)的线性回归方程,即可对销售额进行估计.
【详解】(1)由表中数据可知,,
,
,
故
故
(2)当时,万元.
故预测平均气温为时,该商品的销售额为56.8万元.
18.(1)是
(2)
【分析】(1)根据题中给出的数据,,代入相关系数公式即可求解;
(2)根据题中数据求出,然后求出,从而可求解.
【详解】(1)依题意知,,
所以相关系数,
所以与之间具有较强的线性相关关系.
(2)依题意知,
又因为,
所以,
所以,
所以关于的经验回归方程为.
19.(1)
(2)可以认为所得到的回归直线方程是不理想的
(3)该产品的销售单价定为元件时,获得的利润最大
【分析】(1)计算、,求出回归系数,写出回归直线方程;
(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想;
(3)求销售利润函数,根据二次函数的图象与性质求最大值即可.
【详解】(1)因为,
所以,
于是关于的回归直线方程为;
(2)当时,,
因为,
所以可以认为所得到的回归直线方程是不理想的;
(3)令销售利润为,
则,
因为,
,
当且仅当,即时,取最大值.
所以该产品的销售单价定为元件时,获得的利润最大.
学科网(北京)股份有限公司
$$