内容正文:
8.2.2一元线性回归模型参数的最小二乘估计
题型一 最小二乘法
1.对成对数据、、…、用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
2.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据.根据收集到的数据可知, 由最小二乘法求得回归直线方程为,则的值为( )
A.75 B.155.4 C.375 D.466.2
3.对具有线性相关关系的变量x,y,测得一组数据如下表,根据表中数据,利用最小二乘法得到回归直线方程,据此模型预测当时,y的估计值为( )
x
2
4
5
6
8
y
20
40
60
70
80
A.211.5 B.210.5 C.210 D.212.5
4.(多选题)某企业节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如表.现发现表中有个数据看不清,已知回归直线方程为,则下列说法错误的是( )
x
2
3
4
5
6
y
19
25
★
38
44
A.看不清的数据★的值为34
B.回归直线必经过点(4,★)
C.回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨
D.据此模型预测产量为7吨时,相应的生产能耗约为50.9吨
5.植物社团的同学观察一株植物的生长情况,为了解植物高度y(单位:厘米)与生长期x(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期x
3
9
11
17
植物高度y
2.4
3.4
3.8
5.2
由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为________厘米.
题型二 残差分析
1. 人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为M市统计的2024年11月至2025年3月这5个月该市AI电脑的月销量,其中x为月份代号,y(单位:万台)为AI电脑的月销量.
月份
2024年11月
2024年12月
2025年1月
2025年2月
2025年3月
月份代号x
1
2
3
4
5
月销量y
0.5
0.9
1
1.2
1.4
经过分析,y与x线性相关,且其线性回归方程为,则2025年3月的残差为( )
A. B. C.0.02 D.0.04
2.两个变量x和y之间具有较强的线性相关关系,且y关于x的经验回归方程为,由它计算出成对样本数据对应的残差为0.12(残差=观测值-预测值),则( )
A.0.28 B.0.56 C.0.34 D.0.48
3.(多选题)已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除这两点后重新求得的回归直线的斜率为1.2,则( )
A.变量x与y具有正相关关系 B.去除后的回归方程为
C.重新求得的回归直线必过点 D.去除后相应于样本点的残差为-0.05
4.(多选题)2025年6月18日,很多商场都在搞促销活动.某市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售价x(元)和销售量y(件)之间的一组数据如表所示:
x
90
95
100
105
110
y
11
10
8
6
5
用最小二乘法求得y关于x的回归直线是,相关系数,则下列说法正确的有( )
A.变量x与y负相关且相关性较强 B.
C.当时, D.相应于点的残差为-0.4
5.已知回归方程,而试验中的一组数据是,,,则其残差平方和是______.
题型三 非线性回归模型
1. 根据散点图可知,变量呈现非线性关系。为了进行线性回归分析,设,利用最小二乘法,得到线性回归方程,则( )
A.变量的估计值的最大值为 B.变量的估计值的最小值为
C.变量的估计值的最大值为 D.变量的估计值的最小值为
2.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性回归方程,则估计c,k的值分别( )
A.,0.6 B.,0.3 C.,0.2 D.,0.6
3.为研究某池塘中水生植物的覆盖水塘面积x(单位:)与水生植物的株数y(单位:株)之间的相关关系,收集了4组数据,用模型去拟合x与y的关系,设,x与z的数据如表格所示:得到x与z的线性回归方程,则( )
x
3
4
6
7
z
2
2.5
4.5
7
A.-2 B.-1 C. D.
4.已知变量y关于x的回归方程为,若对两边取自然对数,可以发现与x线性相关.现有一组数据如下表所示:
x
1
2
3
4
5
y
e
则当时,预测y的值为( )
A.8 B.9 C. D.
5.习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据图如下表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数的散点图如下
(1)请根据散点图判断,与中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第144天这株幼苗的高度(结果保留1位小数).
附:, 参考数据:
140
28
56
283
题型四 最小二乘估计的实际应用
1.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?
附:相关系数公式,回归方程中斜率和截距的最小二乘估计公式分别为:,.
2.平顶山市公安局交警支队依据《中华人民共和国道路交通安全法》第条规定:所有主干道路凡机动车途经十字口或斑马线,无论转弯或者直行,遇有行人过马路,必须礼让行人,违反者将被处以100元罚款,记3分的行政处罚.如表是本市一主干路段监控设备所抓拍的5个月内,机动车驾驶员不“礼让斑马线”行为统计数据:
月份
1
2
3
4
5
违章驾驶员人数
120
105
100
90
85
(1)请利用所给数据求违章人数y与月份x之间的回归直线方程?
(2)预测该路段7月份的不“礼让斑马线”违章驾驶员人数?
参考公式:,.
3.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据,如下表所示.
平均气温
-3
-4
-5
-6
-7
销售额/万元
20
23
27
30
50
(1)根据以上数据,用最小二乘法求出回归方程;
(2)预测平均气温为时,该商品的销售额为多少万元?
4.假设某农作物基本苗数x与有效穗数y之间存在相关关系,令测得5组数据如下:
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
(1)以x为解释变量,y为预报变量,画出散点图;
(2)求y与x之间的回归方程,并预报当基本苗数为56.7时的有效穗数;
(3)计算各组残差;
(4)求,并说明随机误差对有效穗数的影响占百分之几?
5.某农业大学组织部分学生进行作物栽培试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速度,达到预期标准,小明对自己培育的一株作物使用了营养液,现统计了使用营养液十天之内该作物的高度变化
天数x
1
2
3
4
5
6
7
8
9
10
作物高度y/cm
9
10
10
11
12
13
13
14
14
14
(1)观察散点图可知,天数x与作物高度y之间具有较强的线性相关性,用最小二乘法求出作物高度y关于天数x的线性回归方程(其中,用分数表示);
(2)小明测得使用营养液后第22天该作物的高度为,请根据(1)中的结果预测第22天该作物的高度的残差?
参考公式:.参考数据:.
1.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得回归直线方程为,若某同学根据上表中的前两组数据和,求得的直线方程为,则以下结论正确的是( )
A., B., C., D.,
2.变量x,y之间的相关数据如下表所示,其经验回归直线经过点,且相对于点的残差为0.2,则( )
x
9
9.5
10
10.5
11
y
11
10
m
6
5
A. B. C. D.残差和为0
3.(多选题)某农科所针对耕种深度x(单位:cm)与水稻每公顷产量(单位:t)的关系进行研究,所得部分数据如下表:
耕种深度x/cm
8
10
12
14
16
18
每公顷产量y/t
6
8
m
n
11
12
已知,用最小二乘法求出y关于x的经验回归方程:,,,数据在样本,的残差分别为,.
(参考数据:两个变量x,y之间的相关系数r为,参考公式:,,)则( )
A. B. C. D.
4.(多选题)为研究光照时长x(小时)和种子发芽数量y(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点P后,下列说法正确的是( )
A.相关系数变小 B.经验回归方程斜率变小
C.残差平方和变小 D.决定系数变小
5.随着科技的进步,近年来,我国新能源汽车产业迅速发展,2006年,在国家节能减排的宏观政策指导下,科技部在“十一五”启动了“863”计划新能源汽车重大项目.自2011年起,国家相关部门重点扶持新能源汽车的发展,也逐步得到消费者的认可.各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升.小张同学对某品牌新能源汽车近8年出售的数量及广告费投入情况进行了统计,具体数据见下表:
年份代码
1
2
3
4
5
6
7
8
年销售量/十万辆
3
4
5
6
7
9
10
12
广告费投入/亿元
3.6
4.1
4.4
5.2
6.2
7.5
7.9
9.1
(1)求广告费投入y(亿元)与年销售量x(十万辆)之间的线性回归方程(精确到0.01);
(2)若某人随机在甲、乙两家汽车店购买一辆汽车,如果在甲汽车店购买,那么购买新能源汽车的概率为0.6;如果在乙汽车店购买,那么购买新能源汽车的概率为0.8,求这个人购买的是新能源汽车的概率?
参考数据:,.
附:回归直线中,,.
6.为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:
x
1
2
3
4
5
y
7.0
6.5
5.5
3.8
2.2
(1)求y关于x的线性回归方程=x+
(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)
参考公式:,.
7.随着生活水平的提高,人们对水果的需求量越来越大,为了满足消费者的需求,精品水果店也在大街小巷遍地开花.4月份的“湖南沃柑”因果肉滑嫩,皮薄汁多,口感甜软,低酸爽口深受市民的喜爱.某“闹闹”水果店对某品种的“湖南沃柑”进行试销,得到一组销售数据,如下表所示:
试销单价x(元)
3
4
5
6
7
产品销量y件
20
16
15
12
6
(1)经计算相关系数,变量x,y线性相关程度很高,求y关于x的经验回归方程;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1.2时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数X的分布列和数学期望?
参考公式:线性回归方程中,的最小二乘法估计分别为,.
8.习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据图如下表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数的散点图如下
(1)请根据散点图判断,与中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第144天这株幼苗的高度?(结果保留1位小数).
附:,
参考数据:
140
28
56
283
1 / 8
学科网(北京)股份有限公司
$$
8.2.2一元线性回归模型参数的最小二乘估计
题型一 最小二乘法
1.对成对数据、、…、用最小二乘法求回归方程是为了使( )
A. B.
C.最小 D.最小
答案:D
解析:根据最小二乘法的求解可知:
回归方程是为了使得每个数据与估计值之间的差的平方和最小,故选:D
2.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据.根据收集到的数据可知, 由最小二乘法求得回归直线方程为,则的值为( )
A.75 B.155.4 C.375 D.466.2
答案:C
解析:由题意可得: ,线性回归方程过样本中心点,则: , 据此可知: .选择C选项.
3.对具有线性相关关系的变量x,y,测得一组数据如下表,根据表中数据,利用最小二乘法得到回归直线方程,据此模型预测当时,y的估计值为( )
x
2
4
5
6
8
y
20
40
60
70
80
A.211.5 B.210.5 C.210 D.212.5
答案:A.
解析:由表中数据可得,,,
最小二乘法得到回归直线方程,
,当时, 故选:A.
4.(多选题)某企业节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如表.现发现表中有个数据看不清,已知回归直线方程为,则下列说法错误的是( )
x
2
3
4
5
6
y
19
25
★
38
44
A.看不清的数据★的值为34
B.回归直线必经过点(4,★)
C.回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨
D.据此模型预测产量为7吨时,相应的生产能耗约为50.9吨
答案:BC
解析:设看不清的数字为a,由题表可知,,
,将代入回归直线方程中,
得,解得,所以.所以看不清的数据★的值为34,A正确;
又回归直线过样本点的中心,B错误;
回归系数6.3的含义是产量每增加1吨,相应的生产能耗预计增加6.3吨,C错误;
当时,,所以据此模型预测产量为7吨时,相应的生产能耗约为50.9吨,D正确.故选BC.
5.植物社团的同学观察一株植物的生长情况,为了解植物高度y(单位:厘米)与生长期x(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表:
生长期x
3
9
11
17
植物高度y
2.4
3.4
3.8
5.2
由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为________厘米.
答案:7.7
解析:由题意可得,,
所以所以回归方程为,
所以预测生长期是30天时,植物高度约为厘米. 故答案为:7.7.
题型二 残差分析
1. 人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为M市统计的2024年11月至2025年3月这5个月该市AI电脑的月销量,其中x为月份代号,y(单位:万台)为AI电脑的月销量.
月份
2024年11月
2024年12月
2025年1月
2025年2月
2025年3月
月份代号x
1
2
3
4
5
月销量y
0.5
0.9
1
1.2
1.4
经过分析,y与x线性相关,且其线性回归方程为,则2025年3月的残差为( )
A. B. C.0.02 D.0.04
答案:B
解析:因为,,
所以,所以y关于x的线性回归方程为,
2025年3月对应的,故此时残差为.
故选:B.
2.两个变量x和y之间具有较强的线性相关关系,且y关于x的经验回归方程为,由它计算出成对样本数据对应的残差为0.12(残差=观测值-预测值),则( )
A.0.28 B.0.56 C.0.34 D.0.48
答案:B
解析:因为y关于x的经验回归方程为,所以预测值为,
又因为残差=观测值-预测值, 所以, 所以.
故选:B.
3.(多选题)已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和误差较大,去除这两点后重新求得的回归直线的斜率为1.2,则( )
A.变量x与y具有正相关关系 B.去除后的回归方程为
C.重新求得的回归直线必过点 D.去除后相应于样本点的残差为-0.05
答案:ACD
解析:对A,因为重新求得的回归方程l的斜率为1.2,故变量x与y具有正相关关系,故选项A正确;
对C,将代入回归直线方程为,解得,
则样本中心为,去掉两个数据点和后,由于,,
所以去掉后的,没有变化,故样本中心还是,
故去除这两个数据点后的回归直线过点,故选项C正确;
对B,又因为去除后重新求得的回归直线l的斜率为1.2,所以,解得,
所以去除后的回归方程为,故选项B不正确;
对D,因为, 所以,故选项D正确.
故选:.
4.(多选题)2025年6月18日,很多商场都在搞促销活动.某市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售价x(元)和销售量y(件)之间的一组数据如表所示:
x
90
95
100
105
110
y
11
10
8
6
5
用最小二乘法求得y关于x的回归直线是,相关系数,则下列说法正确的有( )
A.变量x与y负相关且相关性较强 B.
C.当时, D.相应于点的残差为-0.4
答案:ABD
解析:对于A,由回归直线可得变量x与y线性负相关,且由相关系数可知相关性较强,故A正确;
对于B,由题可得,,,因为回归直线恒过点,所以,解得,故B正确;
对于C,当时,,故C错误;
对于D,相应于点的残差,故D正确.
故选ABD.
5.回归方程,而试验中的一组数据是,,,则其残差平方和是______.
答案:或0.38
解析:残差,当时,,当时,,当时,,
残差平方和为.
故答案为:0.38
题型三 非线性回归模型
1. 根据散点图可知,变量呈现非线性关系。为了进行线性回归分析,设,利用最小二乘法,得到线性回归方程,则( )
A.变量的估计值的最大值为 B.变量的估计值的最小值为
C.变量的估计值的最大值为 D.变量的估计值的最小值为
答案:A
解析:依题意,,则,则,故当时,变量的估计值的最大值为。
2.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性回归方程,则估计c,k的值分别( )
A.,0.6 B.,0.3 C.,0.2 D.,0.6
答案:C
解析:由两边同时取以e为底的对数,得.因为,所以,又,所以,,所以.
3.为研究某池塘中水生植物的覆盖水塘面积x(单位:)与水生植物的株数y(单位:株)之间的相关关系,收集了4组数据,用模型去拟合x与y的关系,设,x与z的数据如表格所示:得到x与z的线性回归方程,则( )
x
3
4
6
7
z
2
2.5
4.5
7
A.-2 B.-1 C. D.
答案:C
解析:由已知可得,,,
所以,有,解得, 所以,,
由,得, 所以,,则.
故选:C.
4.已知变量y关于x的回归方程为,若对两边取自然对数,可以发现与x线性相关.现有一组数据如下表所示:
x
1
2
3
4
5
y
e
则当时,预测y的值为( )
A.8 B.9 C. D.
答案:B.
解析:令,由可得,如下表所示:
x
1
2
3
4
5
y
e
u
1
3
4
6
7
由表格中数据可得,,
则有,解得,故,当时,.
故选:B.
5.习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据图如下表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数的散点图如下
(1)请根据散点图判断,与中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第144天这株幼苗的高度(结果保留1位小数).
附:,
参考数据:
140
28
56
283
答案:(1)更适宜作为幼苗高度y关于时间x的回归方程类型?
(2);预测第144天幼苗的高度大约为24.9cm?
解析:(1)根据散点图,更适宜作为幼苗高度y关于时间x的回归方程类型;
(2)令,则构造新的成对数据,如下表所示:
x
1
4
9
16
25
36
49
1
2
3
4
5
6
7
y
0
4
7
9
11
12
13
容易计算,,. 通过上表计算可得:
因此,
回归直线过点, ,
故y关于的回归直线方程为,
从而可得:y关于x的回归方程为,
令,则, 所以预测第144天幼苗的高度大约为24.9cm.
题型四 最小二乘估计的实际应用
1.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?
附:相关系数公式,回归方程中斜率和截距的最小二乘估计公式分别为:,.
答案:(1)答案见解析; (2),9.9百千克.
解析:(1)因为,,
,
,,
因此相关系数,
所以可用线性回归模型拟合y与x的关系.
(2)由(1)知,,,
因此,当时,,
所以预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克.
2.平顶山市公安局交警支队依据《中华人民共和国道路交通安全法》第条规定:所有主干道路凡机动车途经十字口或斑马线,无论转弯或者直行,遇有行人过马路,必须礼让行人,违反者将被处以100元罚款,记3分的行政处罚.如表是本市一主干路段监控设备所抓拍的5个月内,机动车驾驶员不“礼让斑马线”行为统计数据:
月份
1
2
3
4
5
违章驾驶员人数
120
105
100
90
85
(1)请利用所给数据求违章人数y与月份x之间的回归直线方程?
(2)预测该路段7月份的不“礼让斑马线”违章驾驶员人数?
参考公式:,.
答案:(1); (2)66人.
解析:(1)由表中数据,计算;,
,
,
所以y与x之间的回归直线方程为;
(2)时,,预测该路段7月份的不“礼让斑马线”违章驾驶员人数为66人.
3.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据,如下表所示.
平均气温
-3
-4
-5
-6
-7
销售额/万元
20
23
27
30
50
(1)根据以上数据,用最小二乘法求出回归方程;
(2)预测平均气温为时,该商品的销售额为多少万元?
答案:(1) (2)56.8万元
解析:(1)由表中数据可知,,
,
,
故,,
故
(2)当时,万元.
故预测平均气温为时,该商品的销售额为56.8万元.
4.假设某农作物基本苗数x与有效穗数y之间存在相关关系,令测得5组数据如下:
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
(1)以x为解释变量,y为预报变量,画出散点图;
(2)求y与x之间的回归方程,并预报当基本苗数为56.7时的有效穗数;
(3)计算各组残差;
(4)求,并说明随机误差对有效穗数的影响占百分之几?
解析:(1)散点图如图所示.
(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程来建立两个变量之间的关系. 设线性回归方程为,由表中数据可得,故y与x之间的回归方程为.当时,.
所以由回归方程可预报当基本苗数为56.7时,有效穗数为51.143.
(3)各组数据的残差分别为.
(4),
即解释变量(农作物基本苗数)对有效穗数的影响约占了,
所以随机误差对有效穗数的影响约占.
5.某农业大学组织部分学生进行作物栽培试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速度,达到预期标准,小明对自己培育的一株作物使用了营养液,现统计了使用营养液十天之内该作物的高度变化
天数x
1
2
3
4
5
6
7
8
9
10
作物高度y/cm
9
10
10
11
12
13
13
14
14
14
(1)观察散点图可知,天数x与作物高度y之间具有较强的线性相关性,用最小二乘法求出作物高度y关于天数x的线性回归方程(其中,用分数表示);
(2)小明测得使用营养液后第22天该作物的高度为,请根据(1)中的结果预测第22天该作物的高度的残差?
参考公式:.参考数据:.
答案:(1); (2).
解析:(1)依题意,,
,
故,
,故所求回归直线方程为.
(2)由(1)可知,当时,,
故所求残差为.
1.已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得回归直线方程为,若某同学根据上表中的前两组数据和,求得的直线方程为,则以下结论正确的是( )
A., B., C., D.,
答案:D
解析:由题得,,根据公式求得,.
又根据题意可求得,,所以,,故选D.
2.变量x,y之间的相关数据如下表所示,其经验回归直线经过点,且相对于点的残差为0.2,则( )
x
9
9.5
10
10.5
11
y
11
10
m
6
5
A. B. C. D.残差和为0
答案:AD
解析:因为经验回归直线经过点, 所以,,
因为相对于点的残差为0.2, 所以,
所以,,,A正确,B错误,C错误, 所以,
当时,, 当时,,
当时,, 当时,,
当时,,
所以残差和为,D正确. 故选:AD.
3.(多选题)某农科所针对耕种深度x(单位:cm)与水稻每公顷产量(单位:t)的关系进行研究,所得部分数据如下表:
耕种深度x/cm
8
10
12
14
16
18
每公顷产量y/t
6
8
m
n
11
12
已知,用最小二乘法求出y关于x的经验回归方程:,,,数据在样本,的残差分别为,.
(参考数据:两个变量x,y之间的相关系数r为,参考公式:,,)则( )
A. B. C. D.
答案:ABD
解析:对于选项A,因为, ,
所以,得到, 所以, 得到,所以选项A正确,
对于选项B,因为,又,
,
所以,
所以,故选项B正确,
对于选项C,因为,所以选项C错误,
对于选项D,因为,得到,,
所以,所以选项D正确,
故选:ABD.
4.(多选题)为研究光照时长x(小时)和种子发芽数量y(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点P后,下列说法正确的是( )
A.相关系数变小 B.经验回归方程斜率变小
C.残差平方和变小 D.决定系数变小
答案:BC
解析:由图可知:P较其他的点偏离直线最大,所以去掉点P后,回归效果更好.
对于A,相关系数越接近于1,线性相关性越强,因为散点图是递增的趋势,
所以去掉点P后,相关系数r变大,故A错误;
对于B,去掉点P后,经验回归方程斜率变小,故B正确;
对于C,残差平方和变大,拟合效果越差,所以去掉点P后, 残差平方和变小,故C正确;
对于D,决定系数越接近于1,拟合效果越好,所以去掉点P后, 决定系数变大,故D错误;
故选:BC.
5.随着科技的进步,近年来,我国新能源汽车产业迅速发展,2006年,在国家节能减排的宏观政策指导下,科技部在“十一五”启动了“863”计划新能源汽车重大项目.自2011年起,国家相关部门重点扶持新能源汽车的发展,也逐步得到消费者的认可.各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升.小张同学对某品牌新能源汽车近8年出售的数量及广告费投入情况进行了统计,具体数据见下表:
年份代码
1
2
3
4
5
6
7
8
年销售量/十万辆
3
4
5
6
7
9
10
12
广告费投入/亿元
3.6
4.1
4.4
5.2
6.2
7.5
7.9
9.1
(1)求广告费投入y(亿元)与年销售量x(十万辆)之间的线性回归方程(精确到0.01);
(2)若某人随机在甲、乙两家汽车店购买一辆汽车,如果在甲汽车店购买,那么购买新能源汽车的概率为0.6;如果在乙汽车店购买,那么购买新能源汽车的概率为0.8,求这个人购买的是新能源汽车的概率?
参考数据:,.
附:回归直线中,,.
答案:(1) (2)
解析:(1),,由参考数据
,所以
故广告费投入y关于年销售量x的回归方程为.
(2)设“在甲汽车店购买汽车”,“在乙汽车店购买汽车”,
“购买的是新能源汽车”,
,,,
由全概率公式得,.
6.为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:
x
1
2
3
4
5
y
7.0
6.5
5.5
3.8
2.2
(1)求y关于x的线性回归方程=x+
(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)
参考公式:,.
答案:(1); (2)2.72吨
解析:(1)由题知,,
,
,
所以,
,所以y关于x的线性回归方程为;
(2)年利润,因为,
所以当时,年利润z最大,故预测当年产量为2.72吨时,年利润取到最大值.
7.随着生活水平的提高,人们对水果的需求量越来越大,为了满足消费者的需求,精品水果店也在大街小巷遍地开花.4月份的“湖南沃柑”因果肉滑嫩,皮薄汁多,口感甜软,低酸爽口深受市民的喜爱.某“闹闹”水果店对某品种的“湖南沃柑”进行试销,得到一组销售数据,如下表所示:
试销单价x(元)
3
4
5
6
7
产品销量y件
20
16
15
12
6
(1)经计算相关系数,变量x,y线性相关程度很高,求y关于x的经验回归方程;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1.2时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数X的分布列和数学期望?
参考公式:线性回归方程中,的最小二乘法估计分别为,.
答案:(1)见解析 (2)见解析
解析:(1)由已知,得,,
,,
则,
所以, 所以.
(2)当时,;当时,;当时,;
当时,;当时,.
因此该样本的残差绝对值依次为0.2,1,1.2,1.4,1.4,
所以“次数据”有2个.“次数据”个数X可取0,1,2.
,,.
所以X的分布列为:
X
0
1
2
P
则数学期望.
8.习近平总书记在十九大报告中指出,必须树立和践行“绿水青山就是金山银山”的生态文明发展理念,某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据图如下表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数的散点图如下
(1)请根据散点图判断,与中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第144天这株幼苗的高度?(结果保留1位小数).
附:,
参考数据:
140
28
56
283
答案:(1)更适宜作为幼苗高度y关于时间x的回归方程类型
(2);预测第144天幼苗的高度大约为24.9cm.
解析:(1)根据散点图,更适宜作为幼苗高度y关于时间x的回归方程类型;
(2)令,则构造新的成对数据,如下表所示:
x
1
4
9
16
25
36
49
1
2
3
4
5
6
7
y
0
4
7
9
11
12
13
容易计算,,. 通过上表计算可得:
因此, 回归直线过点,
, 故y关于的回归直线方程为,
从而可得:y关于x的回归方程为,
令,则,所以预测第144天幼苗的高度大约为24.9cm.
1 / 8
学科网(北京)股份有限公司
$$