内容正文:
第2课时 非线性回归模型及拟合效果的判断
1.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2如下表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
则回归模型拟合效果最好的是( )
A.甲 B.乙
C.丙 D.丁
2.某样本点(xi,yi)(i=1,2,…,n)的经验回归方程为=0.5x+0.7,当x=8时,y的实际值为4.5,则当x=8时,预测值与实际值的差值为( )
A.0.1 B.0.2
C.0.3 D.0.4
3.已知变量y关于变量x的经验回归方程为=bln x+0.24,其一组数据如表所示:
x
e
e3
e4
e6
e7
y
1
2
3
4
5
若x=e10,则y的值大约为( )
A.4.94 B.5.74
C.6.81 D.8.04
4.如图一组实验数据的散点图,拟合方程为y=+c(x>0),令t=,则y关于t的经验回归直线过点(2,5),(12,25),则当y∈(1.01,1.02)时,x的取值范围是( )
A.(0.01,0.02) B.(50,100)
C.(0.02,0.04) D.(100,200)
5.〔多选〕某研究小组采集了5组数据,作出如图所示的散点图.若去掉D(3,10)后,下列说法正确的是( )
A.样本相关系数r变小 B.决定系数R2变大
C.残差平方和变大 D.自变量x与因变量y的相关性变强
6.〔多选〕某种商品的价格x(单位:元/kg)与日需求量y(单位:kg)之间的对应数据如下表所示:
x
10
15
20
25
30
y
11
10
8
6
5
根据表中的数据可得经验回归方程=x+14.4,则以下说法正确的是( )
A.样本相关系数r>0
B.=-0.32
C.若该商品的价格为35元/kg,则日需求量大约为3.2 kg
D.第四个样本点对应的残差为-0.4
7.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=ln y,求得经验回归方程为=0.25x-2.58,则该模型的回归方程为 .
8.某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如下表所示,根据表中数据,得出y关于x的经验回归方程为=0.6x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m= .
x
3
4
5
6
y
2
3
4
m
9.“绿水青山就是金山银山”的理念推动了新能源汽车产业的迅速发展.以下表格和散点图反映了近几年我国某新能源汽车的年销售量情况.
年份
2020
2021
2022
2023
2024
年份代码x
1
2
3
4
5
某新能源汽车年销售量y/万辆
1.5
5.9
17.7
32.9
55.6
(1)请根据散点图判断,y=bx+a与y=cx2+d中哪一个更适宜作为年销售量y关于年份代码x的回归方程类型.(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2025年我国该新能源汽车的年销售量.(精确到0.1)
参考数据:=22.72,(wi-)2=374,(wi-)·(yi-)=851.2(其中wi=).
10.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
若由最小二乘法计算得经验回归方程=0.29x+34.7.
(1)计算各组残差,并计算残差平方和;
(2)求R2,并说明回归模型拟合效果的好坏.
11.某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(单位:t)与相应的生产总成本y(单位:万元)的五组对照数据.
产量x/t
1
2
3
4
5
生产总成本y/万元
3
7
8
10
12
(1)根据上表数据,若用最小二乘法进行线性模拟,试求y关于x的经验回归方程=x+.
(2)记第(1)问中所求y与x的经验回归方程=x+为模型①,同时该企业科研人员利用计算机根据数据又建立了y与x的回归模型②:=x2+1.其中模型②的残差图(残差=实际值-估计值)如图所示.
请完成模型①的残差表与残差图,并根据残差图,判断哪一个模型更适宜作为y关于x的回归方程,并说明理由.
(3)根据模型①中y与x的经验回归方程,预测产量为6 t时生产总成本为多少万元.
3 / 3
学科网(北京)股份有限公司
$
第2课时 非线性回归模型及拟合效果的判断
1.A 决定系数R2越大,表示回归模型的拟合效果越好.
2.B 当x=8时,y的预测值=4.7,4.7-4.5=0.2.故选B.
3.C 令t=ln x,则=bt+0.24.由题意得,=4.2,=3,由线性经验回归直线过样本的中心点,有b=,所以=·ln x+0.24,将x=e10代入得≈6.81.故选C.
4.D 根据题意可得y=bt+c(t>0),由y关于t的经验回归直线过点(2,5),(12,25)可得:解得所以y=2t+1,由y∈(1.01,1.02)可得1.01<2t+1<1.02,所以0.005<t<0.01,所以0.005<<0.01,所以100<x<200,故选D.
5.BD 根据散点图可知,去掉点D(3,10)后,y与x的线性相关性加强,且为正相关,样本相关系数r变大,则A错,D对;去掉点D(3,10)后,残差平方和变小,则R2变大,B对,C错.故选B、D.
6.BCD 对于A、B,由题表中的数据,得==20,==8,将,代入=x+14.4得=-0.32,所以A选项说法错误,B选项说法正确;对于C,将x=35代入=-0.32x+14.4,得=3.2,所以日需求量大约为3.2 kg,所以C选项说法正确;对于D,第四个样本点对应的残差为y4-=6-(-0.32×25+14.4)=-0.4,所以D选项说法正确.故选B、C、D.
7.=e0.25x-2.58 解析:由z=ln y,=0.25x-2.58,得ln =0.25x-2.58,所以=e0.25x-2.58.故该模型的回归方程为=e0.25x-2.58.
8.4.8 解析:∵样本(4,3)处的残差为-0.15,且y关于x的经验回归方程为=0.6x+,∴3-(0.6×4+)=-0.15,解得=0.75,故经验回归方程为=0.6x+0.75,∵==4.5,==,∴=0.6×4.5+0.75,解得m=4.8.
9.解:(1)根据散点图可知,y=cx2+d更适宜作为年销售量y关于年份代码x的回归方程类型.
(2)令w=x2,则=w+.
易知=11,==≈2.28,
=-≈22.72-2.28×11=-2.36,
所以=2.28w-2.36,
所以y关于x的回归方程为=2.28x2-2.36.
令x=6,得=79.72≈79.7.
故预测2025年我国该新能源汽车的年销售量为79.7万辆.
10.解:(1)由=xi+,可以算得=yi-.
分别为=0.35,=0.718,=-0.5,=-2.214,=1.624,
所以残差平方和为()2≈8.43.
(2)由表中数据得=43.5,(yi-)2=50.18,
故R2=1-≈1-≈0.832.
所以回归模型的拟合效果较好.
11.解:(1)计算=(1+2+3+4+5)=3,
=(3+7+8+10+12)=8,
=12+22+32+42+52=55,
xiyi=1×3+2×7+3×8+4×10+5×12=141,
===2.1,
=-=8-2.1×3=1.7,
因此,经验回归方程为=2.1x+1.7.
(2)模型①的残差表为
x
1
2
3
4
5
y
3
7
8
10
12
3.8
5.9
8
10.1
12.2
-0.8
1.1
0
-0.1
-0.2
画出残差图,如图所示:
结论:模型①更适宜作为y关于x的回归方程,理由1:模型①的5个样本点的残差点落在的带状区域比模型②的带状区域更窄;
理由2:模型①的5个样本点的残差点比模型②的残差点更贴近x轴.(写出一个理由即可)
(3)根据模型①中y与x的经验回归方程,计算x=6时,=2.1×6+1.7=14.3,
所以预测产量为6吨时生产总成本为14.3万元.
学科网(北京)股份有限公司
$