内容正文:
一元线性回归模型的综合问题
(分值:100分)
单选题每小题5分,共20分;多选题每小题6分,共12分.
一、基础巩固
1.在回归分析中,R2的值越大,说明残差平方和( )
越大 越小
可能大也可能小 以上均错
2.某数学建模小组建立了茶水冷却时间x和茶水温度y的一组数据(xi,yi).经过分析,提出了四种回归模型,①②③④四种模型的残差平方和 (yi-)2的值分别是0.98,0.80,0.12,1.36.则拟合效果最好的模型是( )
模型① 模型② 模型③ 模型④
3.根据变量Y和x的成对样本数据,由一元线性回归模型 得到经验回归方程=x+,对应的残差如图所示,模型误差( )
满足一元线性回归模型的所有假设
满足回归模型E(e)=0的假设
满足回归模型D(e)=σ2的假设
不满足回归模型E(e)=0和D(e)=σ2的假设
4.(多选)下列说法正确的是( )
残差点分布的带状区域越窄,回归方程的拟合效果越好
残差平方和越小,决定系数R2越大
决定系数R2可以大于1
通过经验回归方程得到的预报值是响应变量的可能取值的平均值,不一定是响应变量的精确值
5.在对具有线性相关关系的两个变量x和y进行统计分析时,得到如下数据:
x
4
m
8
10
12
y
1
2
3
5
6
由表中数据求得经验回归方程为=0.65x-1.8,则(4,1),(m,2),(8,3)这三个样本点中,距离经验回归直线最近的点是( )
(4,1) (m,2)
(8,3) (4,1)或(m,2)
6.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性作试验,并用回归分析的方法分别求得相关系数r与残差平方和m如表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则________同学的试验结果体现了A,B两变量更强的线性相关性.
7.从某省“双一流”大学中随机选出8名女大学生,得到其身高x(单位:cm)与体重y(单位:kg)的数据如下表:
x
165
165
157
170
175
165
155
170
y
48
57
50
54
64
61
43
59
若已知y与x的经验回归方程为=0.85x-85.71,则选取的女大学生身高为175 cm时,相应的残差为________kg.
8.已知经验回归方程=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.2),则残差平方和是________.
9.(10分)某旅游景区试图探究车流量与景区接待能力的相关性,确保服务质量和游客安全,以便于确定是否对进入景区车辆实施限行.为此,该景区采集到过去一周内某时段车流量与接待能力指数的数据如表:
时间
周一
周二
周三
周四
周五
周六
周日
车流量x/千辆
10
9
9.5
10.5
11
8
8.5
接待能力指数y
78
76
77
79
80
73
75
(1)根据表中周一到周五的数据,求y关于x的经验回归方程;
(2)若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为该经验回归方程是可靠的.请根据周六和周日的数据,判定所得的经验回归方程是否可靠?
附参考公式及参考数据:
经验回归方程=x+,
其中==;
=-.(xi-)(yi-)=5.
10.(10分)已知x,y之间的一组数据如表:
x
1
3
6
7
8
y
1
2
3
4
5
(1)分别从集合A={1,3,6,7,8},B={1,2,3,4,5}中各取一个数x,y,求x+y≥10的概率;
(2)对于表中数据,甲、乙两同学给出的拟合直线分别为y=x+1与y=x+,试根据残差平方和:(yi-i)2的大小,判断哪条直线拟合程度更好.
二、综合运用
11.(多选)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2016年到2024年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2016年作为第1年)的函数.运用excel软件,分别选择经验回归直线和三次函数回归曲线进行拟合,效果如图,则下列说法正确的是( )
销售额y与年份序号x呈正相关关系
三次函数回归模型的残差平方和大于线性回归模型的残差平方和
三次函数回归曲线的拟合效果好于经验回归直线的拟合效果
根据三次函数回归曲线可以预测2025年“年货节”期间的销售额约为1 698.719亿元
12.某工厂为研究某种产品产量x(吨)与所需某种原料y(吨)的相关性,在生产过程中收集4组对应数据(x,y)如下表所示:
x
3
4
6
7
y
2.5
3
4
m
根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为________.
13.(13分)假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如下表的统计资料:
使用年限x/年
2
3
4
5
6
维修费用y/万元
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系,试求:
(1)经验回归方程=x+;
(2)估计使用年限为10年时,维修费用是多少?
(3)计算残差平方和;
(4)求R2并说明模型的拟合效果.
参考数据:xiyi=112.3, (yi-)2=15.78.
三、创新拓展
14.(15分)生物学家认为,睡眠中的恒温动物依然会消耗体内能量,主要是为了保持体温.脉搏率f是单位时间心跳的次数,医学研究发现,动物的体重W(单位:g)与脉搏率f存在着一定的关系.如表给出一些动物体重与脉搏率对应的数据,图1画出了体重W与脉搏率f的散点图,图2画出了lg W与lg f的散点图.
动物名
鼠
大鼠
豚鼠
兔
小狗
大狗
羊
体重
25
200
300
2 000
5 000
30 000
50 000
脉搏率
670
420
300
200
120
85
70
为了较好地描述体重和脉搏率的关系,现有以下两种模型供选择:
①f=kW+b;②lg f=klg W+b.
(1)选出你认为最符合实际的函数模型,并说明理由;
(2)不妨取表中豚鼠和兔的体重、脉搏率数据代入所选函数模型,求出f关于W的函数解析式.
参考数据:lg 2≈0.3,lg 3≈0.5.
一元线性回归模型的综合问题
1.B [因为R2=1-,
所以当R2越大时,(yi-i)2越小,
即残差平方和越小.]
2.C [对于回归模型,残差平方和越小,回归模型的拟合效果越好,故拟合效果最好的模型是模型③.]
3.D [由残差图可以看出,图中的残差点不能拟合成一条直线,且不满足
D(e)=σ2.]
4.ABD [由R2的计算公式,知B正确,C错误;A,D均正确.]
5.B [=×(4+m+8+10+12)=,
=×(1+2+3+5+6)=3.4,
将代入经验回归方程=0.65x-1.8中,
得3.4=0.65×-1.8,解得m=6.
所以当x=4时,=0.65×4-1.8=0.8,
|1-0.8|=0.2;
当x=6时,=0.65×6-1.8=2.1,|2-2.1|=0.1;
当x=8时,=0.65×8-1.8=3.4,|3-3.4|=0.4.
综上,(4,1),(m,2),(8,3)这三个样本点中,距离经验回归直线最近的点是(m,2).故选B.]
6.丁 [由题表可知,丁同学的相关系数r最大且残差平方和m最小,
故丁同学的试验结果体现了A,B两变量更强的线性相关性.]
7.0.96 [当x=175 cm时,=0.85×175-85.71=63.04(kg),
∴相应残差=64-63.04=0.96(kg).]
8.0.06 [因为=2x+1,
故当x=2时,=5,1=-0.1;
x=3,=7,2=0.1;
x=4,=9,3=0.2.
则++=0.01+0.01+0.04=0.06.]
9.解 (1)=(10+9+9.5+10.5+11)=10,
=(78+76+77+79+80)=78.
又(xi-)(yi-)=5,
(xi-)2=2.5,
∴==2,=-=78-2×10=58.
∴y关于x的经验回归方程为=2x+58.
(2)当x=8时,=2×8+58=74,
满足|74-73|=1<2,
当x=8.5时,=2×8.5+58=75,
满足|75-75|=0<2,
故所得的经验回归方程是可靠的.
10.解 (1)由题意知这是一个古典概型,
试验发生包含的所有样本点是分别从集合A,B中各取一个数组成数对(x,y),共有25个,
其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9个.
故使x+y≥10的概率为P=.
(2)当用y=x+1作为拟合直线时,
残差平方和为s1=+(2-2)2
+(3-3)2++=.
当用y=x+作为拟合直线时,
残差平方和为s2=(1-1)2+(2-2)2++(4-4)2+=,
因此s1>s2,
故用直线y=x+拟合效果更好.
11.AC [由散点图的变化趋势可知,销售额y与年份序号x呈正相关关系,故选项A正确;
由散点图以及线性回归模型和三次函数回归模型的位置关系可知,三次函数回归模型的残差平方和小于线性回归模型的残差平方和,故选项B错误;
因为0.999>0.936,所以三次函数回归曲线的拟合效果好于经验回归直线的拟合效果,故选项C正确;
因为三次函数为y1=0.168x3+28.141x2-29.027x+6.889,
则当x=10时,y1=2 698.719(亿元),故选项D错误.]
12.5.9 [根据样本(4,3)处的残差为-0.15,
即3-(0.7×4+)=-0.15,可得=0.35,
故经验回归方程为=0.7x+0.35,
又由样本数据的平均数为==5,
=,
所以0.7×5+0.35=,
解得m=5.9.]
13.解 (1)由统计表格,易知=4,=5,x=90.
又xiyi=112.3.
设经验回归方程为=x+,
于是有===1.23,
=-=5-1.23×4=0.08,
经验回归方程是=1.23x+0.08.
(2)当x=10时,=1.23×10+0.08=12.38,
估计使用10年时维修费用是12.38万元.
(3)因为1=2.46+0.08=2.54,
2=3.77,3=5,4=6.23,5=7.46,
所以残差平方和(yi-i)2=0.651.
(4)R2=1-=1-≈0.958 7,
模型的拟合效果较好.
14.解 (1)模型②lg f=klg W+b最符合实际.
根据散点图的特征,图2基本上呈直线形式,所以可选择一次函数来刻画lg W和lg f的关系.
(2)lg 200=2+lg 2≈2.3,lg 2 000=3+lg 2≈3.3,
lg 300=2+lg 3≈2.5.
由题意知
解得
所以lg f=-lg W+,
所以f关于W的函数解析式为
f=10·W-.
学科网(北京)股份有限公司
$$