内容正文:
练案[20]
第八章
8.2[第2课
A组·基础巩固
1.在回归分析中,R的值越大,说明残差平方和
A.越大
B.越小
C.可能大也可能小D.以上均错
2.某数学建模小组建立了茶水冷却时间x和茶
水温度y的一组数据(x,y:).经过分析,提出
了四种回归模型,①②③④四种模型的残差平
方和∑(y:-)2的值分别是0.98,0.80,0.12,
1.36.则拟合效果最好的模型是
A.模型①
B.模型②
C.模型③
D.模型④
3.根据变量Y和x的成对样本数据,由一元线性
[Y=bx+a+e,
回归模型
,得到经验回归
lE(e)=0,D(e)=
方程y=bx+a,对应的残差如图所示,模型误
差
↑残差
3
2
1
·.0.5.1.01.52.02.53.0x
-1
-2
。。
A.满足一元线性回归模型的所有假设
B.满足回归模型E(e)=0的假设
C.满足回归模型D(e)=σ2的假设
D.不满足回归模型E(e)=0和D(e)=σ2的
假设
4.(多选)下列说法正确的是
A.残差点分布的带状区域越窄,回归方程的
拟合效果越好
B.残差平方和越小,决定系数R越大
C.决定系数R可以大于1
D.通过经验回归方程得到的预报值是响应变
量的可能取值的平均值,不一定是响应变
量的精确值
15
时非线性回归模型及回归分析]
5.在对具有线性相关关系的两个变量x和y进
行统计分析时,得到如下数据:
m
8
10
12
2
3
6
由表中数据求得经验回归方程为y=0.65x-
1.8,则(4,1),(m,2),(8,3)这三个样本点
中,距离经验回归直线最近的点是
A.(4,1)
B.(m,2)
C.(8,3)
D.(4,1)或(m,2)
6.甲、乙、丙、丁四位同学各自对A,B两变量的线
性相关性作试验,并用回归分析的方法分别求
得相关系数r与残差平方和m如表:
甲
乙
丙
0.82
0.78
0.69
0.85
106
115
124
103
则
同学的试验结果体现了A,B两变
量更强的线性相关性,
7.从某省“双一流”大学中随机选出8名女大学
生,得到其身高x(单位:cm)与体重y(单位:
kg)的数据如下表:
165
165
157
170
175
165
155
170
48
57
50
54
64
61
43
59
若已知y与x的经验回归方程为y=0.85x-
85.71,则选取的女大学生身高为175cm时,
相应的残差为
k
8.已知经验回归方程y=2x+1,而试验得到一组
数据是(2,4.9),(3,7.1),(4,9.2),则残差平
方和是
9.某旅游景区试图探究车流量与景区接待能力
的相关性,确保服务质量和游客安全,以便于
确定是否对进入景区车辆实施限行.为此,该
景区采集到过去一周内某时段车流量与接待
能力指数的数据如表:
时间
周一周二周三周四周五周六周日
车流量
10
9
9.510.5
11
8
8.5
x/千辆
接待能力
78
76
77
79
80
73
75
指数y
(1)根据表中周一到周五的数据,求y关于x
的经验回归方程;
(2)若由经验回归方程得到的估计数据与所
选出的检验数据的误差均不超过2,则认
为该经验回归方程是可靠的.请根据周六
和周日的数据,判定所得的经验回归方程
是否可靠?
附参考公式及参考数据:
经验回归方程y=bx+a,
中6出00,-
含-n
含-0
-n灵
a=-8元2(-0()-5
10.已知x,y之间的一组数据如表:
3
6
7
8
2
3
5
(1)分别从集合A={1,3,6,7,8},B={1,2
3,4,5}中各取一个数x,y,求x+y≥10
的概率;
151
(2)对于表中数据,甲、乙两同学给出的拟合
直线分别为=子+1与y=+分,试
1
根据残差平方和:(%-)的大小,判
断哪条直线拟合程度更好.
B组·综合运用
1.(多选)某电子商务平台每年都会举行“年货
节”商业促销狂欢活动,现统计了该平台从
2016年到2024年共9年“年货节”期间的销
售额(单位:亿元)并作出散点图,将销售额y
看成以年份序号x(2016年作为第1年)的函
数.运用excel软件,分别选择经验回归直线
和三次函数回归曲线进行拟合,效果如图,则
下列说法正确的是
()
↑(亿元)
2500H
y=0.i6803+28.1412-29.027x+6,889
·(亿元)
2000--
R=0.999
1500
线性
y2=267x-544.22
1000
(亿元)
R3=0.936
500H
非线性y2
2
4
6810x
(亿元)
A.销售额y与年份序号x呈正相关关系
B.三次函数回归模型的残差平方和大于线
性回归模型的残差平方和
C.三次函数回归曲线的拟合效果好于经验
回归直线的拟合效果
D.根据三次函数回归曲线可以预测2025年
“年货节”期间的销售额约为1698.719
亿元
12.某工厂为研究某种产品产量x(吨)与所需某
种原料y(吨)的相关性,在生产过程中收集4
组对应数据(x,y)如下表所示
3
4
6
2
2.5
3
2
根据表中数据,得出y关于x的经验回归方
程为y=0.7x+a.据此计算出在样本(4,3)
处的残差为-0.15,则表中m的值为
13.假设关于某设备的使用年限x(单位:年)和
支出的维修费用y(单位:万元),有如下表的
统计资料:
使用年限x/年
2
3
4
5
6
维修费用y/万元
2.23.8
5.56.57.0
若由资料知y对x呈线性相关关系,试求:
(1)经验回归方程y=bx+a;
(2)估计使用年限为10年时,维修费用是
多少?
(3)计算残差平方和:
(4)求R并说明模型的拟合效果
参考数据:含x=112.3,名(0-)2=
15.78.
—152
C组·拓展提升
4.生物学家认为,睡眠中的恒温动物依然会消
耗体内能量,主要是为了保持体温.脉搏率
是单位时间心跳的次数,医学研究发现,动物
的体重W(单位:g)与脉搏率∫存在着一定的
关系.如表给出一些动物体重与脉搏率对应
的数据,图1画出了体重W与脉搏率f的散
点图,图2画出了1gW与lgf的散点图,
动物名鼠大鼠豚鼠
兔
小狗
大狗
羊
体重
25200
300200050003000050000
脉搏率670420
300
200
120
85
70
700
600
500
400F
300
200·
100
0
05000
50000W
图1
个lgf
3
●
2.5
2
1.5
1
0.5
0
0123451gW
图2
为了较好地描述体重和脉搏率的关系,现有
以下两种模型供选择:
①f=W+b:②lgf=klgW+b.
(1)选出你认为最符合实际的函数模型,并
说明理由;
(2)不妨取表中豚鼠和兔的体重、脉搏率数
据代入所选函数模型,求出∫关于W的
函数解析式,
参考数据:lg2≈0.3,lg3≈0.5.1.ABD设A(2,11),B(6,2),由k=号<3,而8个数据点
的经验回归方程中b=3,∴.0<m<3,A、B正确;而10个数
据点的元=4×8+2+6=4,7=(3×4+4.5)×8+11+2。
10
10
16.5,.经验回归直线过定点(4,16.5),则16.5=4m+n,n
=16.5-4m,0<m<3,0<4m<12,-12<-4m<0,4.5<
16.5-4m<16.5,即4.5<n<16.5.故D正确,C错误.
12.0.50.53y=0.4+0.5+06+0.6+0.4-2.5-0.5,=
5
5
1+2+3+4+5=3.由公式得6=0.01,从而a=了-b元=0.5
-0.01×3=0.47,所以经验回归方程为y=0.47+0.01x,所
以当x=6时,y=0.47+0.01×6=0.53.
13.【解析】(1)画出散点图,如图所示
1y零件数1件
9外
。
0810121416x转速/(转/秒)
(2)x=12.5,y=8.25,
含5=438,2=60,
d4可
8买-47
-438-4×12.5×825=0.7286,
660-4×12.52
a=y-bx≈825-0.7286×125=-0.8575.
故经验回归方程为y=0.7286x-0.8575.
(3)要使y≤10,则0.7286x-0.8575≤10.
得x≤14.9019.
故机器的转速应控制在14.9转/秒以下.
14.AD
元=2+4+7+10+15+2=10,=
6
8.1+9.4+12+14.4+18.5+24=14.4,故经验回归直线
6
过点(10,14.4),选项A正确;将点(10,14.4)代人y=
0.8x+a,得a=6.4,B错误:y=0.8x+6.4,当y=16时
x=12,∴.月出时间为阴历12日,选项C错误;.阴历27
日时,即x=27,代入得y=0.8×27+6.4=28,∴.日出时间
应该为28日早上4:00,选项D正确.
练案[20]
1B因为R1含-)
,所以当R越大时,(-)
8(%-)
越小,即残差平方和越小
2.C对于回归模型,残差平方和越小,回归模型的拟合效果越
好,故拟合效果最好的模型是模型③.
3.D由残差图可以看出,图中的残差点不能拟合成一条直线,
且不满足D(e)=o2.
19
4.ABD由R2的计算公式,知B正确,C错误;A,D均正确。
5.B=5×(4+m+8+10+12)=4专m,万=写×1+2+3
+5+6)=3.4,将(4与0,3.4)代人经验国归方程了=06x
-1.8中,得3.4=0.65×4m-1.8,解得m=6.所以当x
4时,y=0.65×4-1.8=0.8,11-0.81=0.2;当x=6时,y=
0.65×6-1.8=2.1,12-2.11=0.1;当x=8时,y=0.65×8
-1.8=3.4,13-3.41=0.4.综上,(4,1),(m,2),(8,3)这三
个样本点中,距离经验回归直线最近的点是(m,2).故选B.
6.丁由题表可知,丁同学的相关系数r最大且残差平方和m
最小,故丁同学的试验结果体现了A,B两变量更强的线性相
关性.
7.0.96当x=175cm时,y=0.85×175-85.71=63.04(kg),
∴.相应残差e=64-63.04=0.96(kg).
8.0.06因为y=2x+1,故当x=2时,y=5,e1=-0.1;x=3,y
=7,e2=0.1;x=4,y=9,e3=0.2.则+e+号=0.01+0.01
+0.04=0.06.
9.【解析】(1)元=了(10+9+9.5+10.5+1)=10,
万=5(78+76+7+79+80)=78.
又(x,-)(-)=5,8(x-0)=2.5,
8=25=2,a=y-6=78-2x10=58
∴.y关于x的经验回归方程为y=2x+58
(2)当x=8时,y=2×8+58=74,
满足174-731=1<2,
当x=8.5时,y=2×8.5+58=75,
满足175-751=0<2,
故所得的经验回归方程是可靠的.
10.【解析】(1)由题意知这是一个古典概型,
试验发生包含的所有样本点是分别从集合A,B中各取一个
数组成数对(x,y),共有25个,
其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4),(7,
5),(8,2),(8,3),(8,4),(8,5),共9个.
故使x+y≥10的概率为P=25
9
(2)当用y=3x+1作为拟合直线时,
残差平方和为=(1-号)+(2-2)+(3-3)尸+(4
9)+5号)=子
当用y2+作为报合直线时,
残差平方和为2=(1-1)》+(2-2)2+(3-7)+(4
因此$1>$2,
故用直线了=宁+号拟合效果更好。
1
8
11.AC由散点图的变化趋势可知,销售额y与年份序号x呈正
相关关系,故选项A正确;由散点图以及线性回归模型和三
次函数回归模型的位置关系可知,三次函数回归模型的残差
平方和小于线性回归模型的残差平方和,故选项B错误;因
为0.999>0.936,所以三次函数回归曲线的拟合效果好于经
验回归直线的拟合效果,故选项C正确;因为三次函数为y
=0.168x3+28.141x2-29.027x+6.889,则当x=10时,少1=
2698.719(亿元),故选项D错误.
12.5.9根据样本(4,3)处的残差为-0.15,即3-(0.7×4+
à)=-0.15,可得à=0.35,故经验回归方程为分=0.7x+
0.35,又由样本数据的平均数为元=3+4+6+7=5,7=
4
25+3+4+m,所以0.7x5+0.35=2.5+3+4+m,解得m
4
4
=5.9.
13.【解析】(1)由统计表格,易知x=4,y=5,2=90,
又2xy=12.3.
设经验回归方程为下=bx+a,
于是有6=-5y12.3-5×4×5=123
Σ-52
90-5×42
a=y-6x=5-1.23×4=0.08,
经验回归方程是y=1.23x+0.08.
(2)当x=10时,y=1.23×10+0.08=12.38,
估计使用10年时维修费用是12.38万元.
(3)因为y1=2.46+0.08=2.54,
2=3.77,3=5,少4=6.23,y5=7.46
所以残差平方和∑(y,-)2=0.651.
5
(y,-)2
(4)R2=1-
-1-0.651
含(%-列
15.78≈0.9587,
模型的拟合效果较好.
14.【解析】(1)模型②lgf=lgW+b最符合实际.
根据散点图的特征,图2基本上呈直线形式,所以可选择一
次函数来刻画gW和gf的关系.
(2)lg200=2+1g2≈2.3,1g2000=3+1g2≈3.3,
lg300=2+lg3≈2.5.
由题意知[g300=灿g300+6,
Llg200=k1g2000+b,
1
rk=-41
解得
b=
25
8
所以/-g+会
1
8”
所以f关于W的函数解析式为f=10尽·W
练案[21]
1.B①正确,A与B无关即A与B相互独立;②不正确,X的值
的大小只是用来检验A与B是否相互独立:③不正确,例如借
助三维柱形图、二维堆积条形图等均可判定A与B是否相关,
故选B.
19
2.B根据两个表中的等高堆积条形图知,药物A实验显示不服
药与服药时患病差异明显比药物B实验大,所以药物A的预
防效果优于药物B的预防效果.
3.D:X2=6.748≥6.635=xo.1,.依据小概率值a=0.01的
独立性检验,认为“数学成绩优秀与性别有关”,即在犯错误
的概率不超过1%的前提下,认为“数学成绩优秀与性别有
关”
4.BC由题意可得甲专业录取了男生25人,女生90人,乙专业
录取了男生180人,女生50人甲专业的录取率为高+0
28.75%乙专业的录取率为0+0=46%,所以乙专业
比甲专业的录取率高,男生的录取率为)十0=41%,女生一
的录取率为测+0=35%,所以男生比女生的录取率商
f5.CD由题意可知X=65×[a(30+a)-(15-a)(20-a)]2
20×45×15×50
=13×(13a-60)2
20×45x3x2≥3.841=ns,根据a>5,且15-a>5,
a∈Z,得当a=8或a=9时满足题意
6.ACD由题意设参加调查的男、女生人数均为m,则得到如下
2×2列联表:
攀岩
性别
合计
喜欢
不喜欢
男生
0.8m
0.2m
含
女生
0.3m
0.7m
m
合计
1.1m
0.9m
2m
所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女
生人数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩
的人数少,故A正确,B错误;由列联表中的数据,计算得到X
2m(056m-0.06mY上9,当m=100时x=0
1.1m·0.9m·m·m
99
50×10050.505>10.828=x0m1,所以当参与调查的男、女
99
生人数均为100时,依据小概率值α=0.001的独立性检验,
认为喜欢攀岩和性别有关联,故C正确;根据公式,m越大X
也越大,所以得出“喜欢攀岩与性别有关联”这一结论的可信
度越高,D正确.
7.15根据等高堆积条形图可知,喜欢徒步的男生人数为0.6×
500=300,喜欢徒步的女生人数为0.4×400=160,所以喜欢
徒步的总人数为300+160=460,用比例分配的分层随机抽样
的方法抽取23人,则拍取的男生人数为测×23=15
8.0.005由列联表可得a=20,b=10,c=12,d=4,可得X2=
30×(8-128)2
12×18×20×10=10>7.879=0s,所以依据小概率值《=
0.005的独立性检验,认为运动员饮食习惯与性别有关
9.【解析】(1)由表得,m=50-20=30,n=55+45=100,
即m=30,n=100.
(2)零假设为H。:教学方式与成绩无关.
由表得X=100×35x30-20X15)2=9.091>7.879
55×45×50×50
=3X0.005
9