内容正文:
世五维课堂
课时
数
间
8.2元
纠错空间
学作业
1.已知x与y之间的一组数据:
0
2
3
1
3
5
7
若y与x线性相关,则y与x的经验回
归直线y=ix十a必过点
(
A.(2,2)
B.(1.5,0)
C.(1,2)
D.(1.5,4)
2.甲、乙、丙、丁四位同学在建立变量x,y
的回归模型时,分别选择了4种不同模
型,计算可得它们的决定系数R分别
如表:
甲
乙
丙
R2
0.98
0.78
0.50
0.85
方法总结
哪位同学建立的回归模型拟合效果
最好
(
)
A.甲
B.乙
C.丙
D.丁
3.某产品的广告费用x(单位:万元)与销
售额y(单位:万元)的统计数据如下表,
根据下表可得回归方程y=x十a中的
=10.6,据此模型预报广告费用为10
万元时,销售额约为
万元
广告费用
3
2
5
x(万元)
销售额
49
26
39
58
y(万元)
A.112.1万元
B.113.1万元
C.111.9万元
D.113.9万元
4.已知由样本数据(x,y)(i=1,2,3,…,
8)组成的一个样本,得到经验回归方程
为y=2x+0.75,且x=1.125,增加两
个样本点(一2,5)和(1,3)后,得到新样
本的经验回归方程为y=3x十.在新的
经验回归方程下,样本(3,8.7)的残
差为
·20
数学·选择性必修第三册
线性回怕模型及其应用
A.1.1
B.0.5
C.-0.5
D.-1.1
5.在一项调查中有两个变量x和y,下图
是由这两个变量近8年来的取值数据
得到的散点图,那么适宜作为y关于x
的回归方程的函数类型是
()
y
580
560
540
520
500·
038404244464850525456
A.y=a+bx
B.y=c+dx
C.y=m十n.x
D.y=p十qc(q>0)
6.(多选)为研究需要,统计了两个变量x,
y的数据情况如下表:
X1
T2
X3
In
y
y
y2
y3
yn
其中数据x1,x2,x3,…,xn和数据yy2,
y,…yn的平均数分别为x和y,并且计
算相关系数r=一0.8,回归方程为y=x
十a,如下结论正确的为
()
A.将以上数据的每个数据都加一个相
同的常数后,方差不变
B.变量x,y的相关性强
C.当x=x1时,必有y=y1
D.i<0
7.预制菜指以农、畜、禽、水产品为原辅
料,配以调味料等经预选、调制等工艺
加工而成的半成品.近几年预制菜市场
快速增长.某城市调查近4个月的预制
菜市场规模y(万元)得到如表所示的数
据,根据数据得到y关于x的非线性回
归方程y=e-a
2
3
4
y
e
e
第八章成对数据的统计分析
按照这样的速度,预估第8个月的预制
菜市场规模是
万元.(结果用e
表示)
8.在研究两个变量的相关关系时,观察散
点图发现样本点集中于某一条指数曲
线y=er+a的周围.令z=lny,求得经验
回归方程为之=0.25x一2.58,则该模型
的回归方程为
9.已知n组成对样本数据确定的经验回
归方程为y=一x十2且y=4,通过残
差分析,发现两组成对样本数据
(-1.7,2.9),(-2.3,5.1)误差较大,
除去这两组成对样本数据后,重新求得
经验回归直线的斜率估计值为一1.5,
则当x=一4时,y
10.已知变量x,y有如下对应数据.
1
2
3
y
1
3
(1)作出散点图;
(2)用最小二乘法求关于x,y的经验
回归方程.
11.在一段时间内,某淘宝网店一种商品
的销售价格x(元)和日销售量Y(件)
之间的一组数据为:
价格
22
20
18
16
14
x(元)
日销售
37
41
43
50
56
量y(件)
求出y关于x的经验回归方程,并说
明该方程拟合效果的好坏。
·205
课时作业乡
参考数据:之xy:=3992,之x
1
1660.
间
纠错空间
[能力提升]
12.某公司的生产部门调研发现,该公司
第二、第三季度的月用电量y与月份x
线性相关,且数据统计如下:
月份
4
5
6
7
8
9
月用电量
1627
55
46
56
方法总结
(千瓦时)
但核对电费报表时发现一组数据统计
有误
(1)请指出哪组数据有误,并说明
理由;
(2)在排除有误数据后,求月用电量与
月份之间的经验回归方程y=x十a,
并预测统计有误的那个月份的用电
量.(结果精确到0.1)
世五维课堂
数学·选择性必修第三册
13.为了研究某种细菌随时间x的变化繁
(1)计算y与x的相关系数r(保留三
殖个数Y的变化,收集数据如下:
位小数);
间
时间
(2)求y关于x的线性回归方程,并预
纠错空间
1
2
3
6
x/天
测该地区2025年新能源汽车购买
繁殖个
数量.
6
12
25
49
95
190
数Y
参考公式r=
(1)将天数做解释变量,繁殖个数做相
2(x,-x)(y:-)
应变量,作出这些数据的散点图;
(2)描述解释变量与响应变量之间的
含x--
关系
-,a=j-bx.
2x,-o)
参考数值:3≈3.6056,含(x-习
(y:-y)=3.6.
方法总结
[素养培优]
14.近年来我国新能源汽车行业蓬勃发
展,新能源汽车不仅对环境保护具有
重大的意义,而且还能够减少对不可
再生资源的开发,是全球汽车发展的
重要方向.“保护环境,人人有责”,在
政府和有关企业的努力下,某地区近
几年新能源汽车的购买情况如表
所示:
年份x
2019202020212022
2023
新能源汽车购买
0.400.701.101.50
1.80
数量y(万辆)
·206·参考答案
x,y,x的相关数据分别减去x,y,z,记a=(x1一x,x2
-I,x3-E,x-,x;-x),b=(y-y,y2-y,y3-y,
y4一y,y5一y),C=(z1一2,22-2,23-,24-2,-
z).则a=(-1,1,-3,3,0),b=(0,0,-1,1,0),c=
(-1,2,-2,1,0).于是c0sa,b)
-1×0+1×0+(-3)×(-1)+3×1+0×0
√(-1)2+12+(-3)2+32+02×√02+02+(-1)2+12+02
25X2V0.9≈0.95,
6
-1×(-1)+1×2+(-3)×(-2)+3×1+0×0
o0s(a,c〉=
√(-1)2+12+(-3》2+32+0×√/(-102+2+(-22+12+02
12
25×√105
=3y2≈0.85,所以y与x,z与x正相
关,又cos(a,b)>cos(a,c),则y与x之间的相关性比
x与x之间的相关性强
11.解:画出散点图如图所示,由图可知x,y有线性相关
关系
70
60
50
40
30·
0
2468x
=5,y=47.5,2x=120,2=9900,
i=1
2x:=1080,
四
√宫-)2-4)
1080-4×5×47.5
≈0.9827.
√(120-4×5)(9900-4×47.5)
故x与y之间具有很强的正相关关系.
12.解析:(1)由已知得样本平均数y=12+10+16+14+18
5
14,从而广阳岛这种鸟数量的估计值为14×50=700.
(2)x=0.18,y=14,∑(x:-x)(y:-y)=0.009×2+
▣1
0.028×4+0.012×2+0.016×4=0.218,
故样本的相关系数,0218≈0.94
0.232
(3)分层抽样:根据植物覆盖面积的大小对地块分层,
再对50个地块进行分层抽样,
理由如下:由(2)知各样区的这种鸟数量与植物覆盖面
积有很强的正相关,由于各地块间植物覆盖面积差异
很大,从而各地块间这种鸟数量差异也很大,采用分层
抽样的方法较好地保持了样本结构与总体结构的一致
性,提高了样本的代表性,从而可以获得广阳岛这种鸟
数量更准确的估计.
答案:(1)700
(2)0.94
·23
课时作业乡
(3)分层抽样:根据植物覆盖面积的大小对地块分层,
再对50个地块进行分层抽样,理由见解析
13.解:2=0(120+108+…十99+108)=107.8,
y=0(84+64+…+57+71)=68,
2d=120+108g+…+99+1o8=16584
2=84+64+…叶57+71=47384,
2x,=120×84+108X64+…+108X71=73796
所以,相关系数为
73796-10×107.8×68
r=
W√(116584-10×107.82)(47384-10×682)
≈0.7506,
故两次数学考试成绩有显著的线性相关关系,
14.解:(1)由样本数据得(x,i)(i=1,2,3,…,16)的相关系
数为
(x,-D)(i-8.5)
=1
②x-√/-8.
-2.78
≈-0.18;
0.212×√16×18.439
由于|r<0.25,因此可以认为这一天生产的医疗物资
尺寸不随生产过程的进行而系统地变大或变小
(2)由于x=9.97,s≈0.212,
由样本数据可以看出抽取的第13个零件的尺寸在
(元-35,x十3s)以外,因此需对当天的生产过程进行
检查
8.2一元线性回扭模型及其应用
1.D[:2=0+1+2+3=1.5,
4
y=1+3+5+7=4,
4
回归直线必过点(1.5,4).故选D.]
2.A[决定系数R越大,表示回归模型的拟合效果
越好.]
3.C[花样本中心点的坐标(仔,43)代入回归方程得
a=5.9,所以广告费用为10万元时,估计销售额约为
10.6×10+5.9=111.9(万元).]
4.D[2=1.125×8=9,增加两个样本点后x的
平均数为9-2+1=0.8
10
y=2×1.125+0.75=3…含%=3×8=24,增加两
个样本点后y的平均数为24+5+3=3.2,
10
3
巴五维课堂
3.2=3×0.8十i,解得:=0.8,∴.新的经验回归方程
为:y=3x十0.8,
则当x=3时,y=9.8,.样本(3,8.7)的残差为
8.7-9.8=-1.1.J
5.B[散,点图呈曲线,排除A选项,且增长速度变慢,排除
选项C,D,故选B.]
6.ABD[A.因为方差是表示数据波动大小的量,将一组
数据的每个数都加一个相同的常数后,方差不变,所以
A正确;B.相关系数r=-0.8,r>0.75,变量x,y的
相关性强,所以B正确;C.当x=x1时,不一定有y=少,
因此C错误;D.因为r=一0.8<0,是负相关,所以<
0,故D正确.]
7.解析:令x=h=号-a,则x=1+2+3+4=马,
4
3计445+6-号,所以号-号-a→a=-4,则=l时
4
=音十4,所以x=8代入回归方程,则=-登,可得
y=e号万元.
答案:e
8.解析:因为之=0.25x一2.58,之=lny
所以y=e0,25x-2.58」
答案:y=e0.25x-2.58
9.解析:由样本数据点集{(x,y)i=1,2,…,n}求得的经验
回归方程为y=一x十2,且y=4,所以x=一2,故数据的样
本中心点为(一2,4),
去掉(-1.7,2.9),(-2.3,5.1),
重新求得的经验回归直线的斜率估计值为一1.5,
经验回归方程设为y=-1.5.x十a,代入(-2,4),
求得a=1,
所以经验回归直线a的方程为:y=一1.5.x十1,将x=一4
代入经验回归方程,求得y的估计值为一1.5×(一4)十
1=7.
答案:7
10.解:(1)散点图如图所示.
y
5
1
01234x
(2)z=1+2+3+4-5,=1+3+4+5_13
4
2y=
4
49
含x.=1+6+12+20=39.
·234
数学·选择性必修第三册
x2=1+4+9+16=30,
1
39-4×2
30-4×(号)】
=10
所以=吕即为所桌的经验回归方程。
11.解:作出散点图(此处略),观察散点图,可知这些点散
布在一条直线的附近,故可用线性回归模型来拟合
数据」
因为元=22+20+18+16+14=18,
5
y=37+41+48+50+56=45.4,
5
所以6=39925X18X45.4=-2.35,
1660-5×182
a=45.4-(-2.35)×18=87.7.
所以经验回归方程为y=-2.35x十87.7.
y:一y:与y:一y的值如下表:
1
0.3
2.4-0.11.2
yi-y
-8.4
-4.4-2.4
4.610.6
计算户(y-)2=8.3,(y-y)2=229.2,所以R2=
=1
1-8020.964
因为0.964很接近于1,
所以该模型的拟合效果比较好,
12.解:(1)作散,点图如图所示.因为用电量与月份之间线
性相关,所以散点图的样本点分布在经验回归直线附
近比较窄的带状区域内,而点(7,55)离其他点所在区
域较远,故(7,55)这组数据有误.
y千瓦时)
65
5
45
5
25
15
5
0456789x
(2)排除(7,55)这一组有误数据后,计算得x=6.4,y=
30.2.
因为=
是x:-5xy
≈9.98,
x-5x
2=1
a=y-bx≈-33.67,
所以经验回归方程为y=9.98x一33.67,
当x=7时,y≈36.2,
即7月份的用电量大约为36.2千瓦时.
参考答案
13.解:(1)由表中数据作散点图如图所示.
y/个
200
180
160
140
120
100
80
60
40H
20
。。
0123456x1天
(2)由散,点图看出样本点分布在一条指数函数y=
c1e2的图象的周围,其中G1和c2是待定系数.于是令
Z=lnY,则之=ix十a(a=1nc1,i=c2),因此变换后的
样本点应该分布在直线之=x十à的周围,因此可以用
经验回归模型来拟合Z与x的关系,则变换后的样本
数据如表:
1
56
Z1.792.483.223.894.555.25
由表中数据得到经验回归方程z=0.69x十1.115.
因此细菌繁殖个数关于时间的非线性经验回归方程为
y=e°.69x+1.115
14.解析:(1)元=2021×5+(-2)+(-1)+0+1+2
5
2021,y=40+0-70+10+1.50+1.80-1.10,2
5
3、
(x:-x)2=(-2)2+(-1)2+02+12+22=10,∑(
=1
y)2=(-0.7)2+(-0.4)2+02+0.42+0.72=1.3所以r=
2(z-x)y-
3.6
V而X,房≈3.60S6≈
3.6
0.998;
(2)由(1)知,8=白1
(x,-(4-
2a-2
2=38=0.36,
10
a=y-6x=1.1-2021×0.36=-726.46,
所以y关于x的线性回归方程是y=0.36x一726.46,
当x=2025时,y=0.36×2025-726.46=2.54(万
辆),该地区2025年新能源汽车购买数量约为2.54
万辆.
8.3列联表与独立性检验
1.ACD[x2的值不可能为负值;独立性检验显示“患慢性
支气管炎和吸烟习惯有关”即指有一定的把握说他们相
关,或者说有一定的出错率;2×2列联表中的4个数据
有一定的关系,不能为任意实数.]
2.C[根据题意.结合题目中的数据,列出2×2列联表,
求出X的观测值,对照数表可得出概率结论,这种分析
数据的方法是独立性检验,]
·2
课时作业乡
3.D「根据临界值表,9.643>7.879,在犯错误的概率不
超过0.005的前提下,认为课外阅读量大与作文成绩优
秀有关.]
n(ad-bc)2
4.B[因为X=a+b(c十0(ac6+D,所以A中
X-14X10-12)
9×8×5×6
≈0.026,B中X=14X20-62
8×7×6×7
14×(15-8)2
1.17,C中X2=
7×9×7×5
≈0.31,D中x2=
14×(8-15)2
5×7×9X7
-≈0.31,比较可知1.17最大,故选B.]
5A[设男生人教为,则女生人数为受,
则列联表如下:
喜欢该软件情况
性别
合计
喜欢
不喜欢
男生
5.x
6
6
x
女生
工
6
合计
3x
2
若有95%的把握认为是否喜欢该软件和性别有关,则
x2≥3.841,
即7二2后·6-若·学3.84,解得》
8
10.24.
又因为营,受,音晋为整数,所以男生至少有12人,故
选A.]
6,AB[由事件的独立性知,A选项正确;由独立性检验的
意义知,B选项正确;X的大小是判定事件A与B是否
相关的一种方法,不是唯一依据,C选项不正确;若事件
A与B相关,则A发生B可能发生,也可能不发生,D选
项不正确.门
7.解析:由2×2列联表的性质,可得:a=18一6=12,b=
20-12=8,6+d=30-20,可得d=4,所以a-b+d
=8.
答案:8
8解析:独立性检验的前提是假设两个分类变量无关系,
然后通过随机变量X的观测值来判断假设是否成立.
答案:无关系不成立
9.解析:由公式计算得X2=4.882.
因为x2>3.841,所以我们有95%的把握认为服用此药
的效果与患者的性别有关,从而出错的可能性为5%.
答案:4.8825%
5