内容正文:
1.已知x与y之间的一组数据:
x
0
1
2
3
y
1
3
5
7
若y与x线性相关,则y与x的经验回归直线=x+必过点( )
A.(2,2) B.(1.5,0)
C.(1,2) D.(1.5,4)
解析:D [∵==1.5,
==4,
∴回归直线必过点(1.5,4).故选D.]
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2分别如表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好( )
A.甲 B.乙
C.丙 D.丁
解析:A [决定系数R2越大,表示回归模型的拟合效果越好.]
3.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如下表,根据下表可得回归方程=x+中的=10.6,据此模型预报广告费用为10万元时,销售额约为 ________ 万元.( )
广告费用
x(万元)
4
3
2
5
销售额
y(万元)
49
26
39
58
A.112.1万元 B.113.1万元
C.111.9万元 D.113.9万元
解析:C [把样本中心点的坐标代入回归方程得=5.9,所以广告费用为10万元时,估计销售额约为10.6×10+5.9=111.9(万元).]
4.已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到经验回归方程为=2x+0.75,且=1.125,增加两个样本点(-2,5)和(1,3)后,得到新样本的经验回归方程为=3x+.在新的经验回归方程下,样本(3,8.7)的残差为( )
A.1.1 B.0.5
C.-0.5 D.-1.1
解析:D [∵xi=1.125×8=9,∴增加两个样本点后x的平均数为=0.8;
∵=2×1.125+0.75=3,∴yi=3×8=24,∴增加两个样本点后y的平均数为=3.2,∴3.2=3×0.8+,解得:=0.8,∴新的经验回归方程为:=3x+0.8,
则当x=3时,=9.8,∴样本(3,8.7)的残差为8.7-9.8=-1.1.]
5.在一项调查中有两个变量x和y,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y关于x的回归方程的函数类型是( )
A.y=a+bx
B.y=c+d
C.y=m+nx2
D.y=p+qcx(q>0)
解析:B [散点图呈曲线,排除A选项,且增长速度变慢,排除选项C,D,故选B.]
6.(多选)为研究需要,统计了两个变量x,y的数据情况如下表:
x
x1
x2
x3
…
xn
y
y1
y2
y3
…
yn
其中数据x1,x2,x3,…,xn和数据y1,y2,y3,…,yn的平均数分别为和,并且计算相关系数r=-0.8,回归方程为=x+,如下结论正确的为( )
A.将以上数据的每个数据都加一个相同的常数后,方差不变
B.变量x,y的相关性强
C.当x=x1时,必有=y1
D.<0
解析:ABD [A.因为方差是表示数据波动大小的量,将一组数据的每个数都加一个相同的常数后,方差不变,所以A正确;B.相关系数r=-0.8,|r|>0.75,变量x,y的相关性强,所以B正确;C.当x=x1时,不一定有=y1,因此C错误;D.因为r=-0.8<0,是负相关,所以<0,故D正确.]
7.预制菜指以农、畜、禽、水产品为原辅料,配以调味料等经预选、调制等工艺加工而成的半成品.近几年预制菜市场快速增长.某城市调查近4个月的预制菜市场规模y(万元)得到如表所示的数据,根据数据得到y关于x的非线性回归方程=e-a
x
1
2
3
4
y
e3
e4
e5
e6
按照这样的速度,预估第8个月的预制菜市场规模是 ______ 万元.(结果用e表示)
解析:令z=ln =-a,则==,==,所以=-a⇒a=-4,则z=ln=+4,所以x=8代入回归方程,则z=ln=,可得=e万元.
答案:e
8.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围.令z=lny,求得经验回归方程为z=0.25x-2.58,则该模型的回归方程为 __________________ .
解析:因为z=0.25x-2.58,z=lny,
所以y=e0.25x-2.58.
答案:y=e0.25x-2.58
9.已知n组成对样本数据确定的经验回归方程为=-x+2且=4,通过残差分析,发现两组成对样本数据(-1.7,2.9),(-2.3,5.1)误差较大,除去这两组成对样本数据后,重新求得经验回归直线的斜率估计值为-1.5,则当x=-4时,= ________ .
解析:由样本数据点集{(xi,yi)|i=1,2,…,n}求得的经验回归方程为=-x+2,且=4,所以=-2,故数据的样本中心点为(-2,4),
去掉(-1.7,2.9),(-2.3,5.1),
重新求得的经验回归直线的斜率估计值为-1.5,
经验回归方程设为=-1.5x+,代入(-2,4),
求得=1,所以经验回归直线的方程为:y=-1.5x+1,将x=-4代入经验回归方程,求得y的估计值为-1.5×(-4)+1=7.
答案:7
10.已知变量x,y有如下对应数据.
x
1
2
3
4
Y
1
3
4
5
(1)作出散点图;
(2)用最小二乘法求关于x,y的经验回归方程.
解:(1)散点图如图所示.
(2)==,==,
xiyi=1+6+12+20=39,
x=1+4+9+16=30,
==,
=-×=0,
所以=x即为所求的经验回归方程.
11.在一段时间内,某淘宝网店一种商品的销售价格x(元)和日销售量Y(件)之间的一组数据为:
价格
x(元)
22
20
18
16
14
日销售
量y(件)
37
41
43
50
56
求出y关于x的经验回归方程,并说明该方程拟合效果的好坏.
参考数据:
解:作出散点图(此处略),观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.
因为==18,
==45.4,
所以==-2.35,
=45.4-(-2.35)×18=87.7.
所以经验回归方程为=-2.35x+87.7.
yi-i与yi-的值如下表:
yi-i
1
0.3
-2.4
-0.1
1.2
yi-
-8.4
-4.4
-2.4
4.6
10.6
计算 (yi-i)2=8.3, (yi-)2=229.2,所以R2=1-≈0.964.
因为0.964很接近于1,
所以该模型的拟合效果比较好.
[能力提升]
12.某公司的生产部门调研发现,该公司第二、第三季度的月用电量y与月份x线性相关,且数据统计如下:
月份
4
5
6
7
8
9
月用电量
(千瓦时)
6
16
27
55
46
56
但核对电费报表时发现一组数据统计有误.
(1)请指出哪组数据有误,并说明理由;
(2)在排除有误数据后,求月用电量与月份之间的经验回归方程=x+,并预测统计有误的那个月份的用电量.(结果精确到0.1)
解:(1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在经验回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.
(2)排除(7,55)这一组有误数据后,计算得=6.4,=30.2.
因为
=-≈-33.67,
所以经验回归方程为=9.98x-33.67,
当x=7时,≈36.2,
即7月份的用电量大约为36.2千瓦时.
13.为了研究某种细菌随时间x的变化繁殖个数Y的变化,收集数据如下:
时间
x/天
1
2
3
4
5
6
繁殖个
数Y
6
12
25
49
95
190
(1)将天数做解释变量,繁殖个数做相应变量,作出这些数据的散点图;
(2)描述解释变量与响应变量之间的关系.
解:(1)由表中数据作散点图如图所示.
(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的图象的周围,其中c1和c2是待定系数.于是令Z=1n Y,则=x+(=1n c1,=c2),因此变换后的样本点应该分布在直线=x+的周围,因此可以用经验回归模型来拟合Z与x的关系,则变换后的样本数据如表:
x
1
2
3
4
5
6
Z
1.79
2.48
3.22
3.89
4.55
5.25
由表中数据得到经验回归方程=0.69x+1.115.因此细菌繁殖个数关于时间的非线性经验回归方程为=e0.69x+1.115.
[素养培优]
14.近年来我国新能源汽车行业蓬勃发展,新能源汽车不仅对环境保护具有重大的意义,而且还能够减少对不可再生资源的开发,是全球汽车发展的重要方向.“保护环境,人人有责”,在政府和有关企业的努力下,某地区近几年新能源汽车的购买情况如表所示:
年份x
2019
2020
2021
2022
2023
新能源汽车购买
数量y(万辆)
0.40
0.70
1.10
1.50
1.80
(1)计算y与x的相关系数r(保留三位小数);
(2)求y关于x的线性回归方程,并预测该地区2025年新能源汽车购买数量.
参考公式r=
参考数值:≈3.605 6, (xi-)(yi-)=3.6.
解析:(1)==2 021,==1.10, (xi-)2=(-2)2+(-1)2+02+12+22=10, (y1-)2=(-0.7)2+(-0.4)2+02+0.42+0.72=1.3所以r==≈≈0.998;
(1) 由(1)知,
(2) =-=1.1-2 021×0.36=-726.46,
所以y关于x的线性回归方程是=0.36x-726.46,当x=2 025时,=0.36×2 025-726.46=2.54(万辆),该地区2025年新能源汽车购买数量约为2.54万辆.
学科网(北京)股份有限公司
$