内容正文:
9.1.2 线性回归方程
[课时跟踪检测]
1.船员人数y关于船的吨位x的线性回归方程是=95+0.06x.如果两艘轮船吨位相差1 000吨,则船员平均人数相差 ( )
A.40 B.57
C.60 D.95
解析:选C 由于船员人数y关于船的吨位x的线性回归方程是=95+0.06x,两艘轮船吨位相差1 000吨,所以船员平均人数的差值是0.06×1 000=60.
2.已知一组数据(xi,yi)(i=1,2,…,20)满足线性关系,且线性回归方程为=10x+30,若xi=3,则yi= ( )
A.30 B.60
C.630 D.1 200
解析:选D 易知样本数据的中心点(,)在线性回归方程=10x+30上,易知=xi=3,所以=10×3+30=60,即=yi=60,可得yi=1 200.
3.某地区为研究居民用电量y(单位:度)与气温x(单位:℃)之间的关系,随机统计了某4天的用电量与当天的气温,并得到了如下数据:
气温x/℃
3
6
9
12
用电量y/度
24
20
14
10
由表中数据得到的线性回归方程为=x+,若=-1.6,则的值为 ( )
A.27 B.29
C.34 D.36
解析:选B 由已知==7.5,==17,所以17=-1.6×7.5+,解得=29.
4.[多选]下列说法正确的是 ( )
A.若随机变量X服从两点分布,且P(X=0)=,则E(X)=
B.某人在10次射击中,击中目标次数为X,X~B(10,0.7),当X=7时概率最大
C.在线性回归方程=-0.3x+10中,当自变量每增加1个单位时,因变量将平均减少0.3个单位
D.设随机变量X~B(n,p),若D(X)≤3恒成立,则n的最大值为12
解析:选BCD 对于A,因为随机变量X服从两点分布且P(X=0)=,所以P(X=1)=,所以E(X)=0×+1×=,故A错误.对于B,P(X=k)=·0.7k·0.310-k,
由得
解得6.7≤k≤7.7,所以k=7,即当X=7时概率最大,故B正确.对于C,在线性回归方程=-0.3x+10中,当自变量每增加1个单位时,因变量将平均减少0.3个单位,故C正确.对于D,因为随机变量X~B(n,p),D(X)≤3恒成立,所以D(X)=np(1-p)≤3恒成立,所以np(1-p)=n(p-p2)=-n+≤≤3,所以n≤12,故D正确.故选BCD.
5.(5分)某地种植超级杂交稻,产量从第一期大面积亩产760千克,到第二期亩产810千克,第三期亩产860千克,第四期亩产1 030千克.将第一期视为第二期的父代,第二期视为第三期的父代,或第一期视为第三期的祖父代,并且认为子代的产量与父代的产量有关,请用线性回归分析的方法预测第五期亩产为 千克.
附:用最小二乘法求得线性回归方程为=x+,其中=,=-.
解析:设父代产量为xi(i=1,2,3),子代产量为yi(i=1,2,3),
则=×(760+810+860)=810,=×(810+860+1 030)=900,
所以(xi-)(yi-)=(-50)×(-90)+0×(-40)+50×130=11 000,
=(760-810)2+(810-810)2+(860-810)2=5 000,
所以===2.2,=-=900-2.2×810=-882,
则线性回归方程为=2.2x-882.
当x=1 030时,=1 030×2.2-882=1 384,
所以预测第五期亩产为1 384千克.
答案:1 384
6.(5分)已知变量x与y的一组样本数据(x1,y1),(x2,y2),…,(x6,y6)满足x1x2x3x4x5x6=e24.6,y1y2y3y4y5y6=e18.3,对各样本数据求对数,再利用线性回归分析的方法得到ln y=1+bln x.若变量z=2y-0.5x,则当z的预测值最大时,变量x的取值约为 .(e2≈7.4,结果保留1位小数)
解析:由已知可得ln x1+ln x2+ln x3+ln x4+ln x5+ln x6=24.6,所以×(ln x1+ln x2+ln x3+ln x4+ln x5+ln x6)=4.1,同理×(ln y1+ln y2+ln y3+ln y4+ln y5+ln y6)=3.05,代入ln y=1+bln x,得3.05=1+4.1b,所以b=0.5,所以y=e,则z=2e-0.5x,令t=,则z(t)=-0.5t2+2et=-(t-2e)2+2e2,当t=2e时,z取最大值,此时x=4e2≈29.6.
答案:29.6
7.(10分)我国某农业大学植物研究所相关人员为了解仙人掌的植株高度y(单位:cm),与其根茎长度x(单位:cm)之间是否存在线性相关关系,通过采样和数据记录得到如下数据:
样本编号i
1
2
3
4
根茎长度xi
10
12
14
16
植株高度yi
62
86
112
132
(1)由上表数据计算相关系数r,并说明是否可用线性回归模型拟合y与x的关系;(若|r|>0.75,则可用线性回归模型拟合,计算结果精确到0.001)(5分)
(2)求y关于x的线性回归方程.(5分)
附:相关系数r=.
参考数据:=20,=2 792,≈59.1.
解:(1)易得=×(10+12+14+16)=13,=×(62+86+112+132)=98,
(xi-)(yi-)=(-3)×(-36)+(-1)×(-12)+1×14+3×34=236,
故r===≈≈0.998.
则|r|>0.75,故可用线性回归模型模拟.
(2)===11.8,
=-=98-11.8×13=-55.4,
故y关于x的线性回归方程为=11.8x-55.4.
8.(15分)随着科技的发展,手机的功能已经非常强大,各类APP让用户的生活质量得到极大提升的同时,也带来了一些问题,如有不少青少年沉迷于手机游戏,对青少年健康成长带来不小的影响.为了引导青少年抵制不良游戏,适度参与益智游戏,某游戏公司开发了一款益智游戏,在内测时收集了玩家对每一关的平均过关时间,如表:
关卡x
1
2
3
4
5
6
平均过关
时间y(秒)
51
79
121
130
237
353
(1)通过散点图分析,可用模型y=ea+bx拟合y与x的关系,试求y关于x的回归方程(系数a,b精确到0.01);(7分)
(2)从表中6关过关时间中随机抽取2个,求这两个过关时间均低于6关过关时间的平均数的概率.(8分)
参考数据:
y
51
79
121
130
237
353
ln y
3.932
4.369
4.796
4.868
5.468
5.866
ui=29.299,xiui=109.066,其中ui=ln yi.
解:(1)令ln y=u,由y=ea+bx,得ln y=a+bx,即u=a+bx,
==3.5,==≈4.883,=12+22+32+42+52+62=91,
所以=≈≈0.373,
所以=-≈4.883-0.373×3.5=3.577 5,故≈0.37,≈3.58,
所以=e3.58+0.37x.
(2)=≈161.8,
由题意知,过关时间低于161.8秒的为第1,2,3,4关,记作a,b,c,d,
超过161.8秒的为第5,6关,记作A,B,从中任取两个的样本点有ab,ac,ad,aA,aB,bc,bd,bA,bB,cd,cA,cB,dA,dB,AB,共15个.其中均低于161.8秒的有ab,ac,ad,bc,bd,cd,共6个,故所求概率P==.
9.(15分)设某幼苗从观察之日起,第x天的高度为y cm,测得的一些数据如表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数据的散点图发现:y(cm)与x(天)之间近似满足关系式y=b+a,其中a,b均为大于0的常数.
(1)试借助线性回归模型,根据所给数据,用最小二乘法对a,b作出估计,并求出y关于x的回归方程;(7分)
(2)在作出的这组数据的散点图中,甲同学随机圈取了其中的4个点,记这4个点中幼苗的高度大于的点的个数为ξ,其中为表格中所给的幼苗高度的平均数,试求随机变量ξ的分布列和数学期望.(8分)
解:(1)令μ=,则y=bμ+a,根据已知数据表得
x
1
4
9
16
25
36
49
μ=
1
2
3
4
5
6
7
y
0
4
7
9
11
12
13
则==4,==8,
可得μiyi=1×0+2×4+3×7+4×9+5×11+6×12+7×13=283,
=1+4+9+16+25+36+49=140,
所以===,
因为线性回归方程=μ+过点(,),则=-=-,
所以y关于x的回归方程为=-.
(2)由题意可知7天中幼苗高度大于=8的有4天,小于等于8的有3天,
从散点图中任取4个点,即从这7天中任取4天,
所以这4个点中幼苗的高度大于的点的个数ξ的可能取值为1,2,3,4,则
P(ξ=1)==,P(ξ=2)==,
P(ξ=3)==,P(ξ=4)==,
所以随机变量ξ的概率分布为
ξ
1
2
3
4
P
E(ξ)=1×+2×+3×+4×=.
学科网(北京)股份有限公司
$