内容正文:
8.2 第1课时 一元线性回归模型及其应用
[课时跟踪检测]
1.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的R2如下,其中拟合效果最好的模型是 ( )
模型
模型1
模型2
模型3
模型4
R2
0.98
0.80
0.50
0.25
A.模型1 B.模型2
C.模型3 D.模型4
解析:选A 决定系数R2=0.98最大,拟合效果最好.
2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x的经验回归方程为 ( )
A.=x+1 B.=x+2
C.=2x+1 D.=x-1
解析:选A 易求=2.5,=3.5,且=1,所以=3.5-1×2.5=1,因此经验回归方程为=x+1.
3.两个线性相关变量x与y的统计数据如表所示:
x
9
9.5
10
10.5
11
y
11
10
8
6
5
其经验回归方程是=x+40,则相对应于点(11,5)的残差为 ( )
A.0.1 B.0.2
C.0.3 D.0.4
解析:选B 由于=x+40过样本中心点(10,8),所以8=10+40,则=-3.2,因此=-3.2x+40.当x=11时,=-3.2×11+40=4.8,所以残差=5-=5-4.8=0.2.
4.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归方程=x+,对应的残差如图所示,模型误差 ( )
A.满足一元线性回归模型的所有假设
B.满足回归模型E(e)=0的假设
C.满足回归模型D(e)=σ2的假设
D.不满足回归模型E(e)=0和D(e)=σ2的假设
解析:选D 由残差图可以看出,图中的残差点不能拟合成一条直线,且不满足D(e)=σ2.
5.[多选]已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是 ( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈负相关关系
B.m=4
C.可以预测,当x=11时,y约为2.6
D.由表格数据知,该经验回归直线必过点(9,4)
解析:选ACD 由=-0.7x+10.3,得=-0.7,故x,y呈负相关关系,则A正确.==9,=-0.7×9+10.3=4=,解得m=5,B错误.当x=11时,y的预测值为2.6,故C正确.=9,=4,故经验回归直线必过点(9,4),则D正确.
6.为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x与y之间有线性关系,设其经验回归方程为=x+,已知xi=400,yi=1 580,=-1,若该班某学生的听力成绩为26,据此估计其笔试成绩约为 ( )
A.99 B.101
C.103 D.105
解析:选C xi=400,故==20;yi=1 580,故==79,故点(20,79)在经验回归直线上,即79=20-1,得=4,即=4x-1,当x=26时,代入计算得到=103.
7.[多选]设(x1,y1),(x2,y2),…,(x2 024,y2 024)是变量x和y的2 024个样本点,直线l是由这些样本点通过最小二乘法得到的经验回归直线,如图所示,下列结论正确的是 ( )
A.直线l过点(,)
B.直线l过点(x1 012,y1 012)
C.x和y的样本相关系数在区间[-1,0)上
D.因为2 024是偶数,所以分布在直线l两侧的样本点的个数一定相同
解析:选AC 经验回归直线一定过样本中心点,但不一定过某个样本点,故A正确,B错误;由题图可知x和y的样本相关系数在区间[-1,0)上,故C正确;不能因为2 024是偶数就断定分布在直线l两侧的样本点的个数相同,故D错误.
8.[多选]已知两个变量y与x线性相关,为研究其具体的线性关系进行了10次试验.试验中不慎丢失2个数据点,根据剩余的8个数据点求得的经验回归方程为=3x+4.5,且=4,又增加了2次试验,得到2个数据点(2,11),(6,22),根据这10个数据点重新求得经验回归方程为=mx+n(其中m,n∈R),则 ( )
A.变量y与x正相关
B.m<3
C.n<4.5
D.经验回归直线=mx+n经过点(4,16.5)
解析:选ABD 设A(2,11),B(6,22),由kAB=<3,而8个数据点的经验回归方程中=3,∴0<m<3,A、B正确;而10个数据点的'==4,==16.5,∴经验回归直线过定点(4,16.5),则16.5=4m+n,n=16.5-4m,0<m<3,0<4m<12,-12<-4m<0,4.5<16.5-4m<16.5,即4.5<n<16.5.∴D正确,C错误.
9.(5分)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:
时间x
1
2
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为 ,用线性回归分析的方法,预测小李该月6号打6 h篮球的投篮命中率为 .
解析:===0.5,==3.由公式得=0.01,从而=-=0.5-0.01×3=0.47,所以经验回归方程为=0.47+0.01x,所以当x=6时,=0.47+0.01×6=0.53.
答案:0.5 0.53
10.(5分)某工厂为研究某种产品产量x(吨)与所需某种原料y(吨)的相关性,在生产过程中收集4组对应数据(x,y)如表所示:
x
3
4
6
7
y
2.5
3
4
m
根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为 .
解析:根据样本(4,3)处的残差为-0.15,即3-(0.7×4+)=-0.15,可得=0.35,故经验回归方程为=0.7x+0.35,又由样本数据的平均数为==5,=,所以0.7×5+0.35=,解得m=5.9.
答案:5.9
11.(10分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,=720.
(1)求家庭的月储蓄y对月收入x的经验回归方程=x+;(4分)
(2)判断变量x与y之间是正相关还是负相关;(3分)
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.(3分)
解:(1)由题意,知n=10,=xi==8,
=yi==2,
又-10=720-10×82=80,
xiyi-10 =184-10×8×2=24,则==0.3,=-=2-0.3×8=-0.4,
故所求经验回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.
(3)将x=7代入经验回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
12.(15分)假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如表的统计资料:
使用年限x/年
2
3
4
5
6
维修费用y/万元
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系,试求:
(1)经验回归方程=x+;(5分)
(2)估计使用年限为10年时,维修费用是多少?(3分)
(3)计算残差平方和;(4分)
(4)求R2并说明模型的拟合效果.(3分)
参考数据: xiyi=112.3,(yi-)2=15.78.
解:(1)由统计表格,易知=4,=5,=90.
又xiyi=112.3.设经验回归方程为=x+,
(2)当x=10时,=1.23×10+0.08=12.38,
估计使用年限为10年时维修费用是12.38万元.
(3)因为=2.46+0.08=2.54,
=3.77,=5,=6.23,=7.46,
所以残差平方和(yi-)2=0.651.
学科网(北京)股份有限公司
$