内容正文:
课时规范练62 变量间的相关关系及回归模型
(分值:84分)
(单选题每小题5分,多选题每小题6分,填空题每小题5分)
基础巩固练
1.(2020·全国Ⅰ,理5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+bln x
2.(2024·上海,13)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
3.已知变量x与y的取值如下表:
x
1
2
3
4
5
y
5
7-m
8
9+m
11
且y对x呈现线性相关关系,则y与x的经验回归方程x+必经过的定点为( )
A.(1,5) B.(2,7-m) C.(3,8) D.(5,11)
4.对某种动物的三项指标A,B,C进行调查研究.现有这种动物若干只,设每只动物的这三项指标为(ai,bi,ci)(i∈N*).若(ai,bi)与(ai,ci)的散点图如图1和图2所示,那么关于(bi,ci)的散点图最合理的为( )
图1
图2
A B
C D
5.已知由样本数据(xi,yi)(i=1,2,3,…,6)组成的一个样本,得到经验回归方程为=2x+0.5,且=6,增加两个样本点(-1,3)和(5,10)后,得到新样本的经验回归方程为=2.5x+.在新的经验回归方程下,样本(4,9)的残差为( )
A.-2 B.-0.5 C.0.5 D.2
6.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归模型x+,对应的残差如图所示,则模型误差( )
A.满足一元线性回归模型的所有假设
B.只满足一元线性回归模型的E(e)=0的假设
C.只满足一元线性回归模型的D(e)=σ2的假设
D.不满足一元线性回归模型的E(e)=0,D(e)=σ2的假设
7.观察变量x与y的散点图发现可以用指数型模型y=aekx拟合其关系,为了求出经验回归方程,设z=ln y,求得z关于x的经验回归方程为=2x-1,则a= ,k= .
8.(13分)某公司为提升A款产品的核心竞争力,准备加大A款产品的研发投资,为确定投入A款产品的年研发费用,需了解年研发费用x(单位:万元)对年利润y(单位:万元)的影响.该公司统计了最近8年每年投入A款产品的年研发费用与年利润的数据,得到如图所示的散点图.经数据分析知,y与x正线性相关,且相关程度较高.经计算得,xi=80,yi=200,(xi-)2=250,(xi-)(yi-)=500.
(1)求y关于x的经验回归方程x+;
(2)若该公司对A款产品欲投入的年研发费用为30万元,根据(1)得到的经验回归方程,预测年利润为多少万元.
附:.
综合提升练
9.已知变量y与变量x的关系可以用模型y=c1(c1,c2为常数)拟合,设z=ln y,变换后得到一组数据如下:
x
2
3
4
5
6
z
1.02
1.20
1.42
1.62
1.84
由上表可得经验回归方程为=0.206x+,则c1=( )
A.0.206 B.e0.206
C.0.596 D.e0.596
10.(2025·海南海口模拟)已知变量x和变量y的一组成对样本数据(xi,yi)(i=1,2,3,…,n),其经验回归方程为=bx+a,若xi'=xi+4,yi'=yi-1,新样本数据(xi',yi')(i=1,2,3,…,n)得到的经验回归方程依然为=bx+a,则b=( )
A.-4 B.4 C.- D.
11.(多选题)(2026·广东佛山质量检测)有一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn),设xi,yi,由这组数据得到新成对样本数据(x1-,y1-),(x2-,y2-),…,(xn-,yn-),下面就这两组数据分别先计算样本相关系数,再根据最小二乘法计算经验回归直线,最后计算出残差平方和,则下列选项正确的有( )
附:回归直线的斜率和截距的最小二乘估计公式分别为.相关系数r=.
A.两组数据的相关系数相同 B.两组数据的残差平方和相同
C.两条经验回归直线的斜率相同 D.两条经验回归直线的截距相同
12.某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,=214.由最小二乘法得经验回归方程为x+7.4,则k的值为 ;为判断拟合效果,通过经验回归方程求得预测值(i=1,2,…,8),若残差平方和(yi-)2≈0.28,则决定系数R2≈ .(参考公式:决定系数R2=1- )
13.(15分)2024年某养殖基地考虑增加人工投入,根据市场调研与模拟,得到人工投入增量x(单位:人)与年收益增量y(单位:万元)的数据和散点图分别如下:
x
2
3
4
6
8
10
13
y
13
22
31
42
50
56
58
根据散点图,建立了y与x的两个回归模型:
模型①:=4.1x+11.8;模型②:.
(1)求出模型②中y关于x的经验回归方程(精确到0.1);
(2)比较模型①、模型②的决定系数R2的大小,说明哪个模型拟合效果更好,并用该模型预测,要使年收益增量超过80万元,人工投入增量至少需要多少人?(精确到整数)
经验回归方程x+的系数:
;模型的决定系数:R2=1-.
参考数据:令t=,则t+,且≈2.46,≈38.86,(ti-)(yi-)≈80.97,(ti-)2≈3.78;模型①中(yi-)2=182.42;模型②中(yi-)2=74.12.
参考答案
课时规范练62 变量间的相关关系及回归模型
1.D 解析 结合题中散点图,由图象的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+bln x.
2.C 解析 成对数据相关分析中,若相关系数为正数,则两个变量的值多为同时增加或同时减少.由此可知A,B,D选项错误,C选项正确.故选C.
3.C 解析 由于=3,=8,
则线性回归方程必过定点(3,8).故选C.
4.A 解析 因为指标A,B满足正相关,指标A,C满足负相关,可知指标B,C满足负相关,故C错误;且(bi)max∈(4,6),(ci)max∈(5,7),i∈N*,故B,D错误.故选A.
5.C 解析 设新样本的均值为,则=5,=11,所以11=2.5×5+,解得=-1.5,所以新样本的经验回归方程为=2.5x-1.5,预测值=2.5×4-1.5=8.5,所以残差为9-8.5=0.5.故选C.
6.D 解析 根据一元线性回归模型中对随机误差的假定,残差应是均值为0,方差为σ2的随机变量的观测值,在残差图中显示应均匀分布在以取值为0的横轴为对称轴的水平带状区域内.而图中的残差与观测时间存在线性关系,说明均值不为0,残差的方差不是一个常数,所以不满足一元线性回归模型的所有假设.故选D.
7.e-1 2 解析 由题意知,ln =2x-1,所以=e2x-1=e-1·e2x.又y=aekx,所以a=e-1,解得k=2.
8.解 (1)∵xi=80,yi=200,
∴=10,=25.
∵(xi-)2=250,(xi-)(yi-)=500,
∴=2,
∴=25-2×10=5.
故y关于x的经验回归方程为=2x+5.
(2)由(1)可得,=2x+5.
∴当x=30时,=2×30+5=65.
∴对A款产品投入30万元年研发费用,年利润约为65万元.
9.D 解析 由表格中数据得=4,
=1.42,
代入方程,得1.42=0.206×4+,解得=0.596,因此=0.206x+0.596.
由y=c1两边取对数,得ln y=c2x+ln c1.
又z=ln y,所以c2=0.206,ln c1=0.596,即c1=e0.596.故选D.
10.C 解析 记,
则+4,同理-1,
所以点(),(+4,-1)都在直线=bx+a上,所以
解得b=-.故选C.
11.ABC 解析 由于新成对样本数据(x1-,y1-),(x2-,y2-),…,(xn-,yn-),其平均数分别为=0,同理=0,
这样根据公式,r=,
用样本数据减去平均数得xi-与新成对数据(xi-)-=(xi-)-0=xi-,
用样本数据减去平均数得yi-与新成对数据(yi-)-=(yi-)-0=yi-,
即它们每一个对应数据的差值都是一样的,
这就说明两条经验回归直线的斜率相同,两组数据的相关系数相同,故A,C正确;
由于回归直线经过样本数据的样本点为(),而新数据的样本点为(0,0),
即样本数据的回归直线方程为y-(x-),而新数据的回归直线方程为y=x,
故两条经验回归直线的截距不相同,故D错误;
由于样本数据回归直线和新数据回归直线是平行关系,所以实际值与估计值的差的平方和应该是相同的,即两组数据的残差平方和相同,故B正确.故选ABC.
12.-0.3 0.98 解析 因为f=cWk,两边取对数可得ln f=ln c+kln W.又xi=ln Wi,yi=ln fi,依题意,经验回归方程x+7.4必过样本中心点(),所以5=8+7.4,解得=-0.3,所以k=-0.3.又R2=1-=1-≈1-=0.98.
13.解 (1)令t=,则模型②为t+.由≈2.46,≈38.86,(ti-)(yi-)≈80.97,(ti-)2≈3.78,得≈21.4,=38.86-21.4×2.46≈-13.8,所以模型②中y关于x的经验回归方程是=21.4-13.8.
(2)模型①中的决定系数R2=1-,模型②的决定系数R2=1-,因为182.42>74.12,所以模型①中的决定系数小于模型②的决定系数,所以模型②的拟合效果更好.
在模型②下,年收益增量超过80万元,则有21.4-13.8>80,所以x>()2≈19.2,所以人工投入增量至少需要20人.
学科网(北京)股份有限公司
$