内容正文:
8.2一元线性回归模型及其应用
8.2.1一元线性回归模型+8.2.2
一元线性回归模型参数的最小二乘估计
白题
基础过关
限时:40min
题组1线性回归分析
A.y与x具有负的线性相关关系
1.如图所示的四个散点图中,适合用线性回归模
B.m=6.25
型拟合其中两个变量的是
C.点(2,25)落在经验回归直线下方
D.x=15时,y的值为-9
5.(2024·黑龙江绥化高二期中)某研究机构对
高三学生的记忆力x和判断力y进行统计分
析,获得的数据如下表,
A.①②B.①③
C.②③
D.③④
2.(2024·湖北十堰高二期末)已知一系列样本
5
8
10
12
点(x,y:)(i=1,2,3…)的一个经验回归方
2
3
6
程为y=9x+a.若x=10,y=22,则a=(
请根据上表提供的数据,求出y关于x的经验
A.67
B.68
C.-67D.-68
回归方程为
据此可预测判断
3.为研究学生的语文成绩和英语成绩之间是否
力为4的同学的记忆力为
具有线性相关关系,统计某班两科成绩得到
(经验回归方程是y=x+a,其中b=
如图所示的散点图(两坐标轴单位长度相
含n
同),用经验回归直线y=x+a近似地刻画其
,a=y-Bx)
Exi-nx
相关关系,根据散点图,下列结论最有可能成
i=
题组2
回归效果的刻画方式
立的是
(
6.(多选)(2024·浙江绍兴高二期中)下列关于
A.线性相关关系较强,b的
y(英语成绩)
回归分析的说法中正确的是
(
)
值为1.25
A.经验回归直线一定过样本中心(x,y)
B.线性相关关系较强,b的
2
B.两个模型中残差平方和越小的模型拟合的
值为0.83
0
x(语文成绩)
效果越好
C.线性相关关系较强,b的值为-0.87
C.若甲、乙两个模型的R2分别约为0.98和
D.线性相关关系太弱,无研究价值
0.80,则模型乙的拟合效果更好
4.(多选)(2024·福建漳州高二期末)已知在某
D.残差图中残差点比较均匀地落在水平的带
次试验中获得数据如下,
状区域中,说明选用的模型比较合适
2
10
7.(2024·安徽毫州高二期末)某市旅游局对全
2
3
4
市各旅游景区的环境进行综合治理,投入不同
25
19
1512
4
数额的经费x(单位:千万元),得到各旅游景
y与x线性相关,且经验回归方程为y=
区收益的增加值y(单位:万元),对应数据如
-2.4x+27,则下列正确的是
下表所示
第八章黑白题55
重难聚焦
2
题组3
3
非线性回归分析
11.(2024·江西新余高二月考)某人新房刚装
若x与y的经验回归方程为y=1.214x+a,则
修完,为了监测房屋内空气质量的情况,每
相应于点(7,9)的残差是
天在固定的时间测一次甲醛浓度(单
A.-0.358
B.0.358
位:mgm3),连续测量了10天,所得数据绘
C.-8.642
D.8.642
制成散点图如下
8.(2024·福建泉州高二期中)为研究某地区一
甲醛浓度y/mg/m)
6
段时间内的复工率,用模型(1)和模型(2)模
拟复工率y(%)与复工时间x(x的取值为5,
10,15,20,25,30,单位:天)的回归关系.设两
0012345678910天数:
模型的决定系数依次为R和,若两模型的
用y:表示第i(i=1,2,…,10)天测得的甲醛
残差图分别如下,则
(
浓度,令=n,经计算得号=128,
模型()的残差图
模型(2)的残差图
h
残3
残,
艺0=385,2a=60
%
(1)由散点图可知,y与i可用指数型回归
-6
51015202530
51015202530
模型进行拟合,请利用所给条件求出经
A.Ri<R2
验回归方程.(系数精确到0.01)
B.R=R
(2)已知房屋内空气中的甲醛浓度的安全
C.R>
范围是低于0.08mg/m3,则根据(1)中
所得经验回归方程,该新房装修完第几
D.R,R关系不能确定
天开始达到此标准?(参考数据:
9.已知一系列样本点(x,)(i=1,2,3,…,9)满
ln0.08≈-2.53)
足了=5,含2=265,由最小二乘法得到y与x
附:6盈307列
xy:-n元可
i=1
(1,2,3,…,9)的经验回归方程.现用决定系数
含(黑刘
R来判断拟合效果(R2越接近1,拟合效果越
a=y-Bx.
好),若()2=1.60,则R2=
参考公式:决定系数R=1
含
含(x-
10.已知一系列样本点(x,y)(i=1,2,3,…,n)
的经验回归方程为y=x+a.若样本点(1,1)
与(2,4)的残差相同,则=
选择性必修第三册·RJ黑白题56四方法总结
相关系数和相关程度:
①当>0时,表明两个变量正相关:当r<0时,表明两个变量负相关;
②1rl≤1,且Ir越接近1,两个变量的线性相关程度越强:lr|越接近
0,两个变量的线性相关程度越弱,几乎不存在线性相关关系;
③如果Irl>0.75,那么两个变量有很强的线性相关关系,这时求线性
回归方程有必要也有意义,否则,在11≤0.75时,求到的回归直线就
没有多大意义.
4.C解析:由散点图可知第1幅题图表示的是正相关,故r1>0;第2,3
幅题图表示的是负相关,且第2幅题图中的点比第3幅题图中的点
分布更为集中,故r2,r3<0,且1r21>|r3I,故2<r3<0,综合可得T2<
r3<1,即r1>3>r2故选C.
5.0.99解析:由题意,知云=1+2+3+45+6+7:40,万
7
290+3:.30+3.60+4.40+4.80+5.20+5.90=4.30,2(x-)2=(1-4)2+
(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28.
14.00
所以r=
28x7.08198.24i4100.9,所以y与x的相关系数
14.0014.00
近似为0.99.故答案为0.99
8.2一元线性回归模型及其应用
8.2.1一元线性回归模型+
8.2.2一元线性回归模型参数的最小二乘估计
白题基础过关
1,B解析:由题图易知,①③两个散点图中的样本点都在一条直线附
近,因此适合用线性回归模型拟合故选B.
2.D解析:由题意得22=9×10+a,得a=-68.故选D.
3.B解析:题图中,变量的对应点分布在一条直线附近,且比较密集
故可判断语文成绩和英语成绩之间具有较强的线性相关关系,且直
线斜率小于1.故选B.
4.AD解析:少=-24x+27,6=-24<0,放A正确元=m+19,
15,经验回归方程经过样本中心点(玉,),.27-2.4×m+19
5
=15,m=
6,故B错误;把x=2代人经验回归方程得y=27-2.4×2=22.2<25
点(2,25)落在经验回归直线上方,故C错误;当x=15时,y=27
2.4×15=-9,故D正确.故选AD.
5.y=0.7x-2.39解析:设y关于x的经验回归方程为y=x+a,且经
验回归直线过样本中心点(玉,),由题表数据得玉=6+8+10+1-=9,
4
万-2+3+5+6-4,交x=6x2+8x3+10x5+12x6=158,号=62+82+
4
4
A
102+122=344,故根据最小二乘原理知)=
含-4
158-4×9x4=0.7,所以a=-6x=4-07×9=-2.3,即经验回归方程为
344-4×92
y=0.7x-2.3.将y=4代入方程,得x=9,即可预测判断力为4的同学
的记忆力为9.故答案为y=0.7x-2.3:9.
6.ABD解析:经验回归直线一定过样本中心(x,),A正确;两个模型
中残差平方和越小的模型拟合的效果越好,B正确:甲、乙两个模型
的R2分别约为0.98和0.80,则模型甲的拟合效果更好,C错误;残差
图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比
较合适,D正确.故选ABD.
7.B解析:=1+2+3+4+5+6+7
4,万=2+3+2+5+7+7+9=5,所以à
7
7
y-bx=5-1.214×4=0.144,y=1.214x+0.144.当x=7时,y=1.214×7+
0.144=8.642,因此残差为9-8.642=0.358.故选B.
8.A解析:根据残差图,模型(2)残差点比较均匀地落在水平的带状
区域中,带状区域宽度窄,拟合精度较高,所以R<贬,故选A.
参考答案
)2
是()2
9.0.96
解析:因为2=1-
=1-
=1-
含8-9明
265-9x3=0.96.散答案为0.96.
1.60
10.3解析:由残差的定义可得1-(3+a)=4-(2b+a),化简得3=3.故
答案为3
重难聚焦
1熊,0令k因为品2总=5,2=18
10台
所以名=
2-102
60-10x5.5×1.28=-0.13,a=z-6i=1.28+
385-10×5.52
1
0.13×5.5≈2.00
因此=2-0.13i,即y=e2-013,所以所求经验回归方程为y=e2-0.135
(2)由(1)知,产=e20<008,即2-Q13ha08≈-253,解得>2*253
0.13
因为i取整数,所以i=35,即在新房装修完第35天开始达到此标准
四方法总结
解决非线性回归分析问题的一般方法和步骤:
(1)确定变量:确定解释变量为x,响应变量为y;
(2)画散点图:通过观察散点图并与已学过的函数(幂函数、指数函
数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;
(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;
(4)分析拟合效果:通过计算决定系数或相关系数等来判断拟合效果;
(5)写出非线性回归方程,
8.1~8.2阶段综合
黑题阶段强化
1.C解析:影响的是经验回归直线的斜率,r影响的是两个变量之间
的相关性,所以?与之间数值大小没有关系,但符号有影响,故
选项AB错误;若r大于零,则说明两个变量之间呈现正相关,故?一
定大于零,故选项C正确,D错误故选C
2.ACD解析:对于A:对于经验回归方程y=-2x+2,变量x每增加1个
单位,则y平均减少2个单位,故A正确;
对于B:Ir越接近于1,则x,y之间的线性相关程度越强,Ir越接近
于0,则x,y之间的线性相关程度越弱,故B错误;
对于C:在残差图中,残差点分布的水平带状区域越窄,说明波动越
小,即模型的拟合精度越高,拟合效果越好,故C正确;
对于D:若增加的样本点恰好为原经验回归直线的样本中心点时,则
增加该样本点后,经验回归方程不会发生改变,故D正确.故选ACD.
1
3.B解析:由题意得元=5×(2+4+5+6+8)=5,了=5×(30+40+50+
60+70)=50,∴.样本中心为(5,50).:经验回归直线y=7x+ā过样本
中心(5,50),.50=7×5+a,解得a=15,.经验回归方程为y=7x+
15.当x=10时,y=7×10+15=85,故当投入10万元广告费时,销售额
的预测值为85万元.故选B.
4.B解析:因为所有样本点都在直线y=-2x+1上,所以经验回归方程是
y=-2x+1,可得这两个变量是负相关,故这组样本数据的样本相关系数为
负值,且所有样本点都在直线上,则有1rl=1,∴.相关系数r=-1故选B.
5.AC解析:因为共8个点且离群点B的横坐标较小而纵坐标相对过
大,去掉离群点后经验回归方程的斜率更大,而截距变小,所以C正
确,D错误;去掉离群点后相关性更强,拟合效果也更好,且是正相
关,所以T1<T2,R<R3,故B错误,A正确.故选AC.
6.C解析:根据题图可知,散点大致分布在一条“对数型”函数曲线的
周围,而A选项是“抛物线型”的拟合函数,且是增加的:B选项是
“直线型”的拟合函数,且是增加的;D选项是“幂函数型”的拟合函
数,且是增加的,只有C选项的拟合函数符合题意故选C.
7.4.5解析:因为在样本(4,3)处的残差为-0.15,即y-y=3-(0.7×4+
a)=-0.15,所以a=0.35,所以经验回归方程为y=0.7x+0.35.
黑白题27