内容正文:
班级
姓名
课时分层检测(十九)
元线性回归模型参
…0基础达标练0…
1.设两个变量x和y之间具有线性相关关系,:
它们的相关系数是,y关于x的回归直线
的斜率是b,在y轴上的截距是a,那么必有
()
A.b与r的符号相同B.a与r的符号相同
C.b与r的符号相反D.a与r的符号相反
2.在线性回归模型y=bx十a十e中,下列说法
正确的是
A.y=bx十a十e是一次函数
B.因变量y是由自变量x唯一确定的
C.因变量y除了受自变量x的影响外,可能
还受到其它因素的影响,这些因素会导致
随机误差e的产生
D.随机误差e是由于计算不准确造成的,可
通过精确计算避免随机误差e的产生
3.为了庆祝建党100周年,某网站从7月1日
开始推出党史类书籍免费下载活动,己知活
动推出时间x(单位:天)与累计下载量y(单
位:万次)的统计数据如表所示:
6
7
6
9
10
12
根据上表,利用最小二乘法得到经验回归方
程y=1.4.x十a,据此模型预测,活动推出11
天的累计下载量约为
(
A.13.8万次
B.14.6万次
C.16万次
D.18万次
4.(多选)由国际排联(FIVB)举办的第13届世
界杯赛事,共有12支参赛队伍.最终,中国女
排以11战全胜且只丢3局的成绩成功卫冕
本届世界杯冠军.中国女排的影响力早已超:
越体育本身的意义,不仅是时代的集体记:
110
得分
元线性回归模型
数的最小二乘估计
忆,更是激励国人持续奋斗、自强不息的精
神符号.以下是本届世界杯比赛最终结果的
相关数据,记前6名球队中,每个队的胜场数
为变量x,积分为变量y(只列出了前6名).
排名
1
2
3
4
5
6
胜场数x
11
10
6
6
6
积分y
32
28
23
211918
若y与x之间具有线性相关关系,根据表中
数据可求得y关于x的经验回归方程为y=
2.59x十a,则下列说法正确的有
()
A.a的值为2.78
B.a的值为2.14
C.若整队在此次比赛中获胜的场数是4,根
据经验回归方程其得分约为13分
D.由经验回归方程可知,当某个队伍胜场增
加1场时,其积分约增加2.59分
.(多选)对于表中x,y之间的一组数据:
6
7
8
3
甲、乙两位同学给出的拟合直线方程分别为
①0=号x十1和②=2x+2,若通过分析
得出②的拟合效果好,则下列分析理由正确
的是
A.①的残差和大于②的残差和,所以②拟合
效果更好
B.①的残差平方和大于②的残差平方和,所
以②拟合效果更好
C.①的R2小于②的R2,所以②拟合效果
更好
D.残差图中直线②的残差点分布的水平带
状区域比①的残差点分布的水平带状区
域更窄,所以直线②拟合效果更好
班级
姓名
6.已知具有线性相关关系的变量x,y满足一
组数据如下表所示.若y关于x的经验回归
方程为=3x一1.5,则m的值等于
0
23
y
1m8
7.某同学计算两个线性相关变量x与y的经
1
验回归方程是y=一3.2x十40,则相对应于
点(11,5)的残差e(e:=y:-y;)为
8.已知高三某班学生每周用于物理学习的时
间x(单位:小时)与物理成绩y(单位:分)之
间有如下关系:
x
24152319161120
161713
y
92799789644783687159
若根据上表可得经验回归直线的斜率为
3.53,则经验回归直线在y轴上的截距为
.(结果精确到0.1)
9.耐盐碱水稻俗称“海水稻”,是一种可以长在
滩涂和盐碱地的水稻.海水稻的灌溉是将海
水稀释后进行灌溉.某试验基地为了研究海
水浓度x(%)对亩产量y(吨)的影响,通过
在试验田的种植实验,测得了某种海水稻的
亩产量与海水浓度的数据如表.绘制散点图
发现,可用线性回归模型拟合亩产量y与海
水浓度x之间的相关关系,用最小二乘法计
算得y与x之间的经验回归方程为=x十
0.88.
海水浓度x:(%)
3
5
6
7
亩产量y(吨)
0.62
0.58
0.49
0.4
0.31
残差e:
(1)求6,并估计当浇灌海水浓度为8%时该
品种的亩产量;
(2)①完成上述残差表:
②统计学中常用决定系数R2来刻画回归效
果,R2越大,模型拟合效果越好,如假设R
=0.8,就说明预报变量y的差异有80%是
由解释变量x引起的.请计算决定系数R
(精确到0.01),并指出亩产量的变化多大程
度上是由海水浓度引起的?
11
得分
附:残差公式e:=y一y,
决定系数R2=1一
2”
2(y:-y)2
10.关于x与y有以下数据:
2
4
5
68
y304060
5070
已知x与y线性相关,由最小二乘法得
=6.5,
(1)求y与x的经验回归方程;
(2)现有第二个线性模型:y=7x十17,且
R2=0.82.
若与(1)的线性模型比较,哪一个线性模型
拟合效果比较好,请说明理由.
班级
姓名
…0f
能力提升练
0
1.(多选)某公司及时调整产研策略,加大研发
力度,不断推出新的产品,使2021年的经济
由亏转盈,并健康持续发展.下表为2021年
1月份至6月份此公司的经济指标y(万元)
与时间x(月份)的关系:
1
2
3
4
5
6
1m1
0.3
2.2
m2
4.5
1m3
其中m1十m2十m3=6.5,其对应的经验回归
方程为y=0.7x十a,则下列说法正确的有
A.y与x负相关
B.a=-0.2
C.经验回归直线可能不经过点(3.5,2.25)
D.2021年10月份的经济指标y大约为6.8
2.(多选)某电子商务平台每年都会举行“年货
节”商业促销狂欢活动,现统计了该平台从
2015年到2023年共9年“年货节”期间的销
售额(单位:亿元)并作出散点图,将销售额y
看成以年份序号x(2015年作为第1年)的
函数.运用excel软件,分别选择经验回归直
线和三次函数回归曲线进行拟合,效果如
图,则下列说法正确的是
)
↑y(亿元)
2500=0.168r+28.14129027+889
2000F
R=0.999
·y(亿元)
1500
y2=267x-544.22
线性y
1000
R3=0.9362------
(亿元)
5001
非线性y2
10x
(亿元)
2
46
8
A.销售额y与年份序号x呈正相关关系
B.三次函数回归模型的残差平方和大于线
性回归模型的残差平方和
C.三次函数回归曲线的拟合效果好于经验
回归直线的拟合效果
D.根据三次函数回归曲线可以预测2024年
i,
“年货节”期间的销售额约为1698.719亿元
3.已知经验回归方程y=2x十1,而试验得到一
组数据是(2,4.9),(3,7.1),(4,9.2),则残
差平方和是
11
得分
4.如图是某小区2020年1月至2021年1月当
月在售二手房均价(单位:万元/平方米)的
散点图.(图中月份代码1~13分别对应
2020年1月~2021年1月).根据散点图选
择y=a十b√x和y=c十dlnx两个模型进行
拟合,经过数据处理得到两个经验回归方程
分别为y=0.9369+0.0285√x和y=
0.9554+0.03061nx,并得到以下一些统
计量的值:
当月在售二手房均价y
1.04
1.02
1.00
0.98
0.96
0.94
12345678910111213月份代码x
y=0.9369+
y=0.9554+
0.0285√/x
0.03061nx
残差平方和2(”一)”
0.000591
0.000164
总偏差平方和2(”一y)
0.006050
(1)请利用决定系数R2判断哪个模型的拟
合效果更好;
(2)估计该小区2021年6月份的二手房均
价.(精确到0.001万元/平方米)
参考数据:ln2≈0.69,ln3≈1.10,ln17≈
2.83,ln19≈2.94,√2≈1.41,5≈1.73,
√17≈4.12√19≈4.36.
参考公式:决定系数R1少O一
2(,-y)2
=(x,-)(y一)
1.22(,-)2
外卖甲的日接单量的方差品
3.B[r=
i=1
i=
5-7)2+(2-7)2+(9-7)2+(8-7)2+(11-7)2=10.
√22(y,-)
5
21
外卖乙的日接单量的方差
2-7)2+(3-7)2+(10-7)2+(5-7)2十(15-7)=23.6,因为
5
4.ABD[散点图从左向右看呈上升趋势,所以该同学的数学成绩总
的趋势是在逐步提高,A正确:该同学在这连续9次测试中的最高
x二),<昆,即外卖甲平均日接单量与外卖乙平均日接单量相
分大于130分,最低分小于90分,极差超过40分,B正确:该同学的
同,但外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况
数学成绩与测试次号之间具有比较明显的线性相关性,且为正相
更好
关,C不正确,D正确,]
5,B[由散点图知,各点都分布在一条直线附近,则数学成绩与物理
(x,-)(y一)
=1
(2)因为r
成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次
函数关系,故①正确,②错误:若甲同学数学成绩为80分,乙同学数
学成绩为60分,此时样本数据未必与班级所有学生成绩一致,则甲
又2(z,-0(y-)=66,
同学的物理成绩未必比乙同学的物理成绩高,③错误.综上所述,正
7=1
确的结论个数为1.]
6.一、三「因为r>0,所以大多数的点都落在第一、三象限,门
(x,-x)
N1
2(y-)2≈77,
7.D
所以代入计算可得,相关系数~莞≈0.857>0.715,
8.-1[由题得x=1,5=1,之x=2,公y=56,xy=-20,
=1
=1
=1
所以可认为y与x之间有较强的线性相关关系,
则样本相关系数r
-20-4×1.5×1
=-1.]
:5.解(1)以施化肥量为横坐标,其对应的水稻产量为纵坐标,在平面
√/22-4×1.52×√/56-4×19
直角坐标系中描点,得散点图
9.解由题意得工
日×(8+11+14+20+23+26)=17.
↑水稻产量kg
500
(x,-x)2=(8-17)2+(11-17)2十(14-17)2+(20-17)2+:
450
=1
400
(23-17)2+(26-17)2=252.
350
∑(x:一x)(y:-V)
300
=1
85
85
01020304050施化肥量/kg
/252×5.5
6√7×5.5
(x-)
(2)观察散点图,知散点图中的点分布在一条直线附近,则水稻产量
与施化肥量之间具有线性相关关系.
0.97,
由此可得酶的活性指标值y与温度x具有较强的线性相关关系,
课时分层检测(十九)
0,解()由巴知得样本平均数一204=60
基础达标练
从而该地区这种野生动物数量的估计值为60×200=12000,
度直60时两变堂正相夫·光时0:当60时两支童负相
(2)样本(无:,y,)(i=1,2,…,20)的相关系数
关,此时0.故选A.]
!2.C[选项A,在线性回归模型y=bx十a十e中,方程表示的不是西
2=1
800
√80×9000
22≈0.94.
数关系,因此不是一次函数,故A错误:选项B,因变量y不是由自
3
W之(y-)2
变量x唯一确定的,故B错误:选项D,随机误差是不能避免的,只
能将误差缩小,但是不能没有误差,故D错误,只有选项C成立,]
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200
个地块进行分层随机抽样」
3.C[由表格数据知,z=4+5+6+7+8=6,=6+8+9+10+12
理由如下:由(2)知各样区的这种野生动物数量与植物藏盖面积有
很强的正相关,由于各地块间植物覆盖面积差异很大,从而各地块
=9,由经验回归方程的性质,得1.4×6十a=9,所以a=0.6,故y
间这种野生动物数量差异也很大,采用分层随机抽样的方法较好
1.4x十0.6,所以当x=11时,=1.4×11十0.6=16(万次).]
地保持了样本结构与总体结构的一致性,提高了样本的代表性,从4.ACD[由题意知正=8,=号,代入经验回归方程y=2.59x十a,
而可以获得该地区这种野生动物数量更准确的估计,
能力提升练
解得a=2.78,故A正确,B不正确:将工=4代入经验回归方程V=
1.ACD[由样本相关系数的性质知B正确,其余均错误.]
2.59x十2.78,得y=13.14≈13,故C正确:经验回归方程中x的系
2.ABC[每月最低气温与最高气温的样本相关系数≈0.83,可知每
数是2.59,故D正确.]
月最低气温与最高气温有较强的线性相关性,且二者为正线性相!5.BCD[不可以根据残差和的大小来分析模型的拟合效果的好坏,
关,由所给的折线图可以看出月温差(月最高气温一月最低气温)的
最大值出现在10月.9~12月的月温差相对于5~8月,波动性更
故A错误:用y=
宁x十1作为拟合直线时,所得y的实际值与y的
大.每月的最高气温与最低气温的平均值在所统计的前5个月里逐
月增加,在第6个月开始减少,所以A、B、C正确,D错误.]
估计值的差的平方和即残差平方和为S1=(1一号)十(2-2)+
3.A[x=15,v=108.6,
8-3+(安))+(5-号)广=子,用5=子x+号作为赵合
xiy-5zy
=1
直线时,所得残差年方和为S=(1-1)2+(2-2)2+(3-子)十
√x-5x√听-5
8285-5×15×108.6
1-0+(5号)=合S<5@的叔合效果更好,故B
≈0.9826,故相关程度
√1375-5×15×√59051-5×108.6
正确:①的R=1高器®的R=1名碧①的R小
219
很强.]
4,解(1)由表格中的数据,可得元=5+2+9十8+卫
5
=7,y
于②的R,.②拟合效果更好,故C正确:残差图中直线②的残差
2+3+10+5+15=7,
点分布的水平带状区战比①的残差点分布的水平带状区域更窄,
5
∴直线②拟合效果更好,故D正确.]
192
6.4[由于经验回归直线一定过点(工,期点(受,8计四)-定在3.0.06[因为=2x十1,故当=2时,小=5,=-0.1,x=3
7,e2=0.1,x=4,=9,e8=0.2,则e+e+e号=0.01十0.01十0.04
经验回归直线上,所以代入方程可得m=4.]
=0.06.]
7.0.2[因为y=-3.2.x十40.当x=11时,y=-3.2×11十40=
!4.解(1)设模型y=0.9369十0.0285√匠和v=0.9554+0.03061hx的
4.8,故e=5-4.8=0.2.]
决定系数分别为和,
8.13.5[由已知可得元=0×(24+15+23+19十16+11+20+
时府-1002=100
0.000164
16+17+13)=17.4,y=10
×(92+79+97+89+64+47+83+:
因为0.000591>0.000164,所以R<R.
68十71十59)=74.9.设经验回归方程为y=3.53x十a,把(x,y)代
所以模型y=0.9554十0.0306lnx的拟合效果更好.
入,得74.9=3.53×17.4十a,解得a≈13.5,则经验回归直线在y
(2)由(1)知,模型=0.9554十0.03061nx的拟合效果更好,利用
轴上的裁距为13.5.]
该模型预测可得,这个小区2021年6月份的在售二手房均价为
9.解(1)经计算,r=5,v=0.48,
y=0.9554+0.0306ln18=0.9554+0.0306(1n2+21n3)≈
由0.48=56十0.88可得,b=-0.08,
1.044(万元/平方米)
当x=8时,y=-0.08×8十0.88=0.24,
课时分层检测(二十)
所以当浇灌海水浓度为8%时,该品种的亩产量约为0.24吨.
(2)①由(1)知=-0.08x十0.88,从而有
基础达标练
:1.C[“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟,
海水浓度x,(%)
6
7
“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知
亩产量y(吨)
0.62
0.580.49
0.4
0.31
A,B都是一个分类变量所取的两个不同值.]
残差e
-0.020.020.01
0
2.A[因为3.841<X2=5.003<6.635=x0.01·又P(X≥3.841)=
-0.01
0.05,所以依据小概率值a=0.05的独立性检验,认为“X和Y有关
②R2=1
0.0004+0.0004十0.0001十0+0.0001
系”]
0.142+0.12+0.012+(-0.08)2+(-0.17)2
3.C[对于A,由右图可知,样本中多数男生喜欢手机支付,A对:对
0.00164
=1-0.06s65≈0.98,
于B,由左图可知,样本中的男生效量多于女生数量,B对:对于C,
由右图可知,样本中多数女生喜欢手机支付,C错:对于D,由右图可
所以亩产量的变化有98%是由海水浓度引起的.
知,样本中喜欢现金支付的数量少于喜欢手机支付的数量,D对,故
10.解(1)依题意设y与x的经验回归方程为y=6.5x十a,
选C.]
x-2+4+5+6+8=5,
5
:4.AC[由题意设参加调查的男、女生人数均为m,则得到如下2×2
y=30+40+60+50+70=50.
列联表:
5
喜欢攀岩
不喜欢攀岩
合计
,y=6.5.x十a经过(x,).
.50=6.5X5+a,.a=17.5,
男生
0.8m
0.2m
m
∴y与x的经验回归方程为y=6.5x十17.5.
女生
0.3m
0.7m
m
(2)由(1)的线性模型得y一少:与y:下的关系如下表:
合计
1.1m
0.9m
2m
V:一V
0.5
-3.5
10
-6.5
0.5
所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人
yi-y
20
10
10
0
20
数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,
故A正确,B错误:
所以2(,-y,)2=(-0.5)2十(-3.5)2+102+(-6.5)2+
=1
由列联表中的数据,计算得到x2-2m(0.56m-0.06m)250m
0.52=155
1.1m·0.9m·m·m99
当m=100时,
2(y,-)2=(-20)2+(-10)2+102+02+202=1000.
=
X-500_50X90≈50.505>10.828=0m1,
99
99
(y-,)2
所以R=1
=1
=1
(y,-)
1000=0.845.
155
所以当参与调查的男、女生人数均为100时,依据小概率值a
0.001的独立性检验,认为喜欢攀岩和性别有关联,故C正确,D错
=1
误,故选AC.]
由于R=0.845,R2=0.82知R>R2,
:5.D[零假设为H:经常使用手机与数学学习成绩无关,由题中数据
所以(1)的一元线性回归模型拟合效果比较好
能力提升练
可得,x-5020X55X20Y-25≈8.333>7.879=s,根据
25×25X30×20
-3
1.BD[由经验回归方程中x的系数0.7为正数知,y与x正相关,故
小概率值a=0.005的独立性检验,我们推断H。不成立,即在犯错
A选项错误:由题意可知7=石(1十2十3十4十5十6)=3.5,y
误的概率不超过0.5%的前提下,认为“经常使用手机与数学学习成
绩有关”,]
合(m+0,3十2.2十m,十.5十m)=2.25,所以a=2.25-0.7×6.0,05[设从所有人中任意轴取-个,取到春欢西班牙队的人”为
3.5=一0.2,所以y=0.7x一0.2,故B选项正确:经验回归直线过1
事件A,由已知得PA)=结5-=号,所以g=25p=25,a=40,
点(x,v),即过点(3.5,2.25),故C选项错误;令x-10,得y=0.7×
10-0.2=6.8,故D选项正确.]
b=60.X-10X25X3525X15》-25≈4.167>3.841=os
40×60×50×50
6
2.AC[由散点图的变化趋势可知,销售额y与年份序号x呈正相关1
认为年龄与西班牙队的被喜欢程度有关,这种推断犯错误的概率不
关系,故选项A正确:由散点图以及线性回归模型和三次函数回归!
超过0.05.]
模型的位置关系可知,三次西数回归糢型的残差平方和小于线性回:7.解(1)根据等高堆积条形图,采用化学疗法的治愈率为30%,
归模型的残差平方和,故选项B错误:因为0.999>0.936,所以三次:
由列联表得化学疗法治愈的人敦为18,
函数回归曲线的拟合效果好于经验回归直线的拟合效果,故选项C:
故采用化学疗法的共有18÷30%=60(人),
正确:因为三次函数为M=0.168x3+28.141x2-29.027x+
采用外科疗法的有40人,其中治愈的有40×50%=20(人).
6.889,则当x=10时,y1=2698.719(亿元),故选项D错误.]
所以列联表如下表:
193