内容正文:
8.1~8.2
阶段综合
黑题
阶段强化
限时:45min
1.设一组成对数据的相关系数为r,经验回归方5.(多选)(2024·广东东莞高二期末)变量x与
程为y=bx+a,则下列说法正确的为
(
y的成对数据的散点图如下图所示,由最小二
A.6越大,则r越大
乘法计算得到经验回归直线L,的方程为y=
B.越大,则r越小
bx+a1,相关系数为T1,决定系数为R;经过残
C.若r大于零,则?一定大于零
差分析确定第二个点B为离群点(对应残差
D.若r大于零,则一定小于零
过大),把点B对应的数据去掉后,用剩下的
2.(多选)(2024·河南焦作高二期末)下列有关
7组数据计算得到经验回归直线L,的方程为
回归分析的结论中,正确的有
(
y=i2x+a2,相关系数为r2,决定系数为R,则
A.对于经验回归方程y=-2x+2,变量x每增
以下结论正确的是
加1个单位,则y平均减少2个单位
B.两个变量x,y的相关系数r越小,x,y之间
80
70
的线性相关程度越弱
60
C.在残差图中,残差点分布的水平带状区域
40
越窄,说明模型的拟合效果越好
10
D.用最小二乘法求得一组成对数据的经验回
19
3
35455565元
归方程,若增加一个新的样本点,则新得到
A.I1<r2
B.R'>R2
的经验回归方程可能不变
C.B<B,
D.aj<az
3.(2024·山东聊城高二月考)已知某种商品的
6.(2024·河南商丘高二期末)某科技公司随着
广告费支出x(单位:万元)与销售额y(单位:
技术的进步和管理的逐渐规范,生产成本逐年
万元)之间有如下对应数据:
降低.该公司对2011年至2023年的生产成本
y(万元)进行统计,根据统计数据作出如下散
4
5
6
8
点图:
y
3040
50
60
70
↑生产成本y/万元
3600
根据上表可得经验回归方程y=x+a,计算得
3500
3400
?=7,则当投人10万元广告费时,销售额的预
3300
3200
测值为
(
3100
3000
A.75万元
B.85万元
C.99万元
D.105万元
由此散点图,判断下列四个经验回归方程类型
4.(2024·江西鹰潭高二期末)关于(x,y)的
中最适合作为2011年至2023年该公司的生
组样本数据(1,-1),(2,-3),(3.5,-6),(5,
产成本y与时间变量x(x的值依次为1,2,…,
-9),…,(30.5,-60)的散点图中,所有样本点
13)的经验回归方程类型的是
(
均在直线y=-2x+1上,则这组样本数据的样
A.y=ax2+b(a>0)
B.y=ax+b(a>O)
本相关系数r为
C.y=aln x+b(a<0)
D.y=4+b(a<0)
A.-2
B.-1
C.1
D.2
第八章黑白题57
7.(2023·江苏南通高二期中)某工厂为研究某
y
种产品的产量x(单位:吨)与所需某种原材料
的质量y(单位:吨)的相关性,在生产过程中
10.15109.94
3.04
0.16
13.94
13
收集了4组对应数据(x,y),如下表所示.(残
-13·7
-1
差=观测值-预测值)
-2.1
11.67
3
4
5
6
-13P
盏-137
2.5
3
4
m
0.21
21.22
根据表中数据,得出y关于x的经验回归方程
且(sy:)与(,y:)(i=1,2,3,…,13)的相关
为y=0.7x+a.据此计算出在样本(4,3)处的残
系数分别为71,12,且2=-0.9953.
差为-0.15,则表中m的值为
(1)用相关系数说明哪种模型建立y与x的经
8.(2024·安微合肥高二月考)以模型y=es-2去
验回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x
拟合一组数据时,已知如下数据:三x=18,
的经验回归方程;
y12yyy6=e24,则实数k的值为
(3)已知企业的利润z与x,y的关系为z=
104,求当x为何值时,:的响应值
91
9.(2024·山东枣庄高二月考)为了促进锂电产
业发展,市创新研究院课题组对企业研发经费
最大
的投入和企业当年的销售收入的关系进行了
参考数据和公式:0.21×21.22=4.4562,
研究,他们收集了上一年不同企业销售收入
11.67×21.22=247.6374,√247.6374=
y(单位:10万元)与一定范围内的研发经费
15.7365,对于一组数据(4,:)(i=1,2,
3,…,n),其经验回归方程ù=Bu+a的斜
x(单位:10万元)的数据,根据收集的13组观
率和截距的最小二乘估计分别为B=
测数据,得到如下的散点图:
↑销售收入10万元
含uni而
a=D-Bu,相关系数
112
111
含-
110
109
uw,-nu元
i=1
108
107
-n·-n
1
106
02
468101214161820
研发经费10万元
根据散点图,分别利用y=a+bx或y=c+4建
立y关于x的经验回归方程,令5=,=1得
2
到如下数据:
进阶突破拔高练P15
选择性必修第三册·RJ黑白题58四方法总结
相关系数和相关程度:
①当>0时,表明两个变量正相关:当r<0时,表明两个变量负相关;
②1rl≤1,且Ir越接近1,两个变量的线性相关程度越强:lr|越接近
0,两个变量的线性相关程度越弱,几乎不存在线性相关关系;
③如果Irl>0.75,那么两个变量有很强的线性相关关系,这时求线性
回归方程有必要也有意义,否则,在11≤0.75时,求到的回归直线就
没有多大意义.
4.C解析:由散点图可知第1幅题图表示的是正相关,故r1>0;第2,3
幅题图表示的是负相关,且第2幅题图中的点比第3幅题图中的点
分布更为集中,故r2,r3<0,且1r21>|r3I,故2<r3<0,综合可得T2<
r3<1,即r1>3>r2故选C.
5.0.99解析:由题意,知云=1+2+3+45+6+7:40,万
7
290+3:.30+3.60+4.40+4.80+5.20+5.90=4.30,2(x-)2=(1-4)2+
(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28.
14.00
所以r=
28x7.08198.24i4100.9,所以y与x的相关系数
14.0014.00
近似为0.99.故答案为0.99
8.2一元线性回归模型及其应用
8.2.1一元线性回归模型+
8.2.2一元线性回归模型参数的最小二乘估计
白题基础过关
1,B解析:由题图易知,①③两个散点图中的样本点都在一条直线附
近,因此适合用线性回归模型拟合故选B.
2.D解析:由题意得22=9×10+a,得a=-68.故选D.
3.B解析:题图中,变量的对应点分布在一条直线附近,且比较密集
故可判断语文成绩和英语成绩之间具有较强的线性相关关系,且直
线斜率小于1.故选B.
4.AD解析:少=-24x+27,6=-24<0,放A正确元=m+19,
15,经验回归方程经过样本中心点(玉,),.27-2.4×m+19
5
=15,m=
6,故B错误;把x=2代人经验回归方程得y=27-2.4×2=22.2<25
点(2,25)落在经验回归直线上方,故C错误;当x=15时,y=27
2.4×15=-9,故D正确.故选AD.
5.y=0.7x-2.39解析:设y关于x的经验回归方程为y=x+a,且经
验回归直线过样本中心点(玉,),由题表数据得玉=6+8+10+1-=9,
4
万-2+3+5+6-4,交x=6x2+8x3+10x5+12x6=158,号=62+82+
4
4
A
102+122=344,故根据最小二乘原理知)=
含-4
158-4×9x4=0.7,所以a=-6x=4-07×9=-2.3,即经验回归方程为
344-4×92
y=0.7x-2.3.将y=4代入方程,得x=9,即可预测判断力为4的同学
的记忆力为9.故答案为y=0.7x-2.3:9.
6.ABD解析:经验回归直线一定过样本中心(x,),A正确;两个模型
中残差平方和越小的模型拟合的效果越好,B正确:甲、乙两个模型
的R2分别约为0.98和0.80,则模型甲的拟合效果更好,C错误;残差
图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比
较合适,D正确.故选ABD.
7.B解析:=1+2+3+4+5+6+7
4,万=2+3+2+5+7+7+9=5,所以à
7
7
y-bx=5-1.214×4=0.144,y=1.214x+0.144.当x=7时,y=1.214×7+
0.144=8.642,因此残差为9-8.642=0.358.故选B.
8.A解析:根据残差图,模型(2)残差点比较均匀地落在水平的带状
区域中,带状区域宽度窄,拟合精度较高,所以R<贬,故选A.
参考答案
)2
是()2
9.0.96
解析:因为2=1-
=1-
=1-
含8-9明
265-9x3=0.96.散答案为0.96.
1.60
10.3解析:由残差的定义可得1-(3+a)=4-(2b+a),化简得3=3.故
答案为3
重难聚焦
1熊,0令k因为品2总=5,2=18
10台
所以名=
2-102
60-10x5.5×1.28=-0.13,a=z-6i=1.28+
385-10×5.52
1
0.13×5.5≈2.00
因此=2-0.13i,即y=e2-013,所以所求经验回归方程为y=e2-0.135
(2)由(1)知,产=e20<008,即2-Q13ha08≈-253,解得>2*253
0.13
因为i取整数,所以i=35,即在新房装修完第35天开始达到此标准
四方法总结
解决非线性回归分析问题的一般方法和步骤:
(1)确定变量:确定解释变量为x,响应变量为y;
(2)画散点图:通过观察散点图并与已学过的函数(幂函数、指数函
数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;
(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;
(4)分析拟合效果:通过计算决定系数或相关系数等来判断拟合效果;
(5)写出非线性回归方程,
8.1~8.2阶段综合
黑题阶段强化
1.C解析:影响的是经验回归直线的斜率,r影响的是两个变量之间
的相关性,所以?与之间数值大小没有关系,但符号有影响,故
选项AB错误;若r大于零,则说明两个变量之间呈现正相关,故?一
定大于零,故选项C正确,D错误故选C
2.ACD解析:对于A:对于经验回归方程y=-2x+2,变量x每增加1个
单位,则y平均减少2个单位,故A正确;
对于B:Ir越接近于1,则x,y之间的线性相关程度越强,Ir越接近
于0,则x,y之间的线性相关程度越弱,故B错误;
对于C:在残差图中,残差点分布的水平带状区域越窄,说明波动越
小,即模型的拟合精度越高,拟合效果越好,故C正确;
对于D:若增加的样本点恰好为原经验回归直线的样本中心点时,则
增加该样本点后,经验回归方程不会发生改变,故D正确.故选ACD.
1
3.B解析:由题意得元=5×(2+4+5+6+8)=5,了=5×(30+40+50+
60+70)=50,∴.样本中心为(5,50).:经验回归直线y=7x+ā过样本
中心(5,50),.50=7×5+a,解得a=15,.经验回归方程为y=7x+
15.当x=10时,y=7×10+15=85,故当投入10万元广告费时,销售额
的预测值为85万元.故选B.
4.B解析:因为所有样本点都在直线y=-2x+1上,所以经验回归方程是
y=-2x+1,可得这两个变量是负相关,故这组样本数据的样本相关系数为
负值,且所有样本点都在直线上,则有1rl=1,∴.相关系数r=-1故选B.
5.AC解析:因为共8个点且离群点B的横坐标较小而纵坐标相对过
大,去掉离群点后经验回归方程的斜率更大,而截距变小,所以C正
确,D错误;去掉离群点后相关性更强,拟合效果也更好,且是正相
关,所以T1<T2,R<R3,故B错误,A正确.故选AC.
6.C解析:根据题图可知,散点大致分布在一条“对数型”函数曲线的
周围,而A选项是“抛物线型”的拟合函数,且是增加的:B选项是
“直线型”的拟合函数,且是增加的;D选项是“幂函数型”的拟合函
数,且是增加的,只有C选项的拟合函数符合题意故选C.
7.4.5解析:因为在样本(4,3)处的残差为-0.15,即y-y=3-(0.7×4+
a)=-0.15,所以a=0.35,所以经验回归方程为y=0.7x+0.35.
黑白题27
因为-3+4+56=45,7-25+34+m_95+m,样本中心点(玉,)在
4
4
4
经验回归直线上,所以2.5+m=0,7x4.5+0.35,解得m=45.放答案为
4
4.5.
8.2解析:由y=e-2两边取自然对数,可得lny=hes-2=kx-2.令t=
hy=k-2,因为:关于:的经验回白直线经过(医,),面=行名
3,所以=3k-2.又i=
6(a方+n方+ln为+ln4+ln⅓+ln%)=
6(123a%)=名ne24=4=3k-2,解得k=2故答案为2
6
13.94
13.94
9.解:(1)由题意知r2=-0.9953,71=
√11.67×w√21.22√247.6374
0.858.因为,1<121<1,所以用y=c+模型建立y与x的经验回
归方程更合适
(2)令1=经验回归方程为=a+6,因为2-13·方
-13r
0.21-10,c=-a1=109.94+10x0.16=11.54,所以y关于2的经验
-2.1」
回归方程为y=+c=111.54-10,即y关于x的经验回归方程y=
11.54、10
()由题意知:品品(L40)
-4x=100.386-
91
七4,即
x=6时取等号,
所以z=100.386-
(9+
(¥+4*)≤10,386-3=97.386,所以:≤
97.386,当且仅当x=6时等号成立,所以当研发经费投入为60万元
时企业生产的利润最大
8.3列联表与独立性检验
8.3.1分类变量与列联表+
8.3.2独立性检验
白题基础过关
1.B解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.
2.B解析:由题表中的数据可得c=33-25=8,d=21+25=46,∴.a=
106-46=60,b=60-8=52.故选B.
3.D解析:由题图可知“心脏搭桥”手术和“血管清障”手术对“诱发
心脏病”的频率不同,所以“心脏搭桥”手术和“血管清障”手术对
“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把
握,所以选项D正确.故选D.
4.是解析:因为在20至40岁的58名观众中有18名观众收看新闻
节目,而大于40岁的42名观众中有27名观众收看新闻节目,即
a+29'c中14两者相差较大,所以经直观分析,收看新闻节目
b9d9
的观众与年龄是有关的,
5.A解析:对于①,独立性检验的基本思想是带有概率性质的反证
法,命题正确:对于②,独立性检验就是选取一个假设H。条件下的
小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触
的“不合理”现象,则作出拒绝H,的推断,正确:对于③,独立性检验
与样本的选取有关,不一定正确,故命题错误综上,正确的命题是①
②.故选A.
6.A解析:X2≈5.389>3.841,X2≈5.389<6.635,故“两种药物的疗效
存在差异”犯错误的概率不超过5%.故选A.
7.BC解析:由列联表中数据可求得x2.92x(700x32-60x200)2
760×232×900×92
7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝
病与嗜酒有关”,即至少有99%的把握认为“患肝病与嗜酒有关”,因
选择性必修第三册·RJ
此BC正确.故选BC.
8.6解析:由题意知x2≥6.635,则40x[a(20+a)-(10-a)(10-a)]2
10×30×10×30
2(4a-10)2
≥6.635,解得a≥5.55或a≤-0.55(舍去).又因为a>3
45
且10-a>3,所以a<7,a∈Z.综上得5.55≤a<7.因为a∈Z,所以a=6.
故答案为6.
9.解:(1)先把数据从小到大排序:7,8,8,9,9,9,9,10,10,10,11,11,
12,12,12,13,13,14,14,14,14,16,16,16,16,17,17,18,18,18,18
19,19,19,20,21,21,21,22,22,中位数m
14+14=14,然后把表格填
2
写完毕
实验时间
实验方法
合计
大于m不大于m
原方法
14
6
20
新方法
5
15
20
合计
9
1
40
(2)零假设H。:新方法的实验效率不比原方法高,即新方法跟实验效
率无关根据列联表得x2=
40×(14×15-6×5)2
20×20x19×21
=8.120>6.635=x0.01,
根据小概率值a=0.01的X2独立性检验,可推断H。不成立,即认为
新方法的实验效率比原方法高,即新方法跟实验效率有关
8.3
阶段综合
黑题阶段强化
1.D解析:依已知数据X2=56.632>6.635,得有1-0.01=99%的把握
认为“患肺癌与吸烟有关”,则选项D正确,其余都是错误的故选D.
n(ad-bc)2
2B解折:因为x行=a+bc+a*e(6+d所以发=
2n(2a×2d-2bx2c)2
2n(ad-be)2
(2a+2b)(2c+2d)(2a+2c)(2b+2d)=(a+b)(c+d)(a+c)(b+d)
2X2.故选B.
3.C解析:由题意可知,同一个样本中,1100b-200a|越小,说明两个
变量的关系越弱,1100b-200al越大,说明两个变量的关系越强.对
于A,当b=2a时,I100b-200al=0:对于B,当2c=3b时,可得b=2a,
则1100b-200al=0:对于C,当a=2b时,1100b-200a|=|150a1:对于
D,当e=2d时,200+b=200+2a,即b=2a,此时1100b-200al=0.由以
上分析可知,选项C能说明X与Y有关联故选C.
4.ABC解析:用频率估计概率可得,夜晚下雨的概率约为25+25
100
?,所以A正确;未出现“日落云里走”时夜晚下雨的概率约为
25+454所以B正确:由X2≈19.05>10.828,可得据小概率值a=
25
5
0.001的独立性检验,认为“日落云里走”是否出现与夜晚天气有关,
所以C正确,D错误故选ABC,
5.170解析:由题意可得用户类型与购买的套餐类型2×2列联表
如下:
A套餐
B套餐
总计
个人用户
2
3
10m
2 m
公司用户
10m
10m
2m
总计
10m
10m
2.4
m
b品
X2=
1
1
3
7
>7.879,解得m>165.459.
2
2 mx 2 mx10mx10m
又因为m必须是10的倍数,所以m的最小值为170.故答案为170.
6.解:(1)由等高堆积条形图得2×2列联表:
黑白题28