内容正文:
专题四十成对数据的统计分析
73分练
(时间:60分钟分值:73分)
一、选择题:本题共8小题,每小题5分,共40分,
4.某市物价部门对5家商场的某商品一天的销售
在每小题给出的四个选项中,只有一项是符合题目
量及其价格进行调查,5家商场的售价x(元)和
要求的.
销售量y(件)之间的一组数据如表所示:
1.(2024·海南模拟预测)乡村振兴战略坚持农业
售价x
9
9.51010.511
农村优先发展,目标是按照产业兴旺、生态宜居、
销售量y11
10
8
6
5
乡风文明、治理有效、生活富裕的总要求,建立健
根据表中数据得到y关于x的经验回归方程是
全城乡融合发展体制机制和政策体系,加快推进农
y=一3.2x十a,则下列说法不正确的有()
业农村现代化.某乡镇通过建立帮扶政策,使得该
A.a=40
乡镇财政收入连年持续增长,具体数据如表所示:
B.回归直线过点(10,8)
第x年
12
345
C.当x=8.5时,y的估计值为12.8
收人y(单位:亿元)38101415
D.点(10.5,6)处的随机误差为0.4
由上表可得y关于x的近似回归方程为y一
5.用模型y=ae:拟合一组数据组(x;,y:)(i=1,
3.x十a,则第6年该乡镇财政收人预计为()
2.3,…,7),其中x1十x2十…+x7=7,设=ny
A.16亿元B.19亿元C.21亿元D.23亿元
得变换后的经验回归方程为之=x十4,则y1y2
2.5G技术在我国已经进入高速发展的阶段,5G手
7
(
机的销量也逐渐上升,某手机商城统计了最近5
A.e70
B.e35
C.70
D.35
个月手机的实际销量,如下表所示:
6.两个分类变量X和Y,其2×2列联表如表,对同
时间x
12345
一样本,以下数据能说明X与Y有关联的可能
(
销售量y(千只)0.50.81.01.21.5
性最大的一组为
若y与x线性相关,且经验回归方程为y=
Y
X
合计
0.24x+a,则下列说法不正确的是
yi
Ve
A.由题中数据可知,变量y与x正相关
ai
3
6
9
B.经验回归方程y=0.24.x十a中a=0.28
T2
a
8
m+8
C.可以预测x=6时该商场5G手机销量约为
合计
m十3
14
m+17
1.72(千只)
A.m=3
B.m=4
C.m=5
D.m=6
D.x=5时,残差为一0.02
7.在2×2列联表中,下列哪两个比值相差越大,两
3.调查某种群花尊长度和花瓣长度,所得数据如图
个分类变量有关系的可能性就越大
()
所示,其中相关系数r=0.8245,下列说法正确
的是
A卢+b
Bab与千a
·花薄长度
D与,+
8.人在运动时可承受的心跳速度和人的年龄有关,
如果用x表示一个人的年龄,y表示正常情况下这
个人在运动时所能承受的每分钟心跳的最高次数,
化些长度
根据以下样本数据建立了y关于x的经验回归方
程y=k(200一x),则可预测当一个人65岁时,运动
A.花瓣长度和花萼长度没有相关性
时所能承受的每分钟心跳的最高次数为(
B.花瓣长度和花萼长度呈现负相关
C,花瓣长度和花尊长度呈现正相关
20
30
40
50
D.若从样本中抽取一部分,则这部分的相关系
145
133
131
119
数一定是0.8245
A.106
B.108
C.110
D.112
63
二、选择题:本题共3小题,每小题6分,共18分
计算得到x2≈14.06,将频率视为概率,用样本
在每小题给出的选项中,有多项符合题目要求.全
估计总体,下列小波对该地区天气的四个判断
部选对的得6分,部分选对的得部分分,有选错的
中正确的是
得0分.
A.该地区后半夜下雨的概率约为
9.(2024·云南模拟预测)已知变量x,y之间的经
验回归方程为y=11一0,5x,且变量x,y的数据
B.该地区未出现“日落云里走”时,后半夜下雨
如图所示,则下列说法正确的是
)
的概率为易
2
3
5
9
C.根据小概率值a=0.001的独立性检验,我们认
1210
3
为该地区“日落云里走”是否出现与后半夜是否
A.该回归直线必过(6,8)
下雨有关,此推断犯错误的概率不大于0.001
B.变量x,y之间呈正相关关系
D.根据小概率值α=0.001的独立性检验,我们认
C.当x=7时,变量y的值一定等于7.5
为该地区“日落云里走”是否出现与后半夜是否
D.相应于(11,3)的残差估计值为-2.5
下雨无关,此推断犯错误的概率不大于0.001
10.(2024·湖南永州统考一模)下列关于概率统计
三、填空题:本题共3小题,每小题5分,共15分.
说法中正确的是
12.某驾驶员培训学校为对比了解“科目二”的培训
A.两个变量x,y的相关系数为r,则r越小,x
过程采用大密度集中培训与周末分散培训两种
与y之间的相关性越弱
方式的效果,调查了105名学员,统计结果为:接
B.设随机变量N(2,1),若p(>3)=p,则
受大密度集中培训的55名学员中有45名学员一
p1<×2)=2-p
次考试通过,接受周末分散培训的学员一次考试
通过的有30名.根据统计结果,认为“能否一次考
C.在回归分析中,R2为0.89的模型比R2为
试通过与是否集中培训有关”的把握为
0.98的模型拟合得更好
13.已知b与x之间具有很强的线性相关关系,现
D.某人解答10个问题,答对题数为X,X~
观测得到(x,y)的四组观测值并制作了相应的
B(10,0.8),则E(X)=8
对照表,由表中数据粗略地得到经验回归方程
11.千百年来,我国劳动人民在生产实践中根据云
为y=bx十60,其中y的值没有写上.当x等于
的形状、走向、速度、厚度、颜色等的变化,总结
一5时,预测y的值为
了丰富的“看云识天气”的经验,并将这些经验
18
13
10
编成诊语,如“天上钩钩云,地上雨淋淋”“日落
24
34
38
64
云里走,雨在半夜后”…小波同学为了验证
14.在一次恶劣气候的飞行航程中,调查男女乘客
“日落云里走,雨在半夜后”,随机观察了他所在
在机上晕机的情况,如下表所示:
地区100天的日落情况和后半夜天气,得到如
下2×2列联表:
晕机
不晕机
合计
男
11
15
1+
后半夜天气
日落云里走
总计
女
6
n22
123
下雨
未下雨
合计
n+1
28
46
出现
45
15
60
未出现
15
25
40
则下列说法正确的是
总计
60
40
100
①m=6,②x2<2.706:③可以认为,“在恶
n1+
7123
附:
劣气候飞行中,晕机与否跟男女性别有关”:
0.1
0.05
0.01
0.005
0.001
④没有理由认为,“在恶劣气候飞行中,晕机与
2.706
3.841
6.635
7.879
10.828
否跟男女性别有关”
64所以P(AB)=P(90<<100)-P(-2<-=
即(ln y+lny+.+lny)=5.
P(-2<x<+2)-P(-。<<+)
即ln(yy:..y)-35,所以yy:.y,=e.
。
0.95-0.6827
故选:B.
200'
6.D 由给定的2×2列联表,
P (A)=P(90<10)=P(-2<)=
对于A.n-3-x的预测值k20×(3X8-3×6)*20
P(-2<x<+2)95
6X14×9×11 231'
2
200'
P(AB)27200
对于B.m-4.x的预测值k。21×(3×8-4×6){}
7×14×9×12
-0
由条件概率公式得P(B|A)一
P(A)200 95
对于C.m-5-×的预测值k 2×(3×8-5×6){11
8X14×9X13 182'
#
对于D.m-6.×的预测值 23×(3×8-6×6)*}92
9X14×9×14441'
专题四十
成对数据的统计分析
显然 k kk,因此选项D中数据求得x{}的预测
73分练
值最大,说明说明X与Y有关联的可能性最大。
故选:D.
1.B 由表可知;=
,
7.B
当 ad一bc |的值越大时,两个分类变量有关系的可
-10.
能性就越大,
又因为回归方程y一3r十a过样本中心点(x,V),所以
#为f-f-((c6-#
--3-10-3×3-1.
所以回归方程为一3x+1.
ad-bc
(a十)(c十d)'
当-6时,y-3×6+1-19.
ab-cd
故选:B.
a+b十=(a十d)(十c)
2.D 对于A,从数据看y随x的增加而增加,所以变量y
与r正相关,故A正确
1+2+3+4+5-3,--
的可能性就越大.
对于B,由表中数据知,ī=
5
故选:B.
0.5+0.8+1+1.2+1.5-1.
8. B
20+30+40+50
分析数据,二二
-35,)二
145+133+131+119-132.
b
所以样本中心点为(3,1),将样本中心点(3,1)代入
0.24x+ā中得ā-1-3x0.24-0.28,故B正确
对于C,当x-6时该商场5G手机销量约为y-0.24×
由线性回归方程y一k(200一x)必过样本中心点,代入
6+0.28-1.72(千只),故C正确.
对于D,经验回归方程为y-0.24x十0.28,所以y-
0.2 4×5+0.28-1.48,e-1.5-1.48-0.02,故D错误
故选:D.
3.C 根据散点的集中程度可知,花瓣长度和花长度有
故选:B.
相关性,A选项错误
散点的分布是从左下到右上,从而花辩长度和花长度
呈现正相关性,B选项错误,C选项正确
y-11-0.5×6-11-3-8,所以该回归直线必过
由于r一0.8245是全部数据的相关系数,取出来一部分
(6,8),故A正确.
数据,相关性可能变强,可能变弱,即取出的数据的相关
对于B,因为经验回归方程为y-11-0.5x,-0.5 0.
系数不一定是0.8245,D选项错误
当变量x增加,变量y相应值减少两个变量之间呈负相
故选:C.
关关系,故B错误
4.D 由题意可知-1
1(9+9.5+1+10.5+11)-10.
对于C,当x-7时,-11-0.5×7-7.5,变量y的值可
能为7.5,故C错误。
对于D,由残差定义知,观测值减去预测值为残差,当
x-11时,得预测值 -11-0.5×11-5.5,则相应于
8),且8--3.2x10+ā→ā=40,故A,B正确.当x
(11,3)的残差估计值为3-5.5--2.5,故D正确.
8.5时,--3.2×8.5+40-12.8,故C正确.点(10.5.
故选:AD
6)处的随机误差为6-(-3.2×10.5+40)--0.4,故
10.BD由题意,A项,两个变量x,y的相关系数为r,
D不正确.
r 越小,x与y之间的相关性越弱,故A错误,
故选:D.
对于B,随机变量服从正态分布N(2.1),由正态分布
5.B 因为x十x十...十x-7,
概念知若P(3)=,则P(-1<<0)=P(2<3)
7
194
对于C.在回归分析中,R^{}越接近于1,模型的拟合效果
2.D 由于c,d的正负性不确定,由“a>b>0,c>d”不能
越好,所以R{}为0.98的模型比R{}为0.89的模型拟合
推出“ac>bd”,故充分性不成立;同时当“acbd”时也不
的更好,故C错误.
能推出“ab0,cd”,故必要性也不成立.
对于D,某人在10次答题中,答对题数为X,X~B(10.
故选:D.
0.8),则数学期望E(X)-10×0.8-8,故D正确.
3.C 因为不等式x{十bx十c→0(6 1)的解集为R,则△=
故选:BD.
11.AC 该地区后半夜下雨的概率约为00-,则A正确.
603
因为>1.所以-1>0;
该地区未出现“日落云里走”时,后半夜下雨的概率为
所以1+2+4+20+1(6-1)+4(6-1)+4
153
-1
-1
-1
40,则B不正确.
(6-1)+41+4>2(6-1)×+4-8.
4
零假设H:该地区“日落云里走”是否出现与后半夜是
否下雨无关.因为x{}~14.0610.828-ro。0o1,所以根
当且仅当b-1-,即b-3时,取到等号。
据小概率值a一0.001的独立性检验,我们推断H。不
成立,即认为该地区“日落云里走”是否出现与后半夜
故答案为:C.
是否下雨有关,此推断犯错误的概率不大于0.001,故
C正确,D不正确.
2
故选:AC.
且n-1.
解得m-1,n-或m2,n-1.
12.答案:97.5%
解析:由题意,可得以下2×2列联表:
当m=1.n-时,A={2,1),B-{1,},满足题意。
集中培训分散培训合计
当m-2,n-1时,A-2,1),B-(2,1),不满足题意,
30
45
一次考试通过
15
舍去。
10.
.#
一次考试未通过
20
合计
5
50
105
故选:D.
5.A 因为正数r,y满足x十2y-2,
二~6.1095.024.
55×50X75×30
所以2-1.
2
故认为“能否一次考试通过与是否集中培训有关”的把
握为97.5%.
所以位十1-+1+2--++1→2/
xy:+2y
故答案为:97.5%.
r2y
13.答案:70
1-/2+1.
解析:由题意-1(18+13+10-1)=10.--
当且仅当
12-2:
34+38+64)-40.
等号,
因为线性回归直线方程为-br十60,因为40-10+
当x-2、-2.y-2-②时,-+士取得的最小值为/2+1.
60.所以b--2,
r )
所以:等于一5时,预测y的值为(-2)×(-5)十
故选:A.
60-70.
故答案为:70.
14.答案:②④
因为#
解析:由表格数据可知:n-46一28-18,于是可得
1=1-6-18-6-12.
n-28-15-13,+- +15-12+15-27,-4 6
n.-46-27-19.
于是有-12-4,6-6
7-46,然①不正确.
当且仅当b-4#即a-9.6-时等号成立,
27×19×18×28
一~0.775~2.706,没有
90%的把握认为,在恶劣的气候飞行中,晕机与否跟男
2
女的性别有关,因此②④正确,③不正确
故选:C.
故答案为:②④.
7.D 因为a>2,所以a-20
第二部分
阶段验收高分卷
+-+4>2v16+4-12.
8
专题一至三滚动检测卷
当且仅当2(a-2)-8
,即a=4时,等号成立.
1.C 因为lxl<2,且xZ,所以M-{-1,0,1
又N=-2,-1.0),所以MUN- -2,-1,0,1.
故选:C.
故选:D.
195