内容正文:
小题精练34 统计与成对数据的统计分析
(分值:73分)
单选题每小题5分,共40分;多选题每小题6分,共18分.
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.[2025·芜湖模拟]某校高一年级有男生300人,女生200人,按性别进行分层,用分层随机抽样的方法从该校高一年级学生中抽出一个容量为150的样本.如果样本按比例分配,那么男生、女生应分别抽取的人数为( )
A.75;75 B.90;60
C.60;90 D.100;50
2.[2025·天津南开区模拟]某公司生产的某型号无人机近5年的年销售量数据统计如表所示.
年份
2020
2021
2022
2023
2024
年份代码x
0
1
2
3
4
年销售量y/万件
10
15
20
30
35
根据表中的数据,用最小二乘法求得y关于x的经验回归方程为y=6.5x+t,则预测2025年该型号无人机的年销售量为( )
A.40万件 B.41.5万件
C.46万件 D.48万件
3.[2025·泰安模拟]一组数据按从小到大的顺序排列为1,3,4,x,7,9,若该组数据的中位数与平均数相等,则数据x是( )
A.4 B.5
C.6 D.7
4.[2025·乐山模拟]对变量x,y由观测数据(xi,yi)(i∈N*)得散点图1;对变量u,v由观测数据(ui,vi)(i∈N*)得散点图2.r1表示变量x,y之间的线性相关系数,r2表示变量u,v之间的线性相关系数,则下列说法正确的是( )
A.变量x与y呈现正相关,且|r1|>|r2|
B.变量x与y呈现负相关,且|r1|<|r2|
C.变量u与v呈现正相关,且|r1|>|r2|
D.变量u与v呈现负相关,且|r1|<|r2|
5.[2025·商洛模拟]在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示.则下列说法正确的是( )
A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩的极差比乙班成绩的极差小
C.甲班成绩在[80,90)内人数最多
D.乙班成绩在[70,80)内人数最多
6.[2025·青岛模拟]某公司收集了某商品销售收入y(万元)与相应的广告支出x(万元)共10组数据(xi,yi)(i=1,2,3,…,10),绘制出如图散点图,并利用线性回归模型进行拟合.若将图中10个点中去掉A点后再重新进行线性回归分析,则下列说法正确的是( )
A.决定系数R2变小
B.残差平方和变小
C.相关系数r的值变小
D.解释变量x与预报变量y相关性变弱
7.[2025·临汾模拟]人生因阅读而气象万千,人生因阅读而精彩纷呈.腹有诗书气自华,读书有益于开拓眼界、提升格局;最是书香能致远,书海中深蕴着灼热的理想信仰、炽热的国家情怀.对某校高中学生的读书情况进行了调查,结果如表:
喜欢读书
不喜欢读书
合计
男生
260
60
320
女生
200
m
m+200
合计
460
m+60
m+520
附:χ2=,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
根据小概率值α=0.001的独立性检验,推断是否喜欢阅读与性别有关,则m的值可以为( )
A.10 B.20
C.30 D.40
8.[2024·四川遂宁模拟]某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄分布饼状图(图1)、“90后”从事快递行业岗位分布条形图(图2),则下列结论中错误的是( )
A.快递行业从业人员中,“90后”占一半以上
B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%
C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多
D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.[2025·泰州模拟]甲、乙两名篮球运动员连续10场比赛的得分如表所示,则下列说法正确的有( )
场次
1
2
3
4
5
6
7
8
9
10
甲
18
20
22
13
20
27
10
21
19
30
乙
3
10
20
9
24
27
13
28
9
17
A.甲的众数大于乙的众数
B.甲的平均数大于乙的平均数
C.甲的极差大于乙的极差
D.甲的60百分位数大于乙的60百分位数
10.[2025·日照模拟]数据x1,x2,…,xn的平均数为,方差为s,数据y1,y2,…,yn的平均数为,方差为s,其中xi,yi满足关系式yi=axi+b(i=1,2,…,n),则( )
A.=a+b
B.若数据s=0,则x1=x2=…=xn
C.数据x1,x2,…,xn,y1,y2,…,yn的平均数为(a+1)+b
D.若a>0,数据x1,x2,…,xn不全相等,则这组数据(x1,y1),(x2,y2),…,(xn,yn)的相关系数为1
11.[2025·衡阳模拟]为了研发某种流感疫苗,某研究团队收集了10组抗体药物的摄入量与体内抗体数量的数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值,抗体药物摄入量为x(单位:mg),体内抗体数量为y(单位:AU/mL).根据散点图,可以得到经验回归方程为:y=0.34x+0.05.下列说法正确的是( )
A.经验回归方程表示体内抗体数量与抗体药物摄入量之间的线性相关关系
B.经验回归方程表示体内抗体数量与抗体药物摄入量之间的函数关系
C.经验回归方程可以精确反映体内抗体数量与抗体药物摄入量的变化趋势
D.经验回归方程可以用来预测摄入抗体药物后体内抗体数量的变化
三、填空题:本题共3小题,每小题5分,共15分.
12.[2025·深圳模拟]某同学收集了变量x,y的相关数据如表:
x
0.5
2
3
3.5
4
5
y
y1
15
y2
y3
y4
y5
为了研究x,y的相关关系,他由最小二乘法求得y关于x的经验回归方程为
=x+17,经验证经验回归直线正好经过样本点(2,15),则yi=________.
13.[2025·扬州模拟]将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标xi和某植物分布的数量yi(i=1,2,…,6),得到样本(xi,yi),且其相关系数r=,记y关于x的经验回归方程为=+x.经计算可知:=9,x2 i=550, (yi,)2=256,则=________.
参考公式:=,r=.
14.[2025·长沙模拟]随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(10≤m≤20,m∈N*)
支持
不支持
男生
70-m
10+m
女生
50+m
30-m
若通过计算得,根据小概率值α=0.05的独立性检验,认为支持增加中学生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为________.附:χ2=,其中n=a+b+c+d.
α
0.050
0.010
0.005
0.001
xα
3.841
6.635
7.879
10.828
学科网(北京)股份有限公司
$色学科网书城四
品牌书店·知名教辅·正版资源
b.zxxk.com
您身边的互联网+教辅专家
小题精练34统计与成对数据的统计分析
1.B[由题意可得,样本中应抽取的男生有150×300200+300=90(名),样本中
应抽取的女生有150×200200+300=60(名).故选B.]
2.B[=0+1+2十3+45=2,=10+15十20十30+355=22,又因为直线y
=6.5x十t过点(2,22),故6.5×2+t=22,解得t=9,则预测2025年该型号无人
机的年销售量为=6.5×5+9=41.5(万件),故选B]
3.C[由题意,4十x2=1+3+4十x+7+96,解得x=6.故选C.]
4.A[观察散点图,得变量x与y呈现正相关,变量与o呈现负相关,BC错误;
图1中各点比图2中各点更加集中,相关性更强,因此n>2,A正确,D错误.
故选A]
5.C[对于A,因为不知道甲、乙两班考生人数,故成绩在[70,80)的考生中,无
法比较甲、乙两班考生人数,故A错误;
对于B,由题意,不知道甲、乙两班考生分数的具体值,故无法比较极差的大小,
故B错误;
对于C,由折线图可知甲班成绩在[80,90)内人数最多,故C正确;
对于D,由折线图可知乙班成绩在[60,70)内人数最多,故D错误.故选C]
6B[从图中可以看出A点较其他点,偏离直线远,故去掉A点后,回归效果更
好,
故决定系数2会变大,更接近于1,残差平方和变小,
相关系数r的绝对值,即会更接近于1,由图可得x与y正相关,故”会更接近
于1,
即相关系数r的值变大,解释变量x与预报变量y相关性变强,
故A,C,D错误,B正确.故选B]
7.A[根据列联表可知:a=260,b=60,c=200,d=m,则n=a十b十c十d=520
十m,
·独家授权侵权必究
色学科网书城四
品牌书店·知名教辅·正版资源
b.zxXk.c0m●
您身边的互联网+教辅专家
由公式x2=n(ad-bc)2(a十c)(b+d)(c+d)(a+b)=
(520+m)(260m-60×200)2460×(m+60)×(m+200)×320
=(520+m)(13m一600)2368(m+60)(m+200),即根据小概率值a=0.001
独立性检验,推断是否喜欢阅读与性别有关,则根据a=0.001可知只需x
>10.828即可,xa=10.828,即(520+m)(13m-600)2368(m+60)(m+200)
>10.828即可.
当取m=10时,则(520+10)(13×10-600)2368(10+60)(10+200)≈21.642
>10.828满足题意,故m可取10:
当取m=20时,则(520+20)(13×20-600)2368(20+60)(20+200)≈9.638
<10.828不满足题意:
当取m=30时,则(520+30)(13×30-600)2368(30+60)(30+200)≈3.184
<10.828不满足题意:
当取m=40时,则(520+40)(13×40-600)2368(40+60)(40+200)≈0.406
<10.828不满足题意;故选A]
8.D「由题图可知,快递行业从业人员中,“90后”占总人数的56%,超过一半,
A正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分
比为56%×39.6%=22.176%,超过20%,B正确;
快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为56%
×17%=9.52%,超过“80前”的人数占总人数的百分比,C正确
快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为
22.176%,小于“80后”的人数占总人数的百分比,但“80后”从事技术岗位的
人数占“80后”人数的比未知,D不一定正确.故选D.]
9.ABD[对于A,甲的众数为20,而乙的众数为9,故甲的众数大于乙的众数,
A正确;
对于B,因甲平均数=110(18+20+22+13+20+27+10+21+19+30)=20,
而乙平均数=1103+10+20+9+24+27+13+28+9+17)=16,故B正确:
对于C,甲的极差为30一10=20,而乙的极差为28一3=25,故C错误;
·独家授权侵权必究
色学科网书城四
品牌书店·知名教辅·正版资源
b.zxXk.c0m●
您身边的互联网+教辅专家
对于D,先把甲的得分按从小到大顺序排列为:10,13,18,19,20,20,21,22
27,30,由10×60%=6知甲的60百分位数为20+212=20.5;再把乙的得分按
从小到大顺序排列为:3,9,9,10,13,17,20,24,27,28,则乙的60百分
位数为17十202=18.5,故D正确.故选ABD.]
10.ABD[对于A中,由=1n∑"i=1y=1n∑"i=1(ax+b)=a×1n∑"i=1x+b
=a十b,所以A正确;
对于B中,由s2x=1n∑"1=1(x:-)2=0,因为(一)2≥0,故1=x2=…=xm
=,故B正确;
对于C中,由x1十2十…十x十y1十y2十…十ym=n(十)=n(a十1)十b],其平
均数为x一2n=x2,所以C错误;
对于D中,若a>0,数据1,2,…,xm不全相等,则这组数据(1,y),(x2,2),…,
(x,ym)都分布在直线y=ax,十b上,所以相关系数为1,所以D正确.故选ABD.]
11.AD[经验回归方程只能表示体内抗体数量与抗体药物摄入量之间的线性相关
关系,不是函数关系,A正确,B错误,
经验回归方程不能精确反映体内抗体数量与抗体药物摄入量的变化趋势,但可以
用来预测摄入抗体药物后体内抗体数量的变化,C错误,D正确.故选AD]
12.69[因为经验回归直线=x+17经过样本点(2,15),所以15=2十17
→=-1.
因为=0.5+2+3+3.5+4+56=3,所以=-+17=-3+17=14.
所以∑5i=1)6=14→∑5i=1y=69.]
13.158
[因为=9,∑6i=1x2i=550,所以∑61=16-)P=∑61=1x2i-62
·独家授权侵权必究
色学科网书城四
品牌书店·知名教辅·正版资源
b.zxXk.com○
您身边的互联网+教辅专家
=550-6×92=64,
由r=∑6i=1)-)一八o(∑6i=1)-》)26i=1)-》)2=∑6i=1)-)-64)×(256=1516,解
得∑61=1(-0-)=120,
所以=∑6i=1)-)-)∑61=1)-)=12064=158]
14.66[因为有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性
别有关”,
所以160×[(70-m)(30-m)-(10+m)(50+m)]280×80×120×40≥3.841,
即(m-10)2≥28.8075,因为函数y=(m一10)2在10≤m≤20时单调递增,且m∈
N*,(15-10)2<28.8075,(16-10)2≥28.8075,所以m的最小值为16,所以在这
被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为50+16=
66.]
·独家授权侵权必究