内容正文:
第九章 统计
(时间:120分钟 满分:150分)
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在以下4项调查中:
①调查一个40人班级的学生每周的体育锻炼时间;
②调查某省的一种结核病的发病率;
③调查一批食品的合格率;
④调查一个水库所有鱼中草鱼所占的比例.
适合用全面调查的是( )
A.① B.② C.③ D.④
2.某班有50名同学,将他们编号为01,02,03,…,49,50,现需抽取10位同学参加志愿者活动,利用随机数表从中抽取10个个体,下面提供的是随机数表的第5、6两行:
8978086734690586130561098546796382203797
6746071473947034852279534809765413499376
若从表中第5行第9列开始自左向右依次读取两位数字,则抽取的第5个个体的编号是( )
A.13 B.09 C.46 D.20
3.在某疫苗试验初期,某居民区有5 000人自愿接种了疫苗,其中60~70岁的老年人有1 400人,16~19岁的中学生有400人,其余为符合接种条件的其他年龄段的居民.在一项接种疫苗的追踪调查中,要用分层随机抽样的方法从该居民区5 000名接种疫苗的人群中抽取部分人作为样本进行追踪调查,已知老年人中抽取了14人,则从其余符合接种条件的其他年龄段的居民中抽取的人数为( )
A.14 B.18 C.32 D.50
4.机器人是一种能够半自主或全自主工作的智能机器.它可以辅助甚至替代人类完成某些工作,提高工作效率,服务人类生活,扩大或延伸人的活动及能力范畴.某公司为了研究某款智能语音机器人在M,N两个专卖店的销售情况,统计了2023年2月至7月M,N两店每月的营业额(单位:万元),得到如图所示的折线图,则下列说法正确的是( )
A.M店营业额总体呈下降趋势
B.M店营业额总体呈上升趋势
C.N店营业额总体呈上升趋势
D.M店营业额的极差比N店营业额的极差大
5.设样本数据1,3,m,n,9的平均数为5,方差为8,则此样本的中位数为( )
A.3 B.4 C.5 D.6
6.某机构随机调查了某地区喜欢乡村旅游的1 000名游客,他们均从A,B,C,D,E等5个平台中选择1个平台预定出游(每名游客只选择1个平台),统计得到一个不完整的统计图,如图所示,已知样本中在A平台预定出游的人数是在D平台预定出游的人数的1.5倍,则样本中在D平台预定出游的人数为( )
A.300 B.210 C.200 D.180
7.某养猪场加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2 000头生猪的体重(单位:kg)进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是( )
A.这2 000头生猪体重的众数为160 kg
B.这2 000头生猪体重的中位数落在区间[160,180)内
C.这2 000头生猪中体重不低于200 kg的有40头
D.这2 000头生猪体重的平均数为152.8 kg
8.设样本数据x1,x2,…,x2 025的平均数为,标准差为s,若数据2x1+1,2x2+1,…,2x2 025+1的平均数比标准差大5,则+s的最小值为( )
A.- B.- C. D.4
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.下列说法正确的有( )
A.1,2,3,4,5,6,7,8,9,10的第60百分位数是6
B.已知一组数据2,3,5,x,8的平均数为5,则这组数据的方差是5.2
C.用分层随机抽样时,个体数最多的层里的个体被抽到的概率最大
D.若x1,x2,…,x10的标准差为2,则3x1+1,3x2+1,…,3x10+1的标准差是6
10.某学生为了解甲、乙两城市的气温情况,收集并整理了两城市2024年月平均气温的相关数据,得到折线图(如图),则( )
A.甲城市有3个月的月平均气温低于0 ℃
B.甲城市的月平均气温的最大值比乙城市的月平均气温的最大值大
C.甲城市年平均气温比乙城市年平均气温低
D.甲城市月平均气温的方差比乙城市月平均气温的方差小
11.某学校利用学习强国APP安排教职工(共200人)在线学习党史知识.其教职工年龄情况和每周在线学习时长达3小时的情况分别如图①和图②所示,则下列说法正确的是( )
A.该学校中年教职工每周在线学习党史时长达3小时的人数最多
B.该学校老年教职工每周在线学习党史时长达3小时的人数最多
C.若要从该校的200名教职工中通过分层随机抽样的方法抽取20人,则应该从青年教职工中抽取6人
D.该学校在线学习党史时长达3小时的人数占总人数的80%
三、填空题:本题共3小题,每小题5分,共15分.
12.有下列一组数据:
1.5 3.2 5.2 5.6 5.6 7.1 8.7 9.2 10.0
11.2 13.2 13.7 13.8 14.5 15.2 15.7 16.5 18.8 19.2 23.9 27 27 28.9 28.9
33.1 33.8 34.8 40.6 41.6 50.1
这组数据的第70百分位数是 .
13.下图是某高速公路测速点在2月1日8:00到18:00内测得的过往车辆速度(单位:km/h)的频率分布直方图,则该段时间内过往车辆速度的中位数是 km/h,平均速度约为 km/h.
14.为了了解一家公司生产的白糖的质量情况,现从这家公司生产的白糖中随机抽取了10袋白糖,称出各袋白糖的质量(单位:克)如下:
495 500 503 508 498 500 493 500 503 500
则质量落在区间[-s,+s](表示质量的平均值,s为标准差)内的白糖有 袋.
四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤.
15.(13分)两台机床同时生产一种零件,在10天中,两台机床每天的次品数如下.
甲:1,0,2,0,2,3,0,4,1,2;
乙:1,3,2,1,0,2,1,1,0,1.
(1)哪台机床次品数的平均数较小?
(2)哪台机床的生产状况比较稳定?
16.(15分)某地准备修建一条新的地铁线路,为了调查市民对沿线地铁站配置方案的满意度,现对居民按年龄(单位:岁)进行问卷调查,从某小区年龄在[18,68]内的居民中随机抽取100人,将获得的数据按照年龄区间[18,28),[28,38),[38,48),[48,58),[58,68]分成5组,同时对这100人的意见情况进行统计得到频率分布表.经统计,在这100人中,共有65人赞同目前的地铁站配置方案.
分组
持赞同意见的人数
占本组的比例
[18,28)
20
0.8
[28,38)
a
b
[38,48)
8
0.8
[48,58)
12
0.6
[58,68]
15
0.6
(1)求a和b的值;
(2)在这100人中,按分层随机抽样的方法从年龄在区间[28,38),[38,48)内的居民(包括持反对意见者)中随机抽取18人进一步征询意见,求年龄在[28,38),[38,48)内的居民各抽取多少人?
17.(15分)为调查高一、高二学生心理健康达标情况,某学校采用分层随机抽样方法,从高一、高二学生中分别抽取了50人、40人参加心理健康测试(满分:10分).经初步统计,参加测试的高一学生成绩xi(i=1,2,3,…,50)的平均分=7.4,方差=2.6,高二学生的成绩yi(i=1,2,3,…,40)的统计表如下:
成绩y
4
5
6
7
8
9
频数
3
7
11
9
6
4
(1)计算参加测试的高二学生成绩的平均分和方差;
(2)估计该学校高一、高二全体学生的平均分和方差.
18.(17分)6月17日是联合国确定的“世界防治荒漠化和干旱日”,为增强全社会对防治荒漠化的认识与关注,聚焦联合国2030可持续发展目标,实现全球土地退化零增长.自2004年以来,我国荒漠化和沙化状况呈现整体遏制、持续缩减、功能增强、成效明显的良好态势.治理沙漠离不开优质的树苗,现从苗埔中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.
(1)求直方图中a的值及众数、中位数;
(2)若树高185 cm及以上是可以移栽的合格树苗,
①求合格树苗的平均高度(结果精确到个位);
②从样本中按分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?
19.(17分)某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200 kW·h的部分按0.5元/kW·h收费,超过200 kW·h但不超过400 kW·h的部分按0.8元/kW·h 收费,超过400 kW·h的部分按1.0元/kW·h收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:kW·h)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的月用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份电费不超过260元的占80%,求a,b的值;
(3)在(2)的条件下,估计月用电量的第75百分位数.
参考答案
1.A 根据全面调查的定义可知,①适合用全面调查,②③④适合用抽样调查.故选A.
2.C 根据随机数法知,从表中第5行第9列开始自左向右依次读取两位数字,得到的数据是:34,69(舍去),05,86(舍去),13,05(舍去),61(舍去),09,85(舍去),46,…,则抽取的第5个个体的编号是46.
3.C 设从其余符合接种条件的其他年龄段的居民中抽取的人数为x,由分层随机抽样的性质,得,解得x=32,∴从其余符合接种条件的其他年龄段的居民中抽取的人数为32.
4.C M店的营业额先增长,再减少,极差为64-14=50;N店的营业额一直增长,极差为63-2=61.故选C.
5.C 由题意可得,(1+3+m+n+9)=5,s2=[(1-5)2+(3-5)2+(m-5)2+(n-5)2+(9-5)2]=8,整理可得
解得
∴该样本数据为1,3,5,7,9,故中位数为5.
6.C 样本中在A平台预定出游的人数是在D平台预定出游的人数的1.5倍,设样本中在D平台预定出游的人数为a,则a+1.5a+(17%+12%+21%)×1 000=1 000,解得a=200.
∴样本中在D平台预定出游的人数为200.
7.D 由频率分布直方图可得,[140,160)这一组数据对应的小长方形最高,所以这2 000头生猪的体重的众数为150 kg,故A错误;
因为生猪的体重在[80,140)内的频率为(0.001+0.004+0.01)×20=0.3,在[140,160)内的频率为0.016×20=0.32,且0.3+0.32=0.62>0.5,所以这2 000头生猪体重的中位数落在区间[140,160)内,故B错误;
这2 000头生猪的体重不低于200 kg的有0.002×20×2 000=80(头),故C错误;
这2 000头生猪的体重的平均数为(0.001×90+0.004×110+0.01×130+0.016×150+0.012×170+0.005×190+0.002×210)×20=152.8(kg),故D正确.
8.D 样本数据x1,x2,…,x2 025的平均数为,标准差为s,
∵数据2x1+1,2x2+1,…,2x2 025+1的平均数比标准差大5,
∴2+1-2s=5,
∴s=-2,
∴-2=,
∵s≥0,∴≥2,
∴当=2时,+s的最小值为4.
9.BD ∵10×60%=6,∴1,2,3,4,5,6,7,8,9,10的第60百分位数为第六位和第七位的平均数,即=6.5,故A错误;
∵数据2,3,5,x,8的平均数为5,
∴2+3+5+x+8=5×5,即x=7,∴数据2,3,5,7,8的方差是=5.2,故B正确;
用分层随机抽样时,每层的个体被抽到的概率相同,故C错误;
∵x1,x2,…,x10的标准差为2,方差为4,∴3x1+1,3x2+1,…,3x10+1的方差为32×4=36,即标准差为6,故D正确.
10.AC 由折线图可得,甲城市在1月,2月,12月的月平均气温低于0 ℃,故A正确;
甲、乙城市都在7月取得月平均气温的最大值,甲城市的月平均气温的最大值比乙城市的月平均气温的最大值小,故B错误;
由折线图可知,乙城市的月平均气温折线图均在甲城市的月平均气温折线图的上方,所以甲城市年平均气温比乙城市年平均气温低,故C正确;
由折线图可知,甲城市月平均气温比乙城市月平均气温波动大,所以甲城市月平均气温的方差比乙城市月平均气温的方差大,故D错误.
11.ACD 由图形知,该学校老年教职工在线学习党史时长达3小时的人数是200×30%×90%=54,中年教职工在线学习党史时长达3小时的人数是200×(1-30%-30%)×80%=64,青年教职工在线学习党史时长达3小时的人数是200×30%×70%=42,所以该学校中年教职工每周在线学习党史时长达3小时的人数最多,故A正确,B错误;要从该校的200名教职工中通过分层随机抽样的方法抽取20人,应该从青年教职工中抽取20×30%=6(人),故C正确;计算该学校在线学习党史时长达3小时的人数占总人数的比例为30%×90%+40%×80%+30%×70%=80%,故D正确.
12.27 因为70%×30=21,所以这组数据的第70百分位数是=27.
13.102.5 102 根据频率分布直方图中数据落在各区间的频率和为1得(0.01+0.03+0.02+m)×10=1,解得m=0.04,
该段时间内过往车辆速度的中位数是100+×10=102.5(km/h);
平均速度约为85×0.1+95×0.3+105×0.4+115×0.2=102(km/h).
14.7 计算10袋白糖质量的平均数为×(495+500+503+508+498+500+493+500+503+500)=500,
计算方差为s2=×[(-5)2+02+32+82+(-2)2+02+(-7)2+02+32+02]=16,
所以标准差为s=4,
所以[-s,+s]=[496,504],
所以质量落在区间[-s,+s]内的白糖有500,503,498,500,500,503,500,共7袋.
15.解 (1)=(1+0+2+0+2+3+0+4+1+2)×=1.5,
=(1+3+2+1+0+2+1+1+0+1)×=1.2.
∵,∴乙车床次品数的平均数较小.
(2)[(1-1.5)2+(0-1.5)2+(2-1.5)2+(0-1.5)2+(2-1.5)2+(3-1.5)2+(0-1.5)2+(4-1.5)2+(1-1.5)2+(2-1.5)2]=1.65,
同理=0.76,
∴,
∴乙车床的生产状况比较稳定.
16.解(1)由题意,得20+8+12+15+a=65,解得a=10,
又=100,解得b=0.5.
(2)年龄在区间[28,38),[38,48)内的居民(包括持反对意见者)分别有=20(人),=10(人),
故随机抽取18人进一步征询意见,年龄在[28,38)内的居民抽取18×=12(人),
年龄在[38,48)内的居民抽取18×=6(人).
17.解(1)由题意可得,
=6.5,
[3×(4-6.5)2+7×(5-6.5)2+11×(6-6.5)2+9×(7-6.5)2+6×(8-6.5)2+4×(9-6.5)2]=1.95.
(2)由(1)可得,(50+40)=(50×7.4+40×6.5)=7,
[2.6+(7.4-7)2]+×[1.95+(6.5-7)2]=.
18.解(1)由题意,得(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0)×10=1,解得a=0.025.
众数为=190,
因为(0.001 5+0.011 0+0.022 5)×10=0.35<0.5,
设中位数为x,则(0.001 5+0.011 0+0.022 5)×10+(x-185)×0.03=0.5,
解得x=190,所以中位数为190.
(2)①抽测的树苗中高度在[185,195),[195,205),[205,215),[215,225)内的株数分别为200×0.3=60,200×0.25=50,200×0.08=16,200×0.02=4,所以合格树苗的平均高度为≈197(cm).
②样本中合格树苗的频率为(0.030 0+0.025 0+0.008 0+0.002 0)×10=0.65,
则不合格树苗的频率为1-0.65=0.35,
所以按分层随机抽样方法抽取20株树苗,不合格树苗应抽取20×0.35=7(株),合格树苗应抽取20×0.65=13(株).
19.解(1)当0≤x≤200时,y=0.5x;
当200<x≤400时,y=0.5×200+0.8(x-200)=0.8x-60;
当x>400时,y=0.5×200+0.8×200+(x-400)=x-140.
所以y=
(2)由(1)可知,当y=260时,x=400,即用电量低于400 kW·h的占80%,
结合频率分布直方图可知,
解得a=0.001 5,b=0.002 0.
(3)设第75百分位数为m,
因为用电量低于300 kW·h的所占比例为(0.001+0.002+0.003)×100=60%,
用电量低于400 kW·h的占80%,所以75%分位数m在[300,400)内,
所以0.6+(m-300)×0.002=0.75,解得m=375,
可以估计用电量的第75百分位数为375 kW·h.
第4页
学科网(北京)股份有限公司
$