内容正文:
专题04 数据的收集及数字特征、频率分布直方图(9题型专项训练)
目录
A题型建模・专项突破
题型一、随机抽样的概念和合适的抽样方法 1
题型二、随机数表法 1
题型三、分层抽样(重) 2
题型四、条形图、折线图、扇形图的应用 4
题型五、样本平均数、众数、中位数的计算(重) 5
题型六、样本的极差、方差和标准差的计算 10
题型七、样本方差估算总体方差 12
题型八、百分位数的计算(重) 15
题型九、频率直方图中各个量的计算(重) 17
B综合攻坚·能力跃升 24
题型一、随机抽样的概念和合适的抽样方法
1.某学校为调查同学观看“9·3阅兵”的情况,从600名同学中抽取30人进行了解,则每名同学被抽到的概率为( )
A. B. C. D.
【答案】D
【详解】从600名同学中抽取30人进行了解,每名同学被抽到的概率为.
故选:D.
2.全班有42人,语文老师要抽取4人检查他们对某篇课文的理解情况,比较简便合理的方法是( )
A.分层抽样 B.系统抽样
C.抽签法 D.先用分层抽样再用抽签法
【答案】C
【详解】因为全班的人数不多,且没有明显的差异性,所以比较简便合理的方法是抽签法.
故选:C.
3.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.随机数法
C.分层抽样法 D.以上都不合适
【答案】C
【详解】总体有差异明显的三部分构成,因此应选择分层抽样法.
故选:C.
4.下列四种抽样中,不是简单随机抽样的是( )
A.从一个不透明的盒中,抽取2个球(盒中每个球的大小和质感一样)(多选)
B.一节公开课,老师点了7位同学回答问题或板书
C.根据某校学生的学籍号,教务处利用电脑软件抽取了20名学生
D.利用投掷硬币的方法,选出一个班级中所有掷出正面的学生
【答案】BD
【详解】简单随机抽样的特点是总体中的个体有限,从总体中逐个进行抽取,每个个体被抽到的机会均等,抽样是随机、无差别的;
对于A,从一个不透明的盒中,抽取2个球,所有球被抽到的可能性相同,故A是简单随机抽样;
对于B,老师点名有自己主观的考量,因此每位同学被抽到的可能性并不相同,故B不是简单随机抽样;
对于C,根据学籍号,并用电脑软件抽取,避免了人为因素的影响,从客观角度看,每位同学被抽到的可能性相同,故C是简单随机抽样;
对于D,利用投掷硬币的方法,选出一个班级中所有掷出正面的学生,此方法选出的样本容量不固定,不是简单随机抽样.
故选:BD.
5.用简单随机抽样的方法从含个个体的总体中,逐个抽取一个样本容量为4的样本,若其中个体在第一次就被抽取的可能性为,那么 .
【答案】20
【详解】因为用简单随机抽样的方法从含个个体的总体中逐个抽取,个体在第一次就被抽取的可能性为,
因此,所以.
故答案为:20
题型二、随机数表法
6.已知某运动员每次射击击中目标的概率为80%.现采用随机模拟的方法估计某运动员射击4次,至少击中3次的概率.先由计算器给出0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标,以4个随机数为一组,代表射击4次的结果,经随机模拟产生了20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 7610 4281
1417 4698 0371 6233 2616 8045 6011 3661 9597 7424
根据以上数据估计该射击运动员射击4次,至少击中3次的概率为( )
A.0.852 B.0.7 C.0.8 D.0.75
【答案】D
【详解】由已知的数表知,射击运动员射击4次,只击中1次或2次的有7140,7610,1417,0371,6011,共5组,
因此该射击运动员射击4次,至少击中3次的有15组,
所以该射击运动员射击4次,至少击中3次的概率为.
故选:D
7.从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为( )
0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
(注:表中的数据为随机数表第一行和第二行)
A.24 B.36 C.42 D.52
【答案】A
【详解】从随机数表第一行第列和第列数字开始往右依次选:、、、,
选出的第4个同学的编号为24.
故选:A.
8.要考查某种品牌的颗种子的发芽率,从中抽取颗种子进行实验,利用随机数表法抽取种子,先将颗种子按、、、进行编号,如果从随机数表第行第列的数开始并向右读,则抽到的第颗种子的编号是 .(下面抽取了随机数表第行至第行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
【答案】
【详解】由随机数表法可知,抽取的前颗种子的编号依次为:、、、,
故抽到的第颗种子的编号是.
故答案为:.
9.省农科站要检测某品牌种子的发芽率,计划采用随机数表法从该品牌800粒种子中抽取60粒进行检测,现将这800粒种子编号如下001,002,…,800,若从随机数表第8行第7列的数7开始向右读,则所抽取的第4粒种子的编号是 .(如下是随机数表第8行至第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0 13 42 99 66 02 79 54
【答案】507
【详解】由题意,依次读取的种子的编号为:
785,916(舍去),955(舍去),567,199,810(舍去),507.
故所抽取的第4粒种子的编号为507.
故答案为:507
10.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第7列开始向右依次读取数据,则得到的第5个样本编号是 .
【答案】09
【详解】从随机数表第1行的第7列数字开始由左向右每次连续读取2个数字,
删除超出范围及重复的编号,符合条件的编号有37,14,05,11,09,
所以选出来的第5个个体的编号为09.
故答案为:09.
题型三、分层抽样
11.某中学高中部有高一、高二、高三三个年级,其中高一与高二年级学生共有2800人,从所有高中学生中按照年级人数比例用分层随机抽样法抽取45人,其中高三年级抽取10人,则该中学高三年级学生人数为( )
A.1600 B.1400 C.1200 D.800
【答案】D
【详解】从所有高中学生中抽取45人,其中高三年级抽取10人,则高一、高二年级共抽取35人,
设高三年级学生人数为x,则,解得.
故选:D.
12.(多选)某高校大一新生中,来自东部地区的学生有2500人、中部地区的学生有1500人、西部地区的学生有1000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列说法正确的有( )
A.用简单随机抽样的方法从新生中选出100人最适合
B.用分层随机抽样的方法从新生中选出100人最适合,且用分层随机抽样的方法分别抽取东部地区学生50人、中部地区学生30人、西部地区学生20人
C.用分层随机抽样的方法抽取的100名学生中,西部地区学生小刘被选中的可能性比中部地区学生小张被选中的可能性大
D.总体是该高校全体大一新生
【答案】BD
【详解】因为各部地区的饮食习惯各不相同,差异较大,所以用分层抽样更合适,
又各地区人数比为,若抽取人数为100人,
则取东部地区学生50人、中部地区学生30人、西部地区学生20人,故A错误,B正确;
采取分层抽样,每个学生被抽取的可能性均为,各地区学生被选中的可能性大小是相等的,故C错误;
事件的总体为该高校全体大一新生,故D正确.
故选:BD.
13.某中学高一年级有男生640人,女生480人.为了解该年级男、女学生的身高差异,采用分层随机抽样.若样本容量为70,则应抽取的女生人数为 .
【答案】30
【详解】由分层随机抽样的定义可得抽取的女生数为.
故答案为:.
14.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200、400、300、100件.为检验产品的质量,现用分层抽样的方法,从以上所有的产品中抽取60件进行检验,则应从甲种型号的产品抽取 件.
【答案】12
【详解】由题意知分层比为,且总抽量为件
故甲产品应抽件
故答案为:12
15.某区从11000名小学生、10000名初中生和4000名高中生中采用分层抽样方法抽取名学生进行视力测试,若初中生比高中生多抽取60人,则 .
【答案】250
【详解】设小学生抽取的人数为,高中生抽取的人数为,则初中生抽取的人数为,
所以,解得,
从而.
故答案为:250
题型四、条形图、折线图、扇形图的应用
16.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
【答案】D
【详解】由饼状图,成绩前名的人中,高一人数比高二人数多
(人).故选项A判断正确;
由条形图知,成绩第1-100名的人中,前和后人数相等,
因此高一人数为,故选项B判断正确;
成绩第1-50名的50人中,高一人数为,
因此高三最多有32人. 故选项C判断正确;
成绩第51-名的50人中,高二人数无法确定,故选项D判断错误.
故选:D
17.中国人口亿人口中肠胃病患者高达亿,慢性胃炎发病率高达,消化性溃疡病发率也高达,是全世界当之无愧的“胃病大国”.根据随机对名青少年随机抽查,的青少年表示自己患有胃病,的青少年不清楚自己是否患有胃病,只有明确自己没有胃病.肠胃病的严重程度,一般可体现在排便量、排便时长上. 某高中为了了解学生肠胃病占比和严重程度,对年高一高二学生单日单次的排便时长进行了统计(记排便分钟内为正常,排便分钟为轻度肠胃病,排便分钟以上为重度肠胃病),并将结果制成统计图(如图所示),若高一学生人,高二学生人,占比百分数均保留整数,下列说法正确的是( )
A.高二学生的肠胃病人数比高一年级少
B.高一年级的各肠胃病区间人数占比都比高二年级少
C.高一年级重度肠胃病人数占比比高二年级少
D.高一肠胃质量参数比高二高(肠胃质量参数)
【答案】C
【详解】由扇形统计图可得高一年级肠胃病人数为,
高一年级的轻度肠胃病人数占比,
高一年级重度肠胃病人数占比为,
高一肠胃质量参数为,
由条形统计图可得高二年级肠胃病人数为,
高二年级的轻度肠胃病人数占比为,
高二年级重度肠胃病人数占比为,
高二肠胃质量参数为,
所以高二学生的肠胃病人数比高一年级多,A错误;
高一年级轻度肠胃病区间人数占比比高二年级高,B错误;
高一年级重度肠胃病人数占比比高二年级少,C正确;
高一肠胃质量参数比高二低,D错误;
故选:C.
18.神舟十三号载人飞行任务的圆满成功,标志着空间站关键技术验证阶段任务圆满完成,中国空间站即将进入建造阶段.某机构研究室通过随机抽样的方式,对18岁及以上人群进行了“你是否曾有过航天梦想”的调查研究,得到如下的统计结果.
根据调查结果,以下说法正确的是 (填序号).
①在“曾有过航天梦想”的人群中,54岁及以上的人数最少;
②在“曾有过航天梦想”的人群中,年龄越大,在航天相关方面的人均消费越少;
③在“曾有过航天梦想”的人群中,18—29岁在航天相关方面的总消费最多.
【答案】①③
【详解】对于①,从“曾有过航天梦想”的人年龄分布图可知,在“曾有过航天梦想”的人群中,
54岁及以上的人数最少,所以①正确;
对于②,在“曾有过航天梦想”的人群中,随着年龄增大,在航天相关方面的人均消费先变大后再变小,所以②错误;
对于③,设总人数为岁在航天相关方面的总消费约为,
30-40岁在航天相关方面的总消费约为,
41-53岁在航天相关方面的总消费约为,
54岁及以上在航天相关方面的总消费约为.
所以在“曾有过航天梦想”的人群中,18-29岁在航天相关方面的总消费最多,所以③正确.
故答案为:①③.
19.(多选)随着科技的发展和燃油车成本的上升,人们对新能源汽车的需求逐步增加,从而推动了厂商产品力的提升和新能源汽车销量的快速增长,如图为某机构统计的2017-2025年中国新能源汽车市场规模及预测数据,则( )
A.2017-2023年中国新能源汽车市场规模逐年增长
B.2017-2023年中国新能源汽车市场规模的中位数为3.4千亿元
C.逐年比较,预计2025年中国新能源汽车市场规模的增长量最大
D.2017-2025年中国新能源汽车市场规模与年份的关系可以用指数型函数模型进行拟合
【答案】ABD
【详解】对A:从2017-2023年中国新能源汽车市场规模数据看新能源汽车市场规模逐年增长,故A正确;
对B:数据从小到大排列为1.6,2.8,3.0,3.4,6.0,9.9,11.5,共7个数据,其中位数为第4个数据3.4,故B正确;
对C:2021年增长是为,2022年增长1.6,2023年增长6.9,2024年增长4.7,
从增长量上看并不是逐年增加,故无法预计2025年的增长量最大,故C错误;
对D:从数据上看,市场规模前期增长缓慢,后期增长较快,故可用指数型函数模型进行拟合,故D正确;
故选:ABD
20.(多选)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则以下一定正确的序号为( )
备注:,.
A.2021年7月至2022年7月全国居民消费价格环比增长率的极差为1%
B.2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数相同
C.从同比增长率看,2022年1月与2022年2月全国居民消费价格一定相同
D.从环比增长率看,2022年6月全国居民消费价格与2022年5月全国居民消费价格相同
【答案】ABD
【详解】对于A,2021年7月至2022年7月全国居民消费价格环比增长率的极差为,所以A正确,
对于B,易得2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数均为1.5%,所以B正确,
对于C,从同比增长率看,2022年1月与2022年2月全国居民消费价格同比增长率均为0.9%,
但2021年1月与2021年2月全国居民消费价格未知,即不一定相同,
所以2022年1月与2022年2月全国居民消费价格不一定相同,所以C错误;
对于D,从环比增长率看,2022年6月全国居民消费价格增长率为0,
所以2022年6月全国居民消费价格与2022年5月全国居民消费价格相同,所以D正确.
故选:ABD.
题型五、样本平均数、众数、中位数的计算
21.某学校组织了一场体育测试,现抽出60个人的体育考试分数,并对此进行统计,如图所示,关于这60人的分数,下列说法正确的是( )
A.众数是85 B.中位数是80
C.众数是21 D.中位数是12
【答案】A
【详解】从统计图中知,85分出现的次数最多,故众数是85;
把分数按大小排列,最中间的两个数是第30与31个数,
而,故中位数是;
故只有选项A正确;
故选:A.
22.高二某班有30名男生和20名女生,男生的平均身高比女生的平均身高多12厘米,则男生的平均身高比全班的平均身高( )
A.多4.8厘米 B.多5.6厘米 C.多7.2厘米 D.多8.4厘米
【答案】A
【详解】设男生平均身高为,女生平均身高为,则,
总体平均身高为,
则男生的平均身高减全班的平均身高为,
故男生的平均身高比全班的平均身高多4.8厘米.
故选:
23.若一组样本数据的平均数为8,则数据,的平均数为 .
【答案】14
【详解】由于样本数据的平均数为8,故,
的平均数为,
则,
故数据,的平均数为,
故答案为:14
24.已知数据,,的平均数为2,数据,,,,的平均数为10,则数据的平均数为( )
A.4 B.5 C.6 D.7
【答案】D
【详解】因为数据的平均数为2,数据的平均数为10,
所以数据的平均数为.
故选:D.
25.已知一组数据为2,4,6,5,m,4,3,则“”是“这组数据的中位数为4”的( )
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
【答案】A
【详解】“”,则题中数据从小到大排列为或,中位数均为4,充分性成立,
“这组数据的中位数为4”,若,仍满足这组数据的中位数为4,必要性不成立,
所以“”是“这组数据的中位数为4”的充分不必要条件.
故选:A
26.如图所示的茎叶图记录着甲、乙两支篮球是各6名球员某份比赛的得分数据(单位:分).若这两组数据的中位数相等,且平均值也相等,则 .
【答案】
【详解】由题意,甲的中位数为:,故乙的中位数①
,
,
因为平均数相同,所以②,
由①②可得,,
所以,
故答案为:.
27.某学习小组在“世界读书日”这天统计了本组5名同学在上学期阅读课外书籍的册数,数据是:.若这组数据的平均数为16,则这组数据的中位数是 .
【答案】16
【详解】由,可得.
所以数据从小到大为,显然中位数为16.
故答案为:16
题型六、样本的极差、方差和标准差的计算
28.今年,夕夕一家5个人的年龄分别为(单位:周岁):6,32,34,55,58与4年前相比,下列说法正确的是( )
A.平均数变大,方差变大 B.平均数变大,方差不变
C.平均数变小,方差变小 D.平均数变小,方差不变
【答案】B
【详解】4年前一家五口的岁数分别为2,28,30,51,54,
平均数为,
方差为;
今年一家五口的岁数分别为6,32,34,55,58
平均数为,
方差为;
则平均数变大,方差不变.
故选:B.
29.若一组数据的平均值,方差,若删去一个数之后,平均值没有改变,方差变为40,则这组数据的个数( )
A.5 B.6 C.7 D.8
【答案】A
【详解】由题意得到删去一个数之后,平均值没有改变,所以删除的数为5,
由题意,得,
删除一个数后的方差为:,
得,即.
故选:A.
30.一数学学习小组有5名同学,他们的历次数学考试成绩都比较稳定,且每次测试5人成绩的方差均为6左右.某次数学测试他们中的甲同学因故没能参加考试,其余四位同学的数学成绩分别为111分,114分,117分,118分.如果甲同学参加这次考试,利用以往的经验(方差为6)估计其成绩为( )
A.112分 B.113分 C.115分 D.119分
【答案】C
【详解】设甲的分数为,
则这五位同学本次考试成绩的平均数为:,
所以这五位同学本次考试成绩的方差为:
,解得,
所以甲的分数为.
故选:C
31.(多选)已知样本数据,,则( )
A.若样本数据的极差为,则样本数据的极差为
B.若样本数据的平均值为,则样本数据的平均值为
C.若样本数据的众数为,则样本数据的众数为
D.若样本数据的方差为,则样本数据的方差为
【答案】AC
【详解】对于A,设样本数据中,最大值为,最小值为,
则,
由于在上单调递增,
故样本数据中,最大值为,最小值为,
故,
则样本数据的极差为,故A正确;
对于B,由平均数的性质可得样本数据的平均值为,故B错误;
对于C,根据众数的定义可得,样本数据的众数为,故C正确.
对于D,根据方差的性质,样本数据的方差为,故D错误;
故选:AC.
32.(多选)已知一组数据,由()生成的一组新数据,则( )
A.新数据的极差可能与原数据的极差相等
B.新数据的平均数可能与原数据的平均数相等
C.新数据的中位数一定比原数据的中位数大
D.新数据的标准差一定比原数据的标准差大
【答案】BD
【详解】对于,数据的极差为,
新数据的极差为,故A错误;
对于,设数据的平均数为,则,
所以新数据的平均数为,
则当时,,故B正确;
对于,数据的中位数为,
新数据的中位数为,当时,,故C错误;
对于,设数据的标准差为,
则,
新数据的方差为[],
新数据的标准差为4s,故新数据的标准差一定比原数据的标准差大,故D正确.
故选:BD.
33.若一组数据的平均数为4,方差为3,那么数据的平均数和方差分别是 .
【答案】10,12
【详解】若一组数据的平均数为4,方差为3,
则数据的平均数和方差分别是.
故答案为:.
题型七、样本方差估算总体方差
34.某班男生、女生人数之比为,对该班同学每周运动时间(单位:时)进行调查,得知男生每周运动时间的平均数为,方差为,女生每周运动时间的平均数为,方差为,则该班全体同学每周运动时间的方差为( )
A.5.2 B.5.3 C.5.4 D.5.5
【答案】C
【详解】该班全体同学每周运动时间的平均数为,
方差为,
故选:C
35.某中学高一年级有600名男学生,400名女学生,现用分层随机抽样的方法调查了50名高一学生的身高.若样本中男生身高的平均数和方差分别为172和9,女生身高的平均数和方差分别为162和14,则估计高一年级学生的平均身高和方差分别为( )
A.168,35 B.168,20 C.169.6,35 D.169.6,20
【答案】A
【详解】男学生和女学生人数比例为,
故样本中男生人数为人,女生人数为人,
样本的平均数为,
样本的方差为.
故选:A.
36.从A队30人、B队20人中,按照分层随机抽样的方法从两队共抽取5人.进行一轮答题竞赛.相关统计情况如下:A队答对题目数的平均数为2,方差为1.5;B队答对题目数的平均数为1.方差为0.4,则这5人答对题目数的方差为( )
A.1.3 B.1.06 C.0.95 D.0.8
【答案】A
【详解】显然抽取A队3人,B队2人,整体平均数,
故总方差.
故选:A
37.据统计某市学生的男女生人数比为,为了调查该市学生每天睡眠时长的情况,按照男女生人数比用分层抽样的方法抽取样本.根据样本数据计算得男生每天睡眠时长的平均数为7.3小时,方差为2,女生每天睡眠时长的平均数为6.8小时,方差为1.9,则可估计该市学生每天睡眠时长的平均数为 小时,方差为 ;
参考公式:分层抽样中,假设第一层有m个数,平均数为,方差为;第二层有y个数,平均数为,方差为.则样本方差.
【答案】
【分析】
【详解】该市学生的男女生人数比为,设男生人数为,女生人数为,
男生每天睡眠时长的平均数为7.3小时,故个男生睡眠时长为小时;
女生每天睡眠时长的平均数为6.8小时,故个女生睡眠时长为小时,
则该市学生每天睡眠时长的平均数为(小时);
由题干可得,,,,,,
代入公式得,
.
故答案为:;.
题型八、百分位数的计算
38.若数据3,5,6,8,9,,18,21的上四分位数为15,则的值为( )
A.12 B.15 C.21 D.22
【答案】A
【详解】因为,
若,则,解得,若,则上四分位数为,不合题意,
若,则上四分位数为不合题意,
故选:A.
39.为落实“双碳”目标,某环保组织调研10个国家2024年度的人均碳排放强度(单位:吨/人·年)后,得到数据如下:2,4,5,7,8,9,11,12,13,15.则该组数据的分位数是( )
A.5 B.6 C.7 D.12
【答案】B
【详解】数据从小到大为:2,4,5,7,8,9,11,12,13,15,且,
则该组数据的分位数是.
故选:B.
40.在一次数学测试中,有8位同学的分数分别是115,118,125,130,130,132,136,140,则这组数据的75百分位数是( )
A.130 B.132 C.134 D.136
【答案】C
【详解】将8位同学分数从小到大排序为:115,118,125,130,130,132,136,140,
因,即这组数据的75百分位数为.
故选:C.
41.下表记录了上海某个月连续10天的空气质量指数():
时间
1
2
3
4
5
6
7
8
9
10
空气质歨指数()
20
28
24
33
31
35
36
38
36
37
则这些空气质量指数的分位数为( )
A.35 B.35.5 C.36 D.37
【答案】C
【详解】空气质量指数的10个数从小到大排列为:20,24,28,31,33,35,36,36,37,38,
又,所以分位数是.
故选:C.
42.一组数据按从大到小的顺序排列为8,7,x,4,4,1,若该组数据的中位数是众数的倍,则该组数据的第60百分位数是 .
【答案】6
【详解】因为数据1,4,4,,7,8(其中)的中位数为,众数为4,
所以,得,
因为,
所以这组数据的第60百分位数是6;
故答案为:6
43.有5人进行定点投篮游戏,每人投篮12次.这5人投中的次数形成一组数据,中位数为10,唯一众数为11,极差为3,则该组数据的第40百分位数是 .
【答案】9.5
【详解】设这5个数据从小到大为:
已知中位数为第三个数,故;
唯一众数为11,故d,e至少含11,且11出现次数至少2次,故;
极差为3,即;
若,则10和11均出现2次,众数不唯一;若,则8和11均出现2次,众数不唯一. 因此,.
综上,数据为:8,9,10,11,11.
根据百分位数公式:设数据个数为n,第百分位数的位置.
已知,,故.
当i为整数时,第百分位数位第项与第项的平均值,即
故答案为:9.5.
题型九、频率直方图中各个量的计算
44.某市为了解全市餐饮行业卫生情况,对本市的家餐饮企业的卫生情况进行了摸排,并把卫生情况各类指标的得分综合折算成标准分(最高为分),统计并制成如图所示的直方图,则这次摸排中标准分不低于分的企业数为( )
A. B. C. D.
【答案】A
【详解】由频率直方图知,不低于分的企业占比为,所以这次摸排中标准分不低于分的企业数为,
故选:A.
45.(多选)某市为修订用水政策,随机抽取100户居民,得到他们的月均用水量,并整理得到频率分布直方图,如图,根据直方图的数据信息,下列结论中正确的是( )
A.100户居民的月均用水量的第70百分位数约为10.8t
B.100户居民的月均用水量低于16.2t的用户占比超过90%
C.100户居民的月均用水量的极差介于21t与27t之间
D.100户居民的月均用水量的平均数小于中位数
【答案】AC
【详解】对于,因为,
所以第百分位数位于,
设第70百分位数为,则,则,A正确.
对于,月均用水量低于16.2t的用户频率为,B错误;
对于,月均用水量的极差的最大值小于,最小值大于,C正确;
对于,其平均数为
,
设其中位数为,则,解得
则中位数小于平均数,D错误.
故选:AC.
46.某人工智能公司为优化新开发的机器人模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,则图中 ,根据直方图可知满意度计分的第三四分位数约为 .
【答案】 0.03 85
【详解】由频率分布直方图可得,可得;
前三组的频率之和为,
前四组的频率之和为,所以满意度计分的第三四分位数,
所以,即满意度计分的第三四分位数约为85.
故答案为:0.03;85.
47.为进一步增强学生的疫情防控意识,友实学校组织学生进行了新冠肺炎疫情防控科普知识线上问答,共有100人参加了这次问答,将他们的成绩(满分100分)分成六组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],制成如图所示的频率分布直方图.
(1)求图中a的值;
(2)试估计这100人的问答成绩的中位数和平均数(结果保留整数);
(3)用分层抽样的方法从问答成绩在[70,100]内的学生中抽取24人参加疫情防控知识宣讲,那么在[70,80),[80,90),[90,100]内应各抽取多少人?
【答案】(1)
(2)73,72
(3)12,10,2
【分析】
【详解】(1);
(2)因为,
所以,所以中位数为;
平均数为;
(3)因为,
所以在[70,80),[80,90),[90,100]内应各抽取:
,,.
48.为积极参与马拉松比赛,某中学决定从3000名学生随机抽取100名学生进行体能检测,这100名学生进行了15公里的马拉松比赛,比赛成绩(分钟)的频率分布直方图如图所示,其中成绩分布区间是,,,,.
(1)求图中的值,并估计这100名学生比赛成绩的平均数;
(2)根据样本频率分布直方图,估计该校3000名学生中约有多少名学生能在80分钟内完成15公里马拉松比赛?
【答案】(1),平均数为73
(2)2250
【分析】
【详解】(1)由频率分布直方图得,解得,
这100名学生比赛成绩的平均数为
;
(2)由频率分布直方图可知,样本中能在80分钟内完成15公里马拉松比赛的频率为
,
所以该校3000名学生中能在80分钟内完成15公里马拉松比赛的学生人数约为
名.
49.课外阅读有很多好处,可以帮助学生提高阅读能力、拓展知识面、提高思维能力等.某校为了解学生课外阅读的情况,随机统计了n名学生一个学期的课外阅读时间(单位:时),所得数据都在内,将所得的数据分成4组:,,,,得到如图所示的频率分布直方图,现知道课外阅读时间在内的有80人.
(1)求n和a的值;
(2)估计该校学生一个学期课外阅读时间的平均数(同一组中的数据用该组区间的中点值代表);
(3)估计该校学生一个学期课外阅读时间的中位数.
【答案】(1)400;
(2)105
(3)106.25
【分析】
【详解】(1)根据题意,课外阅读时间在内的有80人,频率为,
所以.
由频率分布直方图可知,,
解得.
(2)估计该校学生一个学期课外阅读时间的平均数为:
.
(3)因为,所以中位数位于内,
设中位数为x,则,解得,
所以估计该校学生一个学期课外阅读时间的中位数为106.25.
50.从参加环保知识竞赛的学生中抽出60名学生,将其成绩(均为整数)整理后画出的频率直方图如图所示.观察图形,回答以下问题:
(1)这一组的频率和频数分别为多少?
(2)估计该次环保知识竞赛的及格率(60分以上为及格);
(3)估计这组数据的80百分位数.
【答案】(1)频率为,频数为;
(2)
(3)83.5.
【分析】
【详解】(1)频率为,频数为;
(2)及格率为;
(3)因为数据落在的频率为0.7,
数据落在的频率为0.25.
设这组数据的80百分位数为,
所以,
所以,故,
即这组数据的80百分位数为83.5.
51.为了落实习主席提出“绿水青山就是金山银山”的环境治理要求,某市政府积极鼓励居民节约用水.计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨),一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年200位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图,其中.
(1)求直方图中的值,并由频率分布直方图估计该市居民用水的平均数(每组数据用该组区间中点值作为代表);
(2)设该市有40万居民,估计全市居民中月均用水量不低于2吨的人数;
(3)若该市政府希望使85%的居民每月的用水量不超过标准(吨),估计的值.
【答案】(1),,该市居民用水的平均数估计
(2)(万)
(3)5.8吨
【分析】
【详解】(1)由频率分布直方图可得,
又,则,,
该市居民用水的平均数估计为:
;
(2)由频率分布直方图可得,
月均用水量不超过2吨的频率为:,
则月均用水量不低于2吨的频率为:,
所以全市40万居民中月均用水量不低于2吨的人数为:(万);
(3)由频率分布直方图知月均用水量不超过6吨的频率为:,
月均用水量不超过5吨的频率为:,
则85%的居民每月的用水量不超过的标准(吨),,
,解得,即标准为5.8吨.
一、单选题
1.国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )
A.2018年至2022年我国居民消费水平逐年提高
B.2018年至2022年我国城镇居民消费水平逐年提高
C.2018年至2022年我国居民消费水平数据的极差为6463元
D.2022年我国城镇人口数比农村人口数的1.5倍还要多
【答案】D
【详解】对于A,2019年的居民消费水平比2020年的居民消费水平高,故A错误;
对于B, 2018年至2022年我国城镇居民消费水平不是逐年提高,故B错误;
对于C,2018年至2022年我国居民消费水平数据的极差为6473元,故C错误;
对于D,设我国农村人口数为,城镇人口数为,
则,化简得,
所以2022年我国城镇人口数比农村人口数的1.5倍还要多,故D正确.
故选:D
2.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为120,女员工的平均体重为,标准差为6,男员工的平均体重为,标准差为4.若样本中有21名男员工,则女员工的人数为( )
A.28 B.35 C.39 D.48
【答案】C
【详解】由题意,记样本中女员工的平均体重和标准差分别为,,所占权重为,
男员工的平均体重和标准差分别为,,所占权重为,
所以样本中全部员工的平均体重为,方差
,
化简得,即,
解得或(舍),
所以女员工的人数为:,
故选:C.
3.以下数据为某学校参加学科节数学竞赛决赛的10人的成绩(单位:分):,.这10人成绩的第百分位数是84,则( )
A.65 B.70 C.75 D.80
【答案】B
【详解】因为10人成绩的第百分位数是84,而,即第7位与第8位的平均值,所以84是这10人成绩的第70百分位数.
故选:B.
4.设样本数据的平均数,中位数,众数和标准差分别为.当取得最小值时,( )
A. B. C. D.
【答案】A
【详解】令,
是一个开口向上的关于的二次函数,故函数在对称轴处取得最小值,
即.
故选:A.
5.已知一组样本数据,其中为正实数.满足.下列说法不正确的是( )
A.样本数据的第50百分位数为
B.若数据的频率分布直方图为单峰不对称,且在左边“拖尾”,则样本数据的平均数小于中位数
C.已知这组数据的极差是6,则数据的极差是11
D.样本数据的方差,则这组样本数据的总和等于80
【答案】C
【详解】因为,样本数据的第50百分位数为,故A正确;
对于B, 若数据的频率分布直方图为单峰不对称,且在左边“拖尾”,
则样本数据的平均数小于中位数,故B正确;
对于C,由题知,这组数据的极差为,
则数据的极差为,故C错误;
对于D,,则,
所以,故D正确.
故选:C.
二、多选题
6.某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如下所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)( )
A.
B.样本质量指标值的平均数为
C.样本质量指标值的众数大于其平均数
D.样本质量指标值的第75百分位数为84
【答案】AB
【详解】A选项,由题意得,解得,A正确;
B选项,样本质量指标值的平均数为,B正确;
C选项,样本质量指标值的众数为,C错误;
D选项,前三组数据的频率之和为,
前四组数据的频率之和为,
所以第百分位数位于第四组,设其为,
则,解得,
所以样本质量指标值的第75百分位数为,D错误;
故选:AB.
7.在某次校园十佳歌手比赛中,八名评委根据参赛选手的表现在5,6,7,8,9,10这六个分值中选择一个作为选手分数,按照规则,八个得分中去掉一个最高分和一个最低分(如有同分,则只去掉同分中的一个),剩下的六个分数作为有效得分.现对某名选手的六个有效得分进行统计,发现其平均值为.在对这六个有效得分统计的下述结论中,一定能判断六个有效得分的中位数不超过8的是( )
A.仅出现一个分数是5 B.极差为4
C.众数为7 D.方差不超过3
【答案】ACD
【详解】因为平均数为,所以六个数据的总和为,
六个有效得分的中位数如果超过,则六个数据从小到大排列后的第三、第四个数据只能为或或或,以下分四种情况讨论:
(1)若为,因为只能从5,6,7,8,9,10中取,则前两个数据的和最小为,
此时四个数据的和为,则剩下的两个数据和为,
所以这组数据只能为;
(2)若为,因为只能从5,6,7,8,9,10中取,则前两个数据的和最小为,
此时四个数据的和为,则剩下的两个数据和为,
因为后两个数据不小于,因此不存在第三、第四个分数为的有效得分;
(3)若为,因为只能从5,6,7,8,9,10中取,则前两个数据的和最小为,
此时这六个数据为,和为,
因此不存在第三、第四个数据为的有效得分;
(4)若为,因为只能从5,6,7,8,9,10中取,则前两个数据的和最小为,
此时这六个数据为,和为,
因此不存在第三、第四个数据为的有效得分;
综上所述,要使得中位数超过,则这六个有效得分只能是,中位数为
因此,只要不是这组数据,即可保证中位数不超过,
这组数据中有个,极差为,众数为,
方差为,
所以仅出现一个分数是5的数据中位数不会超过8,A正确;
极差为4的数据可以是,中位数,B错误;
众数是7的数据中位数不会超过8,C正确;
方差不超过的数据中位数不会超过8,D正确;
故选:ACD.
三、填空题
8.柏老师在整理建模小组10名学生的成绩时不小心遗失了一位学生的成绩,且剩余学生的成绩数据如下:,但李老师记得这名学生的成绩恰好是剩余学生的成绩的第25百分位数,则这10名学生的成绩的方差为 .
【答案】
【详解】因为,则遗失的学生成绩是剩余学生的成绩从小到大排列的第3个,
所以遗失的学生成绩为.
因为这10名学生的成绩的平均数为:,
所以方差为.
故答案为:2.09.
9.2019年国庆前夕,某市教育部门举办中小学生国防教育杯射击比赛,某校5名同学参加比赛,每人射击2次,该校3名男生选手的平均分为7环,方差为3,2名女生选手平均分为8环,方差为0.5,则该校所有选手得分的方差为 .
【答案】2.24
【详解】男生的6次总分为,女生4次总分为,所以,
男生方差为3,,,
女生方差为0.5,,,
所以..
故答案为:.
10.某高中为了调查学生对手机的使用情况,从全校学生中随机抽取100名学生进行问卷调查,他们一周内使用手机的时间(小时)频率分布直方图如下图所示,则参与调查的学生每周平均使用手机的时间约为 小时.(同一组数据用该组数据的中点值作代表)
【答案】4
【详解】由题意可知:每组的频率依次为,
则,解得,
可得平均数(小时),
所以平均使用手机的时间约为4小时.
故答案为:4.
四、解答题
11.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的中位数;
(2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【答案】(1),75
(2)62,37
【分析】
【详解】(1)因为每组小矩形的面积之和为1,
所以,
则.
成绩落在内的频率为,
成绩落在内的频率为,
设中位数为m,
由,得,故中位数为75.
(2)由图可知,成绩在的市民人数为,
成绩在的样本人数为,
故这两组成绩的总平均数为,
由样本方差计算总体方差公式可得总方差为:
.
12.某地区市政府为了鼓励居民节约用电,计划调整居民生活用电收费方案,拟确定一个合理的月用电量标准x(千瓦时);月用电量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用电情况进行了一次调研,并将参与调查的居民的用电情况绘制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值,并且计算居民用电的平均数(同一组中的数据用该组区间的中点值代替);
(2)若该地区市政府希望使85%的居民每月的用电量不超过标准x(千瓦时),估计x的值;(结果保留整数)
(3)设居民用电的平均数为x,若按居民用电量是否在区间内进行比例分配的分层随机抽样,抽取100位居民进行深度调研,用电量在区间内的抽取50人,试求m的值.
【答案】(1)
(2)
(3)
【分析】
【详解】(1)根据频率分布直方图可知,,
解得.
那么居民用电的平均数为:
千瓦时.
(2)由频率分布直方图可知,用电量在的累计频率为
,
用电量在的累计频率为
,
因为,所以在内,则有
,解得千瓦时.
(3)因为,抽取100位居民,其中用电量在内的抽取50人,
所以用电量在的频率为.
在中,频率为0.5,令,此时,
那么对应的为,此时频率小于0.5,
令,此时,
那么对应的为,此时频率大于0.5,
所以令,此时对应的为,
此时频率为,
所以的值为.
13.三个班共有100名学生,为调查他们的课外读书情况,通过分层抽样获得了部分学生一周的课外读书的时间,数据如下表(单位:小时):
A班
3
4.5
6
7.5
9
10.5
12
13.5
B班
6
6.5
7
7.5
8
C班
6
7
8
9
10
11
12
(1)试估计A班的学生人数;
(2)再从三个班中各随机抽取一名学生,他们该周课外读书的时间分别是(单位:小时).这3个新数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为,求和,并比较和的大小.
【答案】(1)
(2)
【分析】
【详解】(1)由题意知,抽出的20名学生中,来自A班的学生有8名,
根据分层抽样方法,可得A班的学生人数估计为人.
(2)抽出的样本中A班学生该周课外读书的平均数为:,
B班学生该周课外读书的平均数为,
C班学生该周课外读书的平均数为,
, ,
所以.
1 / 6
学科网(北京)股份有限公司
$
专题04 数据的收集及数字特征、频率分布直方图(9题型专项训练)
目录
A题型建模・专项突破
题型一、随机抽样的概念和合适的抽样方法 1
题型二、随机数表法 1
题型三、分层抽样(重) 2
题型四、条形图、折线图、扇形图的应用 3
题型五、样本平均数、众数、中位数的计算(重) 3
题型六、样本的极差、方差和标准差的计算 6
题型七、样本方差估算总体方差 7
题型八、百分位数的计算(重) 8
题型九、频率直方图中各个量的计算(重) 8
B综合攻坚·能力跃升 13
题型一、随机抽样的概念和合适的抽样方法
1.某学校为调查同学观看“9·3阅兵”的情况,从600名同学中抽取30人进行了解,则每名同学被抽到的概率为( )
A. B. C. D.
2.全班有42人,语文老师要抽取4人检查他们对某篇课文的理解情况,比较简便合理的方法是( )
A.分层抽样 B.系统抽样
C.抽签法 D.先用分层抽样再用抽签法
3.某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.随机数法
C.分层抽样法 D.以上都不合适
4.下列四种抽样中,不是简单随机抽样的是( )
A.从一个不透明的盒中,抽取2个球(盒中每个球的大小和质感一样)(多选)
B.一节公开课,老师点了7位同学回答问题或板书
C.根据某校学生的学籍号,教务处利用电脑软件抽取了20名学生
D.利用投掷硬币的方法,选出一个班级中所有掷出正面的学生
5.用简单随机抽样的方法从含个个体的总体中,逐个抽取一个样本容量为4的样本,若其中个体在第一次就被抽取的可能性为,那么 .
题型二、随机数表法
6.已知某运动员每次射击击中目标的概率为80%.现采用随机模拟的方法估计某运动员射击4次,至少击中3次的概率.先由计算器给出0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标,以4个随机数为一组,代表射击4次的结果,经随机模拟产生了20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 7610 4281
1417 4698 0371 6233 2616 8045 6011 3661 9597 7424
根据以上数据估计该射击运动员射击4次,至少击中3次的概率为( )
A.0.852 B.0.7 C.0.8 D.0.75
7.从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为( )
0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
(注:表中的数据为随机数表第一行和第二行)
A.24 B.36 C.42 D.52
8.要考查某种品牌的颗种子的发芽率,从中抽取颗种子进行实验,利用随机数表法抽取种子,先将颗种子按、、、进行编号,如果从随机数表第行第列的数开始并向右读,则抽到的第颗种子的编号是 .(下面抽取了随机数表第行至第行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
9.省农科站要检测某品牌种子的发芽率,计划采用随机数表法从该品牌800粒种子中抽取60粒进行检测,现将这800粒种子编号如下001,002,…,800,若从随机数表第8行第7列的数7开始向右读,则所抽取的第4粒种子的编号是 .(如下是随机数表第8行至第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0 13 42 99 66 02 79 54
10.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第7列开始向右依次读取数据,则得到的第5个样本编号是 .
题型三、分层抽样
11.某中学高中部有高一、高二、高三三个年级,其中高一与高二年级学生共有2800人,从所有高中学生中按照年级人数比例用分层随机抽样法抽取45人,其中高三年级抽取10人,则该中学高三年级学生人数为( )
A.1600 B.1400 C.1200 D.800
12.(多选)某高校大一新生中,来自东部地区的学生有2500人、中部地区的学生有1500人、西部地区的学生有1000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列说法正确的有( )
A.用简单随机抽样的方法从新生中选出100人最适合
B.用分层随机抽样的方法从新生中选出100人最适合,且用分层随机抽样的方法分别抽取东部地区学生50人、中部地区学生30人、西部地区学生20人
C.用分层随机抽样的方法抽取的100名学生中,西部地区学生小刘被选中的可能性比中部地区学生小张被选中的可能性大
D.总体是该高校全体大一新生
13.某中学高一年级有男生640人,女生480人.为了解该年级男、女学生的身高差异,采用分层随机抽样.若样本容量为70,则应抽取的女生人数为 .
14.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200、400、300、100件.为检验产品的质量,现用分层抽样的方法,从以上所有的产品中抽取60件进行检验,则应从甲种型号的产品抽取 件.
15.某区从11000名小学生、10000名初中生和4000名高中生中采用分层抽样方法抽取名学生进行视力测试,若初中生比高中生多抽取60人,则 .
题型四、条形图、折线图、扇形图的应用
16.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
17.中国人口亿人口中肠胃病患者高达亿,慢性胃炎发病率高达,消化性溃疡病发率也高达,是全世界当之无愧的“胃病大国”.根据随机对名青少年随机抽查,的青少年表示自己患有胃病,的青少年不清楚自己是否患有胃病,只有明确自己没有胃病.肠胃病的严重程度,一般可体现在排便量、排便时长上. 某高中为了了解学生肠胃病占比和严重程度,对年高一高二学生单日单次的排便时长进行了统计(记排便分钟内为正常,排便分钟为轻度肠胃病,排便分钟以上为重度肠胃病),并将结果制成统计图(如图所示),若高一学生人,高二学生人,占比百分数均保留整数,下列说法正确的是( )
A.高二学生的肠胃病人数比高一年级少
B.高一年级的各肠胃病区间人数占比都比高二年级少
C.高一年级重度肠胃病人数占比比高二年级少
D.高一肠胃质量参数比高二高(肠胃质量参数)
18.神舟十三号载人飞行任务的圆满成功,标志着空间站关键技术验证阶段任务圆满完成,中国空间站即将进入建造阶段.某机构研究室通过随机抽样的方式,对18岁及以上人群进行了“你是否曾有过航天梦想”的调查研究,得到如下的统计结果.
根据调查结果,以下说法正确的是 (填序号).
①在“曾有过航天梦想”的人群中,54岁及以上的人数最少;
②在“曾有过航天梦想”的人群中,年龄越大,在航天相关方面的人均消费越少;
③在“曾有过航天梦想”的人群中,18—29岁在航天相关方面的总消费最多.
19.(多选)随着科技的发展和燃油车成本的上升,人们对新能源汽车的需求逐步增加,从而推动了厂商产品力的提升和新能源汽车销量的快速增长,如图为某机构统计的2017-2025年中国新能源汽车市场规模及预测数据,则( )
A.2017-2023年中国新能源汽车市场规模逐年增长
B.2017-2023年中国新能源汽车市场规模的中位数为3.4千亿元
C.逐年比较,预计2025年中国新能源汽车市场规模的增长量最大
D.2017-2025年中国新能源汽车市场规模与年份的关系可以用指数型函数模型进行拟合
20.(多选)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则以下一定正确的序号为( )
备注:,.
A.2021年7月至2022年7月全国居民消费价格环比增长率的极差为1%
B.2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数相同
C.从同比增长率看,2022年1月与2022年2月全国居民消费价格一定相同
D.从环比增长率看,2022年6月全国居民消费价格与2022年5月全国居民消费价格相同
题型五、样本平均数、众数、中位数的计算
21.某学校组织了一场体育测试,现抽出60个人的体育考试分数,并对此进行统计,如图所示,关于这60人的分数,下列说法正确的是( )
A.众数是85 B.中位数是80
C.众数是21 D.中位数是12
22.高二某班有30名男生和20名女生,男生的平均身高比女生的平均身高多12厘米,则男生的平均身高比全班的平均身高( )
A.多4.8厘米 B.多5.6厘米 C.多7.2厘米 D.多8.4厘米
23.若一组样本数据的平均数为8,则数据,的平均数为 .
24.已知数据,,的平均数为2,数据,,,,的平均数为10,则数据的平均数为( )
A.4 B.5 C.6 D.7
25.已知一组数据为2,4,6,5,m,4,3,则“”是“这组数据的中位数为4”的( )
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
26.如图所示的茎叶图记录着甲、乙两支篮球是各6名球员某份比赛的得分数据(单位:分).若这两组数据的中位数相等,且平均值也相等,则 .
27.某学习小组在“世界读书日”这天统计了本组5名同学在上学期阅读课外书籍的册数,数据是:.若这组数据的平均数为16,则这组数据的中位数是 .
题型六、样本的极差、方差和标准差的计算
28.今年,夕夕一家5个人的年龄分别为(单位:周岁):6,32,34,55,58与4年前相比,下列说法正确的是( )
A.平均数变大,方差变大 B.平均数变大,方差不变
C.平均数变小,方差变小 D.平均数变小,方差不变
29.若一组数据的平均值,方差,若删去一个数之后,平均值没有改变,方差变为40,则这组数据的个数( )
A.5 B.6 C.7 D.8
30.一数学学习小组有5名同学,他们的历次数学考试成绩都比较稳定,且每次测试5人成绩的方差均为6左右.某次数学测试他们中的甲同学因故没能参加考试,其余四位同学的数学成绩分别为111分,114分,117分,118分.如果甲同学参加这次考试,利用以往的经验(方差为6)估计其成绩为( )
A.112分 B.113分 C.115分 D.119分
31.(多选)已知样本数据,,则( )
A.若样本数据的极差为,则样本数据的极差为
B.若样本数据的平均值为,则样本数据的平均值为
C.若样本数据的众数为,则样本数据的众数为
D.若样本数据的方差为,则样本数据的方差为
32.(多选)已知一组数据,由()生成的一组新数据,则( )
A.新数据的极差可能与原数据的极差相等
B.新数据的平均数可能与原数据的平均数相等
C.新数据的中位数一定比原数据的中位数大
D.新数据的标准差一定比原数据的标准差大
33.若一组数据的平均数为4,方差为3,那么数据的平均数和方差分别是 .
题型七、样本方差估算总体方差
34.某班男生、女生人数之比为,对该班同学每周运动时间(单位:时)进行调查,得知男生每周运动时间的平均数为,方差为,女生每周运动时间的平均数为,方差为,则该班全体同学每周运动时间的方差为( )
A.5.2 B.5.3 C.5.4 D.5.5
35.某中学高一年级有600名男学生,400名女学生,现用分层随机抽样的方法调查了50名高一学生的身高.若样本中男生身高的平均数和方差分别为172和9,女生身高的平均数和方差分别为162和14,则估计高一年级学生的平均身高和方差分别为( )
A.168,35 B.168,20 C.169.6,35 D.169.6,20
36.从A队30人、B队20人中,按照分层随机抽样的方法从两队共抽取5人.进行一轮答题竞赛.相关统计情况如下:A队答对题目数的平均数为2,方差为1.5;B队答对题目数的平均数为1.方差为0.4,则这5人答对题目数的方差为( )
A.1.3 B.1.06 C.0.95 D.0.8
37.据统计某市学生的男女生人数比为,为了调查该市学生每天睡眠时长的情况,按照男女生人数比用分层抽样的方法抽取样本.根据样本数据计算得男生每天睡眠时长的平均数为7.3小时,方差为2,女生每天睡眠时长的平均数为6.8小时,方差为1.9,则可估计该市学生每天睡眠时长的平均数为 小时,方差为 ;
参考公式:分层抽样中,假设第一层有m个数,平均数为,方差为;第二层有y个数,平均数为,方差为.则样本方差.
题型八、百分位数的计算
38.若数据3,5,6,8,9,,18,21的上四分位数为15,则的值为( )
A.12 B.15 C.21 D.22
39.为落实“双碳”目标,某环保组织调研10个国家2024年度的人均碳排放强度(单位:吨/人·年)后,得到数据如下:2,4,5,7,8,9,11,12,13,15.则该组数据的分位数是( )
A.5 B.6 C.7 D.12
40.在一次数学测试中,有8位同学的分数分别是115,118,125,130,130,132,136,140,则这组数据的75百分位数是( )
A.130 B.132 C.134 D.136
41.下表记录了上海某个月连续10天的空气质量指数():
时间
1
2
3
4
5
6
7
8
9
10
空气质歨指数()
20
28
24
33
31
35
36
38
36
37
则这些空气质量指数的分位数为( )
A.35 B.35.5 C.36 D.37
42.一组数据按从大到小的顺序排列为8,7,x,4,4,1,若该组数据的中位数是众数的倍,则该组数据的第60百分位数是 .
43.有5人进行定点投篮游戏,每人投篮12次.这5人投中的次数形成一组数据,中位数为10,唯一众数为11,极差为3,则该组数据的第40百分位数是 .
题型九、频率直方图中各个量的计算
44.某市为了解全市餐饮行业卫生情况,对本市的家餐饮企业的卫生情况进行了摸排,并把卫生情况各类指标的得分综合折算成标准分(最高为分),统计并制成如图所示的直方图,则这次摸排中标准分不低于分的企业数为( )
A. B. C. D.
45.(多选)某市为修订用水政策,随机抽取100户居民,得到他们的月均用水量,并整理得到频率分布直方图,如图,根据直方图的数据信息,下列结论中正确的是( )
A.100户居民的月均用水量的第70百分位数约为10.8t
B.100户居民的月均用水量低于16.2t的用户占比超过90%
C.100户居民的月均用水量的极差介于21t与27t之间
D.100户居民的月均用水量的平均数小于中位数
46.某人工智能公司为优化新开发的机器人模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,则图中 ,根据直方图可知满意度计分的第三四分位数约为 .
47.为进一步增强学生的疫情防控意识,友实学校组织学生进行了新冠肺炎疫情防控科普知识线上问答,共有100人参加了这次问答,将他们的成绩(满分100分)分成六组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],制成如图所示的频率分布直方图.
(1)求图中a的值;
(2)试估计这100人的问答成绩的中位数和平均数(结果保留整数);
(3)用分层抽样的方法从问答成绩在[70,100]内的学生中抽取24人参加疫情防控知识宣讲,那么在[70,80),[80,90),[90,100]内应各抽取多少人?
48.为积极参与马拉松比赛,某中学决定从3000名学生随机抽取100名学生进行体能检测,这100名学生进行了15公里的马拉松比赛,比赛成绩(分钟)的频率分布直方图如图所示,其中成绩分布区间是,,,,.
(1)求图中的值,并估计这100名学生比赛成绩的平均数;
(2)根据样本频率分布直方图,估计该校3000名学生中约有多少名学生能在80分钟内完成15公里马拉松比赛?
49.课外阅读有很多好处,可以帮助学生提高阅读能力、拓展知识面、提高思维能力等.某校为了解学生课外阅读的情况,随机统计了n名学生一个学期的课外阅读时间(单位:时),所得数据都在内,将所得的数据分成4组:,,,,得到如图所示的频率分布直方图,现知道课外阅读时间在内的有80人.
(1)求n和a的值;
(2)估计该校学生一个学期课外阅读时间的平均数(同一组中的数据用该组区间的中点值代表);
(3)估计该校学生一个学期课外阅读时间的中位数.
50.从参加环保知识竞赛的学生中抽出60名学生,将其成绩(均为整数)整理后画出的频率直方图如图所示.观察图形,回答以下问题:
(1)这一组的频率和频数分别为多少?
(2)估计该次环保知识竞赛的及格率(60分以上为及格);
(3)估计这组数据的80百分位数.
51.为了落实习主席提出“绿水青山就是金山银山”的环境治理要求,某市政府积极鼓励居民节约用水.计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨),一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年200位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图,其中.
(1)求直方图中的值,并由频率分布直方图估计该市居民用水的平均数(每组数据用该组区间中点值作为代表);
(2)设该市有40万居民,估计全市居民中月均用水量不低于2吨的人数;
(3)若该市政府希望使85%的居民每月的用水量不超过标准(吨),估计的值.
一、单选题
1.国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )
A.2018年至2022年我国居民消费水平逐年提高
B.2018年至2022年我国城镇居民消费水平逐年提高
C.2018年至2022年我国居民消费水平数据的极差为6463元
D.2022年我国城镇人口数比农村人口数的1.5倍还要多
2.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,已知所抽取的所有员工的体重的方差为120,女员工的平均体重为,标准差为6,男员工的平均体重为,标准差为4.若样本中有21名男员工,则女员工的人数为( )
A.28 B.35 C.39 D.48
3.以下数据为某学校参加学科节数学竞赛决赛的10人的成绩(单位:分):,.这10人成绩的第百分位数是84,则( )
A.65 B.70 C.75 D.80
4.设样本数据的平均数,中位数,众数和标准差分别为.当取得最小值时,( )
A. B. C. D.
5.已知一组样本数据,其中为正实数.满足.下列说法不正确的是( )
A.样本数据的第50百分位数为
B.若数据的频率分布直方图为单峰不对称,且在左边“拖尾”,则样本数据的平均数小于中位数
C.已知这组数据的极差是6,则数据的极差是11
D.样本数据的方差,则这组样本数据的总和等于80
二、多选题
6.某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如下所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)( )
A.
B.样本质量指标值的平均数为
C.样本质量指标值的众数大于其平均数
D.样本质量指标值的第75百分位数为84
7.在某次校园十佳歌手比赛中,八名评委根据参赛选手的表现在5,6,7,8,9,10这六个分值中选择一个作为选手分数,按照规则,八个得分中去掉一个最高分和一个最低分(如有同分,则只去掉同分中的一个),剩下的六个分数作为有效得分.现对某名选手的六个有效得分进行统计,发现其平均值为.在对这六个有效得分统计的下述结论中,一定能判断六个有效得分的中位数不超过8的是( )
A.仅出现一个分数是5 B.极差为4
C.众数为7 D.方差不超过3
三、填空题
8.柏老师在整理建模小组10名学生的成绩时不小心遗失了一位学生的成绩,且剩余学生的成绩数据如下:,但李老师记得这名学生的成绩恰好是剩余学生的成绩的第25百分位数,则这10名学生的成绩的方差为 .
9.2019年国庆前夕,某市教育部门举办中小学生国防教育杯射击比赛,某校5名同学参加比赛,每人射击2次,该校3名男生选手的平均分为7环,方差为3,2名女生选手平均分为8环,方差为0.5,则该校所有选手得分的方差为 .
10.某高中为了调查学生对手机的使用情况,从全校学生中随机抽取100名学生进行问卷调查,他们一周内使用手机的时间(小时)频率分布直方图如下图所示,则参与调查的学生每周平均使用手机的时间约为 小时.(同一组数据用该组数据的中点值作代表)
四、解答题
11.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的中位数;
(2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
12.某地区市政府为了鼓励居民节约用电,计划调整居民生活用电收费方案,拟确定一个合理的月用电量标准x(千瓦时);月用电量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用电情况进行了一次调研,并将参与调查的居民的用电情况绘制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值,并且计算居民用电的平均数(同一组中的数据用该组区间的中点值代替);
(2)若该地区市政府希望使85%的居民每月的用电量不超过标准x(千瓦时),估计x的值;(结果保留整数)
(3)设居民用电的平均数为x,若按居民用电量是否在区间内进行比例分配的分层随机抽样,抽取100位居民进行深度调研,用电量在区间内的抽取50人,试求m的值.
13.三个班共有100名学生,为调查他们的课外读书情况,通过分层抽样获得了部分学生一周的课外读书的时间,数据如下表(单位:小时):
A班
3
4.5
6
7.5
9
10.5
12
13.5
B班
6
6.5
7
7.5
8
C班
6
7
8
9
10
11
12
(1)试估计A班的学生人数;
(2)再从三个班中各随机抽取一名学生,他们该周课外读书的时间分别是(单位:小时).这3个新数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为,求和,并比较和的大小.
1 / 6
学科网(北京)股份有限公司
$