内容正文:
期末真题专项训练04 统计
【考点一】随机数表法
【考点七】计算几个数的众数、中位数、平均数
【考点二】分层抽样的特征及适用条件
【考点八】根据众数、平均数求参数
【考点三】抽样比、样本总量、各层总数、总体容量的计算
【考点九】由频率分布直方图估计中位数、平均数
【考点四】由频率分布直方图计算频率、频数、样本容量、总体容量
【考点十】计算几个数据的极差、方差、标准差
【考点五】频率分布直方图的实际应用
【考点十一】各数据同时加减、乘除同一数对方差的影响
【考点六】总体百分位数的估计
【考点十二】用方差、标准差说明数据的波动程度
【考点一】随机数表法
1.(24-25高一下·新疆乌鲁木齐·期末)某班有56名学生,从中选出5名同学.把56名同学进行编号,分别为.现利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第7列和第8列数字开始由左向右依次选取两个数字(作为个体的编号),如果选取的两个数字不在总体内,则将它去掉,继续向右选取两个数字,则选出来的第4个个体的编号为( )
32
45
66
67
14
64
05
71
95
86
11
05
65
09
68
76
83
20
37
90
57
16
00
11
66
14
90
84
45
11
75
73
88
05
90
52
27
41
14
86
A.09 B.20 C.37 D.05
2.(24-25高一上·江西抚州·期末)2024年10月1日是中华人民共和国建国75周年,为弘扬爱国主义精神,共同感受党的伟大历程,抚州市第一中学高一年级决定从每班随机抽取5名学生参加“祖国在我心”知识竞答.若高一某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第1行第5列的数开始,每次从左向右选取两个数字,则选取的第四个编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.14 B.02 C.43 D.07
3.(24-25高一上·河南南阳·期末)福利彩票“双色球”中红色球的号码由编号01,02,…,33的33个数字组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表(如下表)第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第3个红色球的编号为( )
49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
A.23 B.09 C.20 D.17
4.(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
5.(23-24高一下·浙江宁波·期末)总体由编号为01, 02,,19,20的20个个体组成.利用下面的随机数表选取8个个体,选取方法是从随机数表第1行的第5列和第6列数字(即65)开始由左到右依次选取两个数字(作为个体的编号):如果选取的两个数字不在总体内,则将它去掉,继续向右选取两个数字,那么选出来的第6个个体的编号为________
7816 6527 0802 6314 0704 4369 9728 1198
3204 9234 4935 8200 3623 4869 6938 7481
【考点二】分层抽样的特征及适用条件
6.(24-25高一下·山东枣庄·期末)某中学有青年教师95人,中年教师65人,老年教师20人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.随机数法
C.分层随机抽样 D.简单随机抽样
7.(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
8.(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
9.(多选)(23-24高一下·内蒙古鄂尔多斯·期末)下列说法中正确的有( )
A.总体的个体数不多且差异程度较小时宜用简单随机抽样法
B.百货商场的抽奖活动是抽签法
C.在总体分层抽样后的各层进行抽样时,可采用简单随机抽样
D.在整个抽样过程中,每个个体被抽取的机率不一样
10.某校高二年级有1500名学生,为了解学生的学习状况,对学生按首选物理和历史采用分层抽样的办法进行抽样调查,抽取了一个容量为120的样本,样本中80人首选物理,则该年级首选历史的学生有______人.
【考点三】抽样比、样本总量、各层总数、总体容量的计算
11.(25-26高一上·辽宁辽阳·期末)某中学学生可通过选课平台选择校本课程《能源材料与节能环保》《我们的汉字》《网球运动基础探秘》《软笔书法临习与创作》,若只统计选择其中一门课程的人数,则选择这四门校本课程的人数分别为1200,1600,800,1200.根据所选课程采用按比例分层随机抽样的方法,从这些学生中随机抽取24名学生进行座谈,则应从选择《我们的汉字》的学生中抽取的人数为( )
A.6 B.8 C.12 D.9
12.(24-25高一下·新疆哈密·期末)某校高一、高二、高三年级的学生人数之比为,现用分层随机抽样的方法从该校三个年级的学生中抽取容量为300的样本,则从高二年级抽取的学生人数为( )
A.60 B.90 C.120 D.150
13.(多选)(24-25高一下·贵州黔南·期末)某高校大一新生中,来自东部地区的学生有2500人、中部地区的学生有1500人、西部地区的学生有1000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列说法正确的有( )
A.用简单随机抽样的方法从新生中选出100人最适合
B.用分层随机抽样的方法从新生中选出100人最适合,且用分层随机抽样的方法分别抽取东部地区学生50人、中部地区学生30人、西部地区学生20人
C.用分层随机抽样的方法抽取的100名学生中,西部地区学生小刘被选中的可能性比中部地区学生小张被选中的可能性大
D.总体是该高校全体大一新生
14.(24-25高一下·福建漳州·期末)某工厂生产三种不同型号的产品,数量之比为,现采用分层抽样的方法抽取个产品进行分析,则型号产品被抽取的数量等于______.
15.(23-24高一下·河南商丘·期末)某市半程马拉松比赛需要学生志愿者若干名,其中某路段从某校高一年级1000人中按男、女采用比例分配的分层随机抽样抽取一个容量为50的样本,且样本中男生人数比女生人数多20人,则这1000人中女生有______人.
【考点四】由频率分布直方图计算频率、频数、样本容量、总体容量
16.(23-24高一下·湖南邵阳·期末)某校高一年级有800名学生选学物理,将某次联考的物理成绩绘制成的频率分布直方图如图所示,则高一年级这次联考的物理成绩位于区间的人数约为( )
A.200 B.220 C.240 D.260
17.(23-24高一下·山西大同·期末)某部门为了了解一批树苗的生长情况,在4000棵树苗中随机抽取400棵,统计这400棵树苗的高度(单位:),将所得数据分成7组:,,,,,,,并绘制了如图所示的频率分布直方图,那么根据该图可推测,在这4000棵树苗中高度小于的树苗棵数约是( )
A.1680 B.1760 C.1840 D.1920
18.(多选)(23-24高一下·湖北·期末)武汉某中学为了加强食堂用餐质量,该校随机调查了100名学生,根据这100名学生对食堂用餐质量给出的评分数据,分成,,,,五组,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.
B.该样本数据的中位数和众数均为85
C.若样本数据的平均数低于85分,则认为食堂需要整改,根据此样本我们认为该校食堂需要整改
D.为了解评分较低的原因,该校从评分低于80分的学生中用分层抽样的方法随机抽取18人座谈,则应选取评分在的学生4人
19.如图是一组数据的频率分布直方图,分段区间分别是,则__________.
20.(24-25高一下·贵州铜仁·期末)某校高一年级有学生2000名,为了了解高一学生的体能情况,随机抽取部分学生进行1分钟跳绳测试,将所得数据整理后,按,分为5组,画出频率分布直方图,如图所示.
(1)求的值;
(2)若规定:高一学生1分钟跳绳125次以上(含125次)成绩为良好.试估计该校高一学生1分钟跳绳成绩良好的人数.
【考点五】频率分布直方图的实际应用
21.(24-25高一下·广东广州·期末)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当时,求与;
(2)设函数,当时,求的解析式,并求在区间上的最小值.
22.(23-24高一下·四川自贡·期末)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民用水标准(单位:),月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解全市居民用水量分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:),将数据按照分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中的值;若该市有200万居民,估计全市居民中月均用水量不低于的人数;
(2)若该市政府希望使的居民每月的用水量不超过标准,估计的值.
23.(23-24高一下·湖北武汉·期末)现随机抽取1000名A校学生和1000名B校学生参加一场知识问答竞赛,得到的竞赛成绩全部位于区间中,现分别对两校学生的成绩作统计分析:对A校学生的成绩经分析后发现,可将其分成组距为10,组数为6,作频率分布直方图,且频率分布直方图中的Y()满足函数关系(n为组数序号,),关于B校学生成绩的频率分布直方图如图所示,假定每组组内数据都是均匀分布的.
(1)求k的值;
(2)若B校准备给前50名的学生奖励,应该奖励多少分以上的学生?
(3)现在设置一个标准t来判定某一学生是属于A校还是B校,将成绩小于t的学生判为B校,大于t的学生判为A校,将A校学生误判为B校学生的概率称为误判率A,将B校学生误判为A校学生的概率称为误判率B,误判率A与误判率B之和称作总误判率.若,求总误判率的最小值,以及此时t的值.
24.我国是世界上严重缺水的国家,城市缺水问题较为突出.某市为了制定合理的节水方案,需要了解全市居民用水量分布情况.通过抽样,获得了位居民某年的月均用水量(单位:t),将数据按照,,,分成9组,制成了如图所示的频率分布直方图,若已知样本数据落在区间的频数为20.
(1)求样本容量和频率分布直方图中的值;
(2)用样本频率估计总体,若该市有60万居民,市政府希望使51万的居民每月的用水量不超过标准,试估计的值,并说明理由.
25.(22-23高一下·河南·期末)后疫情时代,为了可持续发展,提高人民幸福指数,国家先后出台了多项减税增效政策.某地区对在职员工进行了个人所得税的调查,经过分层随机抽样,获得2000位在职员工的个人所得税(单位:百元)数据,按,,,,,,,,分成九组,制成如图所示的频率分布直方图:
(1)求直方图中t的值:
(2)根据频率分布直方图估计该市的70%职工年个人所得税不超过m(百元),求m的最小值;
(3)已知该地区有20万在职员工,规定:每位在职员工年个人所得税不超过5000元的正常收取,若超过5000元,则超出的部分退税20%,请估计该地区退税总数约为多少.
【考点六】总体百分位数的估计
26.(25-26高一上·江西九江·期末)某校高三年级共有名学生参加数学测验,已知所有学生成绩的第百分位数是分,则数学成绩不低于分的人数大约为( )
A.200 B.300 C.1200 D.1300
27.(25-26高一上·辽宁辽阳·期末)若某省2017年至2024年人均生产总值增速分别为4.49%,6.03%,5.87%,1.06%,6.40%,2.80%,5.90%,5.60%,则该组数据的60%分位数为( )
A.5.735% B.5.60% C.5.87% D.5.90%
28.(25-26高一上·全国·期末)样本数据5,5,6,7,9的80百分位数为___________
29.(24-25高一下·湖南岳阳·期末)某科技攻关青年团队共有8人,他们的年龄分别是29,35,40,36,38,34,32,41,则这8人年龄的25%分位数是_______.
30.(24-25高一下·广东佛山·期末)某商场停车收费标准如下:停车时间在1小时内(含1小时)免费,超过1小时的部分,每小时收费4元(不足1小时的部分按1小时算,如停车时长为2.5小时,则按3小时计算,收费8元),一天之内封顶24元.为了解该商场停车情况,通过抽样,获得了100辆车一天内的停车时长(单位:小时),将数据按照,,,分成9.组,制成了如图所示的频率分布直方图.
(1)估计停车费为24元的频率;
(2)估计停车时长的第85百分位数;
(3)假设这个商场节假日一天有800辆车进入车场停车,估计该商场节假日一天的停车费收入.
【考点七】计算几个数的众数、中位数、平均数
31.(24-25高一下·河北邯郸·期末)已知高一三班的某次数学测试中,某学习小组的成绩如下:70,75,94,85,85,90,86,90,85,100,则该小组成绩的平均数、众数、中位数的大小关系是( )
A.众数=中位数<平均数 B.众数<中位数<平均数
C.众数<平均数<中位数 D.众数=平均数<中位数
32.(24-25高一下·安徽·期末)某项比赛共有7个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是( )
A.极差 B.45%分位数 C.平均数 D.众数
33.(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是( )
A.86,84 B.84.5,85 C.85,84 D.86.5,84
34.(多选)(24-25高一下·云南昭通·期末)四名同学各掷骰子5次,分别记录每次骰子出现的点数,根据四名同学的统计结果,可能出现点数6的是( )
A.第25百分位数为3,众数为5 B.平均数为2,方差为3
C.中位数为3,方差为2.8 D.平均数为3,中位数为4
35.(24-25高一下·陕西西安·期末)某篮球兴趣小组有7名学生参加投篮比赛,每人投10个,投中的个数分别为:8、5、7、5、8、6、8,则这组数据的众数与中位数之和为___________.
【考点八】根据众数、平均数求参数
36.(23-24高一下·广西南宁·期末)高二(1)班有40名学生,其中男生有16名,已知男生平均体重为68.4kg,总平均体重为60.1kg,则女生的平均体重约为( )
A.55.8kg B.54.6kg C.52.4kg D.51.8kg
37.(24-25高一下·陕西汉中·期末)某校举办“迎七一”红歌比赛,五位评委给某参赛班级的评分分别为87,87,89,m,90,若这组数据的平均数为88,则这组数据的中位数为( )
A.88 B.87 C.89 D.90
38.(24-25高一上·辽宁沈阳·期末)已知一组数据丢失了其中一个,剩下的六个数据分别是、、、、、,若这组数据的平均数与众数的和是中位数的倍,则丢失数据的所有可能值构成的集合为______.
39.已知是1,2,3,,5,6,7这7个数据的中位数,且1,2,,这四个数据的平均数为1,则的最小值为______.
40.为响应国家“学习强国”的号召,培养同学们的“社会主义核心价值观”,某校团委组织学生参加知识竞赛,以下数据为该校参加竞赛的10名同学的成绩:91,93,93,94,a,97,a,98,a,99.若这组数据的平均数为95,则这10名同学成绩的第80百分位数是______.
【考点九】由频率分布直方图估计中位数、平均数
41.(24-25高一下·广东汕头·期末)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了减少水资源的浪费,通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t),画出如图所示的频率分布直方图,则下列说法错误的是( )
+
A.可以估计该市月均用水量在区间内的居民用户最多
B.可以估计随着月均用水量的增加,该市居民用户数呈现降低趋势
C.可以估计该市月均用水量的平均数小于中位数
D.可以估计该市居民月均用水量的分位数为14.2
42.(24-25高一下·浙江宁波·期末)学校为了解全校1800名学生的身体肥胖情况,随机抽取了100名学生的体检数据,将其BMI值分成以下五组:,,,,,得到相应的频率分布直方图,如图所示.则下列说法错误的是( )
A.
B.估计样本的中位数为23
C.估计样本的众数为22
D.估计全校学生BMI值落在区间的人数为36人
43.(多选)(25-26高一上·江西上饶·期末)上饶市某学校从高一的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和之间,将测量结果按如下方式分成八组:第一组,第二组,⋯,第八组.下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.以下说法正确的是( )
A.第二组的频率为0.016
B.第七组的频率为0.06
C.估计该校高一800名男生的身高的中位数约为
D.估计该校高一800名男生的身高的平均数约为
44.(23-24高一下·云南大理·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的中位数、平均数和众数,则的大小关系为__________.
45.(25-26高一上·陕西渭南·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数、中位数和平均数;
【考点十】计算几个数据的极差、方差、标准差
46.(24-25高一下·河北雄安·期末)已知,,的平均数与方差均为3,则,,的平均数为( )
A.9 B.12 C.15 D.20
47.(25-26高一上·甘肃庆阳·期末)从某款苹果礼盒中随机抽取5个苹果,测得这5个苹果的果径(单位:)分别为74,75,75,75,76.这5个苹果中,果径在以平均数为中心,1倍标准差范围内的有( )
A.5个 B.4个 C.3个 D.0个
48.(24-25高一下·福建福州·期末)样本数据3,5,8,2,4,2的方差是___________ ;
49.(24-25高一下·内蒙古包头·期末)在某次测验中,有6位同学的平均成绩为75分,且前5位同学的成绩分别是70,76,72,70,72.则这6位同学成绩的标准差________.
50.(25-26高一上·山西忻州·期末)某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了100名学生的成绩作为样本进行统计,将其成绩(满分:100分)分成,,…,六组,得到如图所示频率分布直方图.
(1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若根据这次成绩,学校准备给成绩较高的前20%的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数;
(3)若落在中的样本数据的平均数是54,方差是6,落在中的样本数据的平均数是66,方差是3,求这两组数据的总平均数和方差.
【考点十一】各数据同时加减、乘除同一数对方差的影响
51.(24-25高一下·山东烟台·期末)若数据,,,的方差为,则数据,,,的方差为( )
A. B. C. D.
52.(24-25高一下·四川广元·期末)有一组样本数据,,…,,其平均数和方差分别为,.由这组数据得到一组新样本数据,,…,.其中,其平均数和方差分别为,,则( )
A. B.
C. D.
53.(多选)(25-26高一上·贵州遵义·期末)某学校高一年级随机抽取了10名学生的数学周测成绩(满分150分),记录如下:.下列说法正确的是( )
A.这组数据的极差是34.5,中位数是129.75,
B.这组数据的众数为127.5,其频率是0.3
C.去掉一个最高分和一个最低分后,剩下数据的标准差比原始数据的标准差小
D.如果每个学生的成绩都增加7.5分,则新数据的中位数、众数均增加7.5分,而方差保持不变
54.(23-24高一下·陕西宝鸡·期末)若一组样本数据,,,的标准差为4,则数据,,,的标准差为______.
55.(23-24高一下·安徽六安·期末)若一组数据的方差为1,则数据的标准差为______.
【考点十二】用方差、标准差说明数据的波动程度
56.(24-25高一下·吉林·期末)下列叙述中,错误的是( )
A.样本数据的中位数可能不受少数几个极端值的影响
B.数据的标准差比较小时,数据比较分散
C.数据的极差反映了数据的集中程度
D.任何一个样本数据的改变都会引起平均数的改变
57.(24-25高一下·四川达州·期末)衡量数据离散程度还可以使用变异系数(标准差与平均数的比值,一般来说变异系数越大,其离散程度的测度值越大,反之越小).下表总结了标准差与变异系数的适用场景.某次考试后,甲班平均分80分,标准差9分;乙班平均分100分,标准差10分.则
场景
使用标准差
使用变异系数
数据单位相同,均值相近
直接比较绝对波动
不必要
数据单位不同
无法直接比较
消除单位差异,比较相对波动
均值差异大
可能误导
标准化后比较相对波动
A.甲班成绩相对更稳定 B.乙班成绩相对更稳定
C.甲、乙两班成绩一样稳定 D.不确定
58.(多选)(25-26高一上·江西景德镇·期末)我校AB两班同时参加了一次数学阶段性测试,其中A班50人,B班40人,A班的平均成绩为116分,方差是360;B班的平均成绩是102.5分,方差是450.下列说法正确的是( )
A.A班最高分比班高
B.A班成绩比B班成绩更集中
C.AB两班全部人的平均成绩是110分
D.AB两班全部人的成绩方差是445
59.(多选)(25-26高一上·江西南昌·期末)一体育比赛,7个评委打分,相对之前的分数,去掉一个最高分,去掉一个最低分后,下列说法正确的是( )
A.中位数一定不变 B.平均数一定不变
C.方差不变或变小 D.极差不变或变小
60.将三组数据绘制成如下的折线图,则这三组数据中,______组数据的方差最小.
1
学科网(北京)股份有限公司
$
期末真题专项训练04 统计
【考点一】随机数表法
【考点七】计算几个数的众数、中位数、平均数
【考点二】分层抽样的特征及适用条件
【考点八】根据众数、平均数求参数
【考点三】抽样比、样本总量、各层总数、总体容量的计算
【考点九】由频率分布直方图估计中位数、平均数
【考点四】由频率分布直方图计算频率、频数、样本容量、总体容量
【考点十】计算几个数据的极差、方差、标准差
【考点五】频率分布直方图的实际应用
【考点十一】各数据同时加减、乘除同一数对方差的影响
【考点六】总体百分位数的估计
【考点十二】用方差、标准差说明数据的波动程度
【考点一】随机数表法
1.(24-25高一下·新疆乌鲁木齐·期末)某班有56名学生,从中选出5名同学.把56名同学进行编号,分别为.现利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第7列和第8列数字开始由左向右依次选取两个数字(作为个体的编号),如果选取的两个数字不在总体内,则将它去掉,继续向右选取两个数字,则选出来的第4个个体的编号为( )
32
45
66
67
14
64
05
71
95
86
11
05
65
09
68
76
83
20
37
90
57
16
00
11
66
14
90
84
45
11
75
73
88
05
90
52
27
41
14
86
A.09 B.20 C.37 D.05
【答案】A
【分析】由随机数表抽样方式可得.
【详解】从随机数表第1行的第7列和第8列数字是67无效,后面依次为14,05,11,09,
所以第4个为09.
故选:A.
2.(24-25高一上·江西抚州·期末)2024年10月1日是中华人民共和国建国75周年,为弘扬爱国主义精神,共同感受党的伟大历程,抚州市第一中学高一年级决定从每班随机抽取5名学生参加“祖国在我心”知识竞答.若高一某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第1行第5列的数开始,每次从左向右选取两个数字,则选取的第四个编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.14 B.02 C.43 D.07
【答案】D
【分析】利用随机数表法列举出前四名学生的编号,可得结果.
【详解】由随机数表法可知,前四名学生的编号依次为:、、、,
因此,选取的第四个编号为.
故选:D.
3.(24-25高一上·河南南阳·期末)福利彩票“双色球”中红色球的号码由编号01,02,…,33的33个数字组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表(如下表)第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第3个红色球的编号为( )
49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
A.23 B.09 C.20 D.17
【答案】B
【分析】利用随机数表进行抽样的具体步骤超出的不选,但没有重复和不足的,依次抽样得出编号.
【详解】左到右依次选取两个数字,依次选取为:21,32,09,
故选:B.
4.(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
【答案】D
【分析】根据随机数表法的应用,按照已知的要求选出五个三个数字组成编号即可.
【详解】依题意从第2行第7列开始的数为67(舍去),62(舍去),42(舍去),81(舍去),14,
57(舍去),20,42(舍去),53(舍去),32,37,32(舍去),14(舍去),16,
则满足条件的5个样本编号为14,20,32,37,16,则第5个编号为16.
故选:D
5.(23-24高一下·浙江宁波·期末)总体由编号为01, 02,,19,20的20个个体组成.利用下面的随机数表选取8个个体,选取方法是从随机数表第1行的第5列和第6列数字(即65)开始由左到右依次选取两个数字(作为个体的编号):如果选取的两个数字不在总体内,则将它去掉,继续向右选取两个数字,那么选出来的第6个个体的编号为________
7816 6527 0802 6314 0704 4369 9728 1198
3204 9234 4935 8200 3623 4869 6938 7481
【答案】11
【分析】按照随机数表根据规则要求依次选取即可求解.
【详解】按照规则要求,所选编号依次为:08,02,14,07,04,11,
所以第6个个体编号为:11.
故答案为:11.
【考点二】分层抽样的特征及适用条件
6.(24-25高一下·山东枣庄·期末)某中学有青年教师95人,中年教师65人,老年教师20人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.随机数法
C.分层随机抽样 D.简单随机抽样
【答案】C
【分析】根据样本的年龄特性确定抽样方法.
【详解】由于样本中年龄分为三个层次:老年,中年,青年,因此采取分层抽样方法.
故选:C.
7.(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【答案】B
【分析】由分层抽样的概念即可判断;
【详解】因为男、女生的阅读时间差异不大,而小学、初中、高中三个学段学生的课外阅读时间存在较大差异,故应按照学段分层随机抽样.
故选:B.
8.(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
【答案】D
【分析】按照分层抽样计数规则计算可得.
【详解】依题意高一年级应抽取的人数为人.
故选:D.
9.(多选)(23-24高一下·内蒙古鄂尔多斯·期末)下列说法中正确的有( )
A.总体的个体数不多且差异程度较小时宜用简单随机抽样法
B.百货商场的抽奖活动是抽签法
C.在总体分层抽样后的各层进行抽样时,可采用简单随机抽样
D.在整个抽样过程中,每个个体被抽取的机率不一样
【答案】ABC
【分析】由抽样的定义逐项判断即可得解.
【详解】总体的个体数不多且差异程度较小时,简单随机抽样法可以保证每个个体被抽取机会均等,
所以宜用简单随机抽样法,故A正确;
百货商场的抽奖活动是将所有参与抽奖的人或号码等作为总体,
通过抽签的方式确定中奖者,符合抽签法的特点,是抽签法,故B正确;
在总体分层抽样后的各层进行抽样时,可采用简单随机抽样,故C正确;
在整个抽样过程中,每个个体被抽取的机率相等,故D不正确.
故选:ABC.
10.某校高二年级有1500名学生,为了解学生的学习状况,对学生按首选物理和历史采用分层抽样的办法进行抽样调查,抽取了一个容量为120的样本,样本中80人首选物理,则该年级首选历史的学生有______人.
【答案】500
【分析】根据分层抽样的定义进行求解.
【详解】解:根据题意抽取的120人中有人选历史.
设该年级首选历史的学生有人,则,解得.
故答案为:500
【考点三】抽样比、样本总量、各层总数、总体容量的计算
11.(25-26高一上·辽宁辽阳·期末)某中学学生可通过选课平台选择校本课程《能源材料与节能环保》《我们的汉字》《网球运动基础探秘》《软笔书法临习与创作》,若只统计选择其中一门课程的人数,则选择这四门校本课程的人数分别为1200,1600,800,1200.根据所选课程采用按比例分层随机抽样的方法,从这些学生中随机抽取24名学生进行座谈,则应从选择《我们的汉字》的学生中抽取的人数为( )
A.6 B.8 C.12 D.9
【答案】B
【分析】先求出选择《我们的汉字》的学生人数占总人数的比例,然后再求出应从选择《我们的汉字》的学生中抽取的人数.
【详解】根据题意可得选择《我们的汉字》的学生人数占总人数的,
所以应从选择《我们的汉字》的学生中抽取的人数为.
故选:B.
12.(24-25高一下·新疆哈密·期末)某校高一、高二、高三年级的学生人数之比为,现用分层随机抽样的方法从该校三个年级的学生中抽取容量为300的样本,则从高二年级抽取的学生人数为( )
A.60 B.90 C.120 D.150
【答案】B
【分析】先求出高二学生的占样本的抽样比,再乘以即可.
【详解】由题意:从高二年级抽取的学生人数为:.
故选:B
13.(多选)(24-25高一下·贵州黔南·期末)某高校大一新生中,来自东部地区的学生有2500人、中部地区的学生有1500人、西部地区的学生有1000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列说法正确的有( )
A.用简单随机抽样的方法从新生中选出100人最适合
B.用分层随机抽样的方法从新生中选出100人最适合,且用分层随机抽样的方法分别抽取东部地区学生50人、中部地区学生30人、西部地区学生20人
C.用分层随机抽样的方法抽取的100名学生中,西部地区学生小刘被选中的可能性比中部地区学生小张被选中的可能性大
D.总体是该高校全体大一新生
【答案】BD
【分析】由分层抽样的性质结合题意逐一判断可得.
【详解】因为各部地区的饮食习惯各不相同,差异较大,所以用分层抽样更合适,
又各地区人数比为,若抽取人数为100人,
则取东部地区学生50人、中部地区学生30人、西部地区学生20人,故A错误,B正确;
采取分层抽样,每个学生被抽取的可能性均为,各地区学生被选中的可能性大小是相等的,故C错误;
事件的总体为该高校全体大一新生,故D正确.
故选:BD.
14.(24-25高一下·福建漳州·期末)某工厂生产三种不同型号的产品,数量之比为,现采用分层抽样的方法抽取个产品进行分析,则型号产品被抽取的数量等于______.
【答案】
【分析】根据分层抽样的计算公式求解即可.
【详解】由题意,抽取型号商品的数量为:.
故答案为:
15.(23-24高一下·河南商丘·期末)某市半程马拉松比赛需要学生志愿者若干名,其中某路段从某校高一年级1000人中按男、女采用比例分配的分层随机抽样抽取一个容量为50的样本,且样本中男生人数比女生人数多20人,则这1000人中女生有______人.
【答案】300
【分析】根据比例分配的分层随机抽样可得答案.
【详解】设样本中男生为x人,则女生为人,
所以,解得,设总体中女生人数为n,
则,解得.
故答案为:300.
【考点四】由频率分布直方图计算频率、频数、样本容量、总体容量
16.(23-24高一下·湖南邵阳·期末)某校高一年级有800名学生选学物理,将某次联考的物理成绩绘制成的频率分布直方图如图所示,则高一年级这次联考的物理成绩位于区间的人数约为( )
A.200 B.220 C.240 D.260
【答案】C
【分析】根据频率和为可构造方程求得的值,再由频率分布直方图可求得成绩落在的频率,由样本估计总体可计算得到结果.
【详解】,
成绩落在的频率为,则成绩位于区间的人数约为(人).
故选:C.
17.(23-24高一下·山西大同·期末)某部门为了了解一批树苗的生长情况,在4000棵树苗中随机抽取400棵,统计这400棵树苗的高度(单位:),将所得数据分成7组:,,,,,,,并绘制了如图所示的频率分布直方图,那么根据该图可推测,在这4000棵树苗中高度小于的树苗棵数约是( )
A.1680 B.1760 C.1840 D.1920
【答案】B
【分析】求出树苗中高度小于的频率,然后根据频数=样本容量×频率可求出结果.
【详解】由频率分布直方图可得,小于的树苗的频率,
所以可推测,4000棵树苗中高度小于的树苗棵数约为.
故选:B.
18.(多选)(23-24高一下·湖北·期末)武汉某中学为了加强食堂用餐质量,该校随机调查了100名学生,根据这100名学生对食堂用餐质量给出的评分数据,分成,,,,五组,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.
B.该样本数据的中位数和众数均为85
C.若样本数据的平均数低于85分,则认为食堂需要整改,根据此样本我们认为该校食堂需要整改
D.为了解评分较低的原因,该校从评分低于80分的学生中用分层抽样的方法随机抽取18人座谈,则应选取评分在的学生4人
【答案】AC
【分析】根据频率分布直方图估算中位数,众数和平均数等.
【详解】由直方图可知:,解得,故A正确;
设样本数据的中位数为,则,解得,故B错误;
平均数,故C正确;
,,分别有(人),(人),(人),根据分层抽样的原理,从组抽取的人数为(人),故D错误.
故选:AC
19.如图是一组数据的频率分布直方图,分段区间分别是,则__________.
【答案】/
【分析】根据频率和为列式求解.
【详解】根据题意得,,
解得.
故答案为:
20.(24-25高一下·贵州铜仁·期末)某校高一年级有学生2000名,为了了解高一学生的体能情况,随机抽取部分学生进行1分钟跳绳测试,将所得数据整理后,按,分为5组,画出频率分布直方图,如图所示.
(1)求的值;
(2)若规定:高一学生1分钟跳绳125次以上(含125次)成绩为良好.试估计该校高一学生1分钟跳绳成绩良好的人数.
【答案】(1)
(2)
【分析】(1)在频率分布直方图中,所有条形图的面积之和为,列式可求得实数的值;
(2)根据频率分布直方图求出跳绳良好的频率,即可得解.
【详解】(1)在频率分布直方图中,所有条形图的面积之和为,
可得,解得.
(2)可知高一学生1分钟跳绳成绩良好包括两组,
故高一学生1分钟跳绳成绩良好的频率为,
因此该校高一学生1分钟跳绳成绩良好的人数约为(人).
【考点五】频率分布直方图的实际应用
21.(24-25高一下·广东广州·期末)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当时,求与;
(2)设函数,当时,求的解析式,并求在区间上的最小值.
【答案】(1),;
(2),0.02.
【分析】(1)根据题意,由第一个图求出的矩形面积,再根据第二个图求出的矩形面积即可解出.
(2)根据题意,确定分段点100,即可得出的解析式,再根据分段函数的最值求法即可解出.
【详解】(1)
依题意得:
,
.
(2)当时,
,
当时,;
当时,
,
当时,,此时,
所以,在区间上的最小值为0.02.
22.(23-24高一下·四川自贡·期末)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民用水标准(单位:),月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解全市居民用水量分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:),将数据按照分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中的值;若该市有200万居民,估计全市居民中月均用水量不低于的人数;
(2)若该市政府希望使的居民每月的用水量不超过标准,估计的值.
【答案】(1);24万
(2)
【分析】(1)根据频率和为1求的值;进而求用水量不低于的频率和人数;
(2)分析可知,列式求解即可.
【详解】(1)由题意可知:每组的频率依次为,
则,解得;
因为全市居民中月均用水量不低于的频率为,
所以估计全市居民中月均用水量不低于的人数为万.
(2)因为,,
可知,则,解得.
23.(23-24高一下·湖北武汉·期末)现随机抽取1000名A校学生和1000名B校学生参加一场知识问答竞赛,得到的竞赛成绩全部位于区间中,现分别对两校学生的成绩作统计分析:对A校学生的成绩经分析后发现,可将其分成组距为10,组数为6,作频率分布直方图,且频率分布直方图中的Y()满足函数关系(n为组数序号,),关于B校学生成绩的频率分布直方图如图所示,假定每组组内数据都是均匀分布的.
(1)求k的值;
(2)若B校准备给前50名的学生奖励,应该奖励多少分以上的学生?
(3)现在设置一个标准t来判定某一学生是属于A校还是B校,将成绩小于t的学生判为B校,大于t的学生判为A校,将A校学生误判为B校学生的概率称为误判率A,将B校学生误判为A校学生的概率称为误判率B,误判率A与误判率B之和称作总误判率.若,求总误判率的最小值,以及此时t的值.
【答案】(1);
(2)奖励72分以上的学生;
(3)总误判率最小为,
【分析】(1)利用之和为0.1,列方程求参数即可;
(2)根据频率分布直方图可知所求的分数应该在;列出方程求解即可.
(3)讨论、分别写出对应总误判率为、 ,根据单调性确定最小值及其对应值.
【详解】(1)由频率之和为1,故之和为0.1,,解得;
(2)根据B校学生成绩的频率分布直方图,设所求的分数为,
则,解得,所以应该奖励分以上的学生;
(3)设总误判率为,又,则时,,
时,,
由的单调性知,当,最小,此时,所以总误判率最小为,此时.
24.我国是世界上严重缺水的国家,城市缺水问题较为突出.某市为了制定合理的节水方案,需要了解全市居民用水量分布情况.通过抽样,获得了位居民某年的月均用水量(单位:t),将数据按照,,,分成9组,制成了如图所示的频率分布直方图,若已知样本数据落在区间的频数为20.
(1)求样本容量和频率分布直方图中的值;
(2)用样本频率估计总体,若该市有60万居民,市政府希望使51万的居民每月的用水量不超过标准,试估计的值,并说明理由.
【答案】(1)
(2),理由见解析
【分析】(1)由频率分布直方图的性质,列出方程求得,结合题意,进而求得样本容量;
(2)解法1:根据频率分布直方图,求得前5组和前6组的频率,得到,结合题意,列出方程,即可求解;
解法2:根据题意,得出 ,即可求解;
解法3:根据频率分布直方图,求得前5组和前6组的频率,得到85%分位数位于区间,结合百分位数的计算方法,即可求解.
【详解】(1)解:由频率分布直方图的性质,可得:,解得,
因为样本数据落在的频数为,所以样本容量为.
(2)解法1:因为60万居民中有51万不超过标准,即有85%的居民的用水量不超过标准.
由样本数据得,前6组的频率之和为,
前5组的频率之和为,
可得,
又由,解得.
因此,由样本估计总体,估计月用水量标准为2.9t时,约有51万的居民每月的用水量不超过标准.
解法2:因为60万居民中有51万不超过标准,即有85%的居民的用水量不超过标准.
根据题意,可得,
解得,
因此,由样本估计总体,估计月用水量标准为2.9t时,约有51万的居民每月的用水量不超过标准.
解法3:因为60万居民中有51万不超过标准,即有85%的居民的用水量不超过标准.
由样本数据得,前6组的频率之和为,
前5组的频率之和为,
因此,85%分位数一定位于区间,
,可以估计85%分位数约为,
因此,由样本估计总体,估计月用水量标准为2.9t时,约有51万的居民每月的用水量不超过标准.
25.(22-23高一下·河南·期末)后疫情时代,为了可持续发展,提高人民幸福指数,国家先后出台了多项减税增效政策.某地区对在职员工进行了个人所得税的调查,经过分层随机抽样,获得2000位在职员工的个人所得税(单位:百元)数据,按,,,,,,,,分成九组,制成如图所示的频率分布直方图:
(1)求直方图中t的值:
(2)根据频率分布直方图估计该市的70%职工年个人所得税不超过m(百元),求m的最小值;
(3)已知该地区有20万在职员工,规定:每位在职员工年个人所得税不超过5000元的正常收取,若超过5000元,则超出的部分退税20%,请估计该地区退税总数约为多少.
【答案】(1)
(2)
(3)
【分析】(1)根据频率和为1计算得到答案.
(2)根据前5组的频率之和与前4组的频率之和得到,根据比例关系解得答案.
(3)各区间分别超出元,计算平均值得到答案.
【详解】(1),解得.
(2)前5组的频率之和为:;
前4组的频率之和为:;
故,,解得.
(3)区间在,,,内的个人所得税分别取作为代表.
则分别超出元,
则退税总数约为:
【考点六】总体百分位数的估计
26.(25-26高一上·江西九江·期末)某校高三年级共有名学生参加数学测验,已知所有学生成绩的第百分位数是分,则数学成绩不低于分的人数大约为( )
A.200 B.300 C.1200 D.1300
【答案】B
【分析】根据百分位数的定义求小于或等于分的人数,再用总人数减去小于或等于分的人数即可.
【详解】因为所有学生成绩的第百分位数是分 ,
所以小于或等于分的学生约有人,
则数学成绩不低于分的学生大约有人,
故选:B.
27.(25-26高一上·辽宁辽阳·期末)若某省2017年至2024年人均生产总值增速分别为4.49%,6.03%,5.87%,1.06%,6.40%,2.80%,5.90%,5.60%,则该组数据的60%分位数为( )
A.5.735% B.5.60% C.5.87% D.5.90%
【答案】C
【分析】将给定数据组由小到大排列,利用百分位数的步骤即可求出第60百分位数.
【详解】将该组数据从小到大排列为1.06%,2.80%,4.49%,5.60%,5.87%,5.90%,6.03%,6.40%,
由8×60%=4.8,得该组数据的60%分位数为第5个数据,即5.87%.
故选:C.
28.(25-26高一上·全国·期末)样本数据5,5,6,7,9的80百分位数为___________
【答案】8
【分析】根据百分位数的定义计算即得.
【详解】因为,
故数据5,5,6,7,9的80百分位数应是第4个数与第5个数的平均数,
即.
故答案为:8.
29.(24-25高一下·湖南岳阳·期末)某科技攻关青年团队共有8人,他们的年龄分别是29,35,40,36,38,34,32,41,则这8人年龄的25%分位数是_______.
【答案】33
【分析】将他们的年龄从小到大排序,根据百分位数的定义即可求得.
【详解】将他们的年龄从小到大排序为:29,32,34,35,36,38,40,41.
因,故这8人年龄的25%分位数是.
故答案为:33.
30.(24-25高一下·广东佛山·期末)某商场停车收费标准如下:停车时间在1小时内(含1小时)免费,超过1小时的部分,每小时收费4元(不足1小时的部分按1小时算,如停车时长为2.5小时,则按3小时计算,收费8元),一天之内封顶24元.为了解该商场停车情况,通过抽样,获得了100辆车一天内的停车时长(单位:小时),将数据按照,,,分成9.组,制成了如图所示的频率分布直方图.
(1)估计停车费为24元的频率;
(2)估计停车时长的第85百分位数;
(3)假设这个商场节假日一天有800辆车进入车场停车,估计该商场节假日一天的停车费收入.
【答案】(1)0.1
(2)5.5小时
(3)8480元
【分析】(1)先分析出超过6小时收费就是24元,然后再由直方图计算超过6小时的频率即可;
(2)通过计算先确定估计停车时长的第85百分位数所在的区间,再根据求百分位数的公式计算即可;
(3)先分别求出停车时长在各个时间段的车辆的数量,再对应的求出其费用,再求和即可.
【详解】(1)因为停车时间在1小时内(含1小时)免费,超过1小时的部分,每小时收费4元,
所以停车时间为小时,收费元,超过6小时收费就是24元,
所以由直方图可知超过6小时的频率为,
所以估计停车费为24元的频率为0.1;
(2)停车时间为的频率为,
停车时间为的频率为,
所以估计停车时长的第85百分位数位于区间内,
因为,
所以估计停车时长的第85百分位数为5.5小时;
(3)假设这个商场节假日一天有800辆车进入车场停车,
则停车时长为的估计有辆,收费0元;
停车时长为的估计有辆,收费元;
停车时长为的估计有辆,收费元;
停车时长为的估计有辆,收费元;
停车时长为的估计有辆,收费元;
停车时长为的估计有辆,收费元;
停车时长为的估计有辆,收费元;
估计该商场节假日一天的停车费收入为
元.
【考点七】计算几个数的众数、中位数、平均数
31.(24-25高一下·河北邯郸·期末)已知高一三班的某次数学测试中,某学习小组的成绩如下:70,75,94,85,85,90,86,90,85,100,则该小组成绩的平均数、众数、中位数的大小关系是( )
A.众数=中位数<平均数 B.众数<中位数<平均数
C.众数<平均数<中位数 D.众数=平均数<中位数
【答案】B
【分析】根据众数、中位数、平均数的概念,求出相应的这三个数,比较大小,即得答案.
【详解】学习小组的成绩从小到大排列如下:70,75,85,85,85,86,90,90,94,100,
众数为85;中位数为,
平均数为,
故众数<中位数<平均数,
故选:B
32.(24-25高一下·安徽·期末)某项比赛共有7个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是( )
A.极差 B.45%分位数 C.平均数 D.众数
【答案】B
【分析】根据极差、百分位数、平均数以及众数的含义逐一判断即可.
【详解】不妨设原始数据为:,
原始数据的极差为:,平均数为,众数为,
去掉一个最高分与一个最低分后剩下数据为:,
剩下数据的极差为:,平均数为,众数为和3,
由此可知,与原始数据相比,剩下数据的极差,平均数,众数可能发生改变,故A,C,D错误,
对于B项,假设这7个数据从小到大为,
去掉一个最高分与一个最低分后剩下数据为:,
因为,,
所以原始数据的分位数为第四个数,即,剩下的数据的分位数为第3个数,即
所以与原始数据相比,剩下数据的分位数不变,故B正确;
故选:B.
33.(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是( )
A.86,84 B.84.5,85 C.85,84 D.86.5,84
【答案】D
【分析】根据平均数和众数的概念求解.
【详解】将样本数据按升序排列为79,84,84,84,86,87,93,95,可得平均数,
因为84出现了三次,且次数最多,所以众数为84.
故选:D
34.(多选)(24-25高一下·云南昭通·期末)四名同学各掷骰子5次,分别记录每次骰子出现的点数,根据四名同学的统计结果,可能出现点数6的是( )
A.第25百分位数为3,众数为5 B.平均数为2,方差为3
C.中位数为3,方差为2.8 D.平均数为3,中位数为4
【答案】AC
【分析】根据题意,结合百分位数,众数、平均数和方差的概念与计算公式,逐项分析判断,即可求解.
【详解】对于A中,若抛掷骰子所得的点数为,
由,其第25百分位数为,众数为,满足题意,所以A正确;
对于B中,若平均数为2,且出现6点,则方差,
故平均数为2,方差为3时,一定没有出现点数6,所以B错误;
对于C中,当投掷骰子出现结果为时,满足中位数为3,
平均数为:,
方差为,
可以出现点数6,所以C正确;
对于D中,因为平均数为3,所以5个数总和为15,若要出现6,且中位数为4,
则剩余三个数之和为5,则剩余三个数都比4小,那么中位数不可能是4,矛盾,所以D错误.
故选:AC.
35.(24-25高一下·陕西西安·期末)某篮球兴趣小组有7名学生参加投篮比赛,每人投10个,投中的个数分别为:8、5、7、5、8、6、8,则这组数据的众数与中位数之和为___________.
【答案】15
【分析】将个数按照从小到大的顺序排列,找出中位数和众数即可.
【详解】将个数按照从小到大的顺序排列,5、5、6、7、8、8、8,
这组数据的众数是8,中位数是7,这组数据的众数与中位数之和为.
故答案为:15.
【考点八】根据众数、平均数求参数
36.(23-24高一下·广西南宁·期末)高二(1)班有40名学生,其中男生有16名,已知男生平均体重为68.4kg,总平均体重为60.1kg,则女生的平均体重约为( )
A.55.8kg B.54.6kg C.52.4kg D.51.8kg
【答案】B
【分析】设女生的平均体重为,根据平均数的计算公式列式求解即可.
【详解】由题意可知:高二(1)班有24名女生,有16名男生,
设女生的平均体重为,则,解得.
故选:B.
37.(24-25高一下·陕西汉中·期末)某校举办“迎七一”红歌比赛,五位评委给某参赛班级的评分分别为87,87,89,m,90,若这组数据的平均数为88,则这组数据的中位数为( )
A.88 B.87 C.89 D.90
【答案】B
【分析】根据给定的平均数求出m,再利用中位数的定义计算作答.
【详解】依题意,,解得,
参赛班级所得分从小到大依次为:87,87,87,89,90,
所以这组数据的中位数为87.
故选:B.
38.(24-25高一上·辽宁沈阳·期末)已知一组数据丢失了其中一个,剩下的六个数据分别是、、、、、,若这组数据的平均数与众数的和是中位数的倍,则丢失数据的所有可能值构成的集合为______.
【答案】
【分析】设丢失的数据为,对的取值进行分类讨论,求出这七个数的平均数、众数和中位数,根据题意可得出关于的方程,解之即可.
【详解】设丢失的数据为,则这七个数的平均数为,众数为,
因为这组数据的平均数与众数的和是中位数的倍,分以下几种情况讨论:
若,则中位数为,此时,,解得;
若,则中位数为,此时,,解得;
若,则中位数为,此时,,解得.
综上可知,丢失数据所有可能取值构成的集合为.
故答案为:.
39.已知是1,2,3,,5,6,7这7个数据的中位数,且1,2,,这四个数据的平均数为1,则的最小值为______.
【答案】/
【分析】根据x是1,2,3,x,5,6,7这七个数据的中位数,得到x的取值范围,根据1,2,x2,﹣y这四个数据的平均数为1,得到x,y之间的关系,把要求的代数式换元变化为一个自变量的形式,得到一个递增的代数式,把x的最小值代入得到结果.
【详解】∵x是1,2,3,x,5,6,7这七个数据的中位数,∴,
∵1,2,x2,﹣y这四个数据的平均数为1,
∴,∴
∵中,在时,递增,也是一个递增函数,
∴函数是一个增函数,
∴的最小值为,
故答案为:.
40.为响应国家“学习强国”的号召,培养同学们的“社会主义核心价值观”,某校团委组织学生参加知识竞赛,以下数据为该校参加竞赛的10名同学的成绩:91,93,93,94,a,97,a,98,a,99.若这组数据的平均数为95,则这10名同学成绩的第80百分位数是______.
【答案】
【分析】根据给定的平均数求出a,再利用第80百分位数的意义求解作答.
【详解】依题意,,解得,
这10名同学的成绩从小到大依次为:91,93,93,94,95,95,95,97,98,99,因,
所以这10名同学成绩的第80百分位数是 .
故答案为:
【考点九】由频率分布直方图估计中位数、平均数
41.(24-25高一下·广东汕头·期末)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了减少水资源的浪费,通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t),画出如图所示的频率分布直方图,则下列说法错误的是( )
+
A.可以估计该市月均用水量在区间内的居民用户最多
B.可以估计随着月均用水量的增加,该市居民用户数呈现降低趋势
C.可以估计该市月均用水量的平均数小于中位数
D.可以估计该市居民月均用水量的分位数为14.2
【答案】C
【分析】根据众数、平均数、中位数、百分位数的定义逐一判断.
【详解】由众数的定义可知,100户居民月均用水量在区间内的居民用户最多,再由样本估计总体可知,A正确;
由图可知,随着月均用水量的增加,高度呈现降低的趋势,故B正确;
平均数为
,
因为,,则中位数在第二组内,
设中位数为,则,得,
故可以估计该市月均用水量的平均数大于中位数,故C错误;
因为,,
则分位数在第五组内,
设该市居民月均用水量的分位数为,则,
得,故D正确.
故选:C
42.(24-25高一下·浙江宁波·期末)学校为了解全校1800名学生的身体肥胖情况,随机抽取了100名学生的体检数据,将其BMI值分成以下五组:,,,,,得到相应的频率分布直方图,如图所示.则下列说法错误的是( )
A.
B.估计样本的中位数为23
C.估计样本的众数为22
D.估计全校学生BMI值落在区间的人数为36人
【答案】D
【分析】对A,根据频率和为1求解即可;对B,根据成绩低于中位数的频率为0.5计算即可;对C,根据频率分布直方图的众数判断即可;对D,计算区间的频率,进而可得人数.
【详解】对A,由题意,,解得,故A正确;
对B,区间的频率分别为,
因为,,故中位数位于内.
设中位数为,则,解得,故B正确;
对C,由直方图可得估计这组数据的众数为,故C正确;
对D,由直方图可得的频率为,
故估计全校学生BMI值落在区间的人数为,故D错误.
故选:D
43.(多选)(25-26高一上·江西上饶·期末)上饶市某学校从高一的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和之间,将测量结果按如下方式分成八组:第一组,第二组,⋯,第八组.下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.以下说法正确的是( )
A.第二组的频率为0.016
B.第七组的频率为0.06
C.估计该校高一800名男生的身高的中位数约为
D.估计该校高一800名男生的身高的平均数约为
【答案】BCD
【分析】对于AB,由频率分布直方图矩形面积为1即可求得各组的频率,对于C,先确定中位数所在组,再用中位数计算方法即可求解,对于D,将各组中点值乘以频率后相加即可得到平均数.
【详解】对于A,第二组的频率为,故A错误;
对于B,由题意得第六组人数为4人,则有第六组的频率为,纵坐标为0.016,
所以第七组的满足,故B正确;
对于C,由直方图得,身高在第一组的频率为,
身高在第二组的频率为,
身高在第三组的频率为,
身高在第四组的频率为,
由于,,
设这所学校高一800名男生的身高中位数为,则,
则有,解得,故C正确;
对于D,设这所学校高一800名男生的身高平均数为,
身高在第五组的频率为,
身高在第六组的频率为,
身高在第七组的频率为,
身高在第八组的频率为,
则有,
故D正确.
故选:BCD.
44.(23-24高一下·云南大理·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的中位数、平均数和众数,则的大小关系为__________.
【答案】
【分析】利用数据往右拖尾,即平均数大于中位数,再利用众数是用最高矩形的中点值来估计,可以判断众数小于中位数,这样即可作出判断.
【详解】根据直方图矩形高低以及数据的分布趋势判断,可得出结论:众数是最高矩形的中点横坐标,因此众数在第二列的中点处.
因为直方图第一、二、三、四列高矩形较多,且在右边拖尾低矩形有三列,所以中位数大于众数,
右边拖尾的有三列,所以平均数大于中位数,因此有.
故答案为:.
45.(25-26高一上·陕西渭南·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数、中位数和平均数;
【答案】(1),第75百分位数是84
(2)样本成绩的众数、中位数和平均数分别约为,75,74
【分析】(1)根据频率分布直方图中所有矩形的面积和为1列方程可求得的值,根据百分位数的定义可求解第75百分位数;(2)频率分布直方图中,众数的估计值是最高矩形对应区间的中间值,中位数的估计值左右两边矩形面积和均为,平均数的估计值是每组的组中值乘以该组的频率之和.
【详解】(1)因为频率分布直方图中所有矩形的面积和为1,
所以,解得.
样本成绩在内的频率为,在内的频率为,
所以第75百分位数,所以,解得,即样本成绩的第75百分位数是84.
(2)因为最高矩形对应的区间为,所以样本成绩的众数约为;
由(1)知样本成绩在内的频率为,而成绩在内的频率为,
所以中位数,所以,解得,即样本成绩的中位数约为;
由得样本成绩的平均数约为74.
【考点十】计算几个数据的极差、方差、标准差
46.(24-25高一下·河北雄安·期末)已知,,的平均数与方差均为3,则,,的平均数为( )
A.9 B.12 C.15 D.20
【答案】B
【分析】由方差公式,代入即可求解.
【详解】,
所以,即,,的平均数为12.
故选:B.
47.(25-26高一上·甘肃庆阳·期末)从某款苹果礼盒中随机抽取5个苹果,测得这5个苹果的果径(单位:)分别为74,75,75,75,76.这5个苹果中,果径在以平均数为中心,1倍标准差范围内的有( )
A.5个 B.4个 C.3个 D.0个
【答案】C
【分析】利用标准差的计算公式可得答案.
【详解】这5个苹果的果径的平均数,
方差,
标准差.果径在以平均数为中心,1倍标准差范围内,
即在内的苹果有3个.
故选:C
48.(24-25高一下·福建福州·期末)样本数据3,5,8,2,4,2的方差是___________ ;
【答案】/
【分析】先计算出平均数后再计算方差即可得.
【详解】,
.
故答案为:.
49.(24-25高一下·内蒙古包头·期末)在某次测验中,有6位同学的平均成绩为75分,且前5位同学的成绩分别是70,76,72,70,72.则这6位同学成绩的标准差________.
【答案】7
【分析】先根据平均数计算第6位同学的成绩再根据方差公式计算求解即可.
【详解】前5位同学的成绩分别是70,76,72,70,72,6位同学的平均成绩为75分,设第6位学生分数为,
所以,所以,
所以方差为,
所以标准差为.
故答案为:7.
50.(25-26高一上·山西忻州·期末)某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了100名学生的成绩作为样本进行统计,将其成绩(满分:100分)分成,,…,六组,得到如图所示频率分布直方图.
(1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若根据这次成绩,学校准备给成绩较高的前20%的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数;
(3)若落在中的样本数据的平均数是54,方差是6,落在中的样本数据的平均数是66,方差是3,求这两组数据的总平均数和方差.
【答案】(1),平均数74;
(2)86;
(3),.
【分析】(1)利用频率分布直方图各小矩形面积和为1求的值;用该组区间的中点值代表同组数据计算样本数据的平均数.
(2)利用频率分布直方图估计第分位数即可.
(3)利用分层抽样的平均数公式、方差公式分别求出和.
【详解】(1)由频率分布直方图,得,解得;
平均数为.
(2)设“获得该荣誉证书的最低分数”为,由分数介于的频率为、
分数介于的频率为,得获得该荣誉证书的最低分数介于之间,
则有,解得,所以获得该荣誉证书的最低分数为86.
(3)由落在中的样本数据的平均数是54,方差是6,落在中的样本数据的平均数是66,方差是3,
所以这两组数据的总平均数为,
方差为.
【考点十一】各数据同时加减、乘除同一数对方差的影响
51.(24-25高一下·山东烟台·期末)若数据,,,的方差为,则数据,,,的方差为( )
A. B. C. D.
【答案】C
【分析】根据方差的计算公式直接计算.
【详解】设数据,,,的平均数为,
则方差,
即;
则数据,,,的平均数为,
则方差,
故选:C.
52.(24-25高一下·四川广元·期末)有一组样本数据,,…,,其平均数和方差分别为,.由这组数据得到一组新样本数据,,…,.其中,其平均数和方差分别为,,则( )
A. B.
C. D.
【答案】B
【分析】根据已知条件,结合平均数和方差的公式,即可求解.
【详解】因,可得,,
故B正确,A,C,D均错误.
故选:B.
53.(多选)(25-26高一上·贵州遵义·期末)某学校高一年级随机抽取了10名学生的数学周测成绩(满分150分),记录如下:.下列说法正确的是( )
A.这组数据的极差是34.5,中位数是129.75,
B.这组数据的众数为127.5,其频率是0.3
C.去掉一个最高分和一个最低分后,剩下数据的标准差比原始数据的标准差小
D.如果每个学生的成绩都增加7.5分,则新数据的中位数、众数均增加7.5分,而方差保持不变
【答案】BCD
【分析】将记录数据从小到大排列,分别求其极差和中位数,可判断A;求其众数,并计算其频率可判断B;分析去掉一个最高分和一个最低分前后两组数据的离散程度,判断C;根据增加相同数之后的数据特征,可判断D.
【详解】将所记录数据“”按从小到大的顺序排列可得:.
所以这组数据的极差为,中位数是,所以A错误;
这组数据的众数是,其频率为,所以B正确;
这组数据的平均数是,去掉一个最高分和一个最低分后,剩下数据的更向平均数集中,所以标准差比原始数据的标准差要小,所以C正确;
每个学生的成绩都增加分后,排列顺序不变,中位数变为,众数变为;因为平均数也增加,所以每个数据与平均数的差不变,所以方差保持不变,所以D正确.
故选:BCD.
54.(23-24高一下·陕西宝鸡·期末)若一组样本数据,,,的标准差为4,则数据,,,的标准差为______.
【答案】8
【分析】根据标准差和方差之间的关系先求出对应的方差,然后结合变量之间的方差关系进行求解即可.
【详解】
样本数据 ,,,的标准差为4,
样本数据 ,,,的方差为16,
数据,,,的方差为,
所以数据 ,,,的标准差为8,
故答案为:8
55.(23-24高一下·安徽六安·期末)若一组数据的方差为1,则数据的标准差为______.
【答案】2
【分析】根据方差的性质得到数据的方差为,进而得到标准差.
【详解】数据的方差为,
故数据的标准差为.
故答案为:2
【考点十二】用方差、标准差说明数据的波动程度
56.(24-25高一下·吉林·期末)下列叙述中,错误的是( )
A.样本数据的中位数可能不受少数几个极端值的影响
B.数据的标准差比较小时,数据比较分散
C.数据的极差反映了数据的集中程度
D.任何一个样本数据的改变都会引起平均数的改变
【答案】B
【分析】利用样本数字特征的基本概念逐项判断,可得出合适的选项.
【详解】对于A,样本数据的中位数可能不受少数几个极端值的影响,故A正确;
对于B,数据的标准差比较小时,数据比较集中,故B错误;
对于C,数据的极差反映了数据的集中程度,故C正确;
对于D,任何一个样本数据的改变都会引起平均数的改变,故D正确。
故选:B.
57.(24-25高一下·四川达州·期末)衡量数据离散程度还可以使用变异系数(标准差与平均数的比值,一般来说变异系数越大,其离散程度的测度值越大,反之越小).下表总结了标准差与变异系数的适用场景.某次考试后,甲班平均分80分,标准差9分;乙班平均分100分,标准差10分.则
场景
使用标准差
使用变异系数
数据单位相同,均值相近
直接比较绝对波动
不必要
数据单位不同
无法直接比较
消除单位差异,比较相对波动
均值差异大
可能误导
标准化后比较相对波动
A.甲班成绩相对更稳定 B.乙班成绩相对更稳定
C.甲、乙两班成绩一样稳定 D.不确定
【答案】B
【分析】根据变异系数的定义,分别求得甲乙两班的变异系数,即可得出判断.
【详解】由题可知,两班均值差异大,使用标准差可能误导,故使用变异系数,
甲班变异系数为,乙班变异系数为,
所以乙班成绩相对更稳定,
故选:B.
58.(多选)(25-26高一上·江西景德镇·期末)我校AB两班同时参加了一次数学阶段性测试,其中A班50人,B班40人,A班的平均成绩为116分,方差是360;B班的平均成绩是102.5分,方差是450.下列说法正确的是( )
A.A班最高分比班高
B.A班成绩比B班成绩更集中
C.AB两班全部人的平均成绩是110分
D.AB两班全部人的成绩方差是445
【答案】BCD
【分析】根据两班的平均数与方差的意义可直接判断A,B;利用平均数与方差公式计算可判断C,D两项.
【详解】对于A,因题干中没有提及班级的最高分情况,故无法判断A正确;
对于B,因A班成绩的方差360小于B班成绩的方差450,则成绩更集中,故B正确;
对于C,AB两班全部人的平均成绩为,故C正确;
对于D,AB两班全部人的成绩方差为
,故D正确.
故选:BCD.
59.(多选)(25-26高一上·江西南昌·期末)一体育比赛,7个评委打分,相对之前的分数,去掉一个最高分,去掉一个最低分后,下列说法正确的是( )
A.中位数一定不变 B.平均数一定不变
C.方差不变或变小 D.极差不变或变小
【答案】ACD
【分析】根据平均数、中位数、方差、极差定义理解及求法判断各项的正误.
【详解】设个原始分分数为,去掉一个最高分,去掉一个最低分后有效分为,
原始分的中位数为,有效分的中位数也为,故A正确,
原始分的平均数,有效分的平均数,
则,
又具体值不知,故平均数变化不确定,故B错误,
去掉一个最高分,去掉一个最低分后数据更加集中,数据的离散程度会减小,故方差变小,
当时,方差不变,故C正确,
原始分的极差,有效分的极差,,故极差变小或不变,故D正确.
故选:ACD.
60.将三组数据绘制成如下的折线图,则这三组数据中,______组数据的方差最小.
【答案】
【分析】根据折线图可计算得到三组数据平均数相同,根据数据波动程度可得到结论.
【详解】组数据的平均数均为,
组数据相对于平均数的波动程度最小,组数据的方差最小.
故答案为:.
1
学科网(北京)股份有限公司
$