摘要:
**基本信息**
聚焦统计核心题型,从抽样方法到数据特征,构建完整知识链,通过典型例题强化数据分析与应用能力。
**专项设计**
|模块|题量/典例|题型特征|知识逻辑|
|----|-----------|----------|----------|
|随机抽样|14题|含随机数法、简单随机抽样、分层抽样|从基础抽样方法到估计总体,层层递进|
|数据特征|28题|覆盖百分位数、平均数、方差计算与性质|从数据描述到特征分析,结合实际应用|
|统计图表|13题|涉及饼图、折线图、频率分布直方图|从图表识别到信息提取,培养数据观念|
|综合应用|27题|多知识点交叉,如分层抽样与方差结合|整合抽样、图表、特征,提升综合思维|
内容正文:
专题01 统计常考题型全归纳
目录
A题型建模・专项突破 1
题型一、随机数法 1
题型二、简单随机抽样估计总体及其概率问题 2
题型三、分层随机抽样(常考点) 4
题型四、分层随机抽样中的平均数和方差 6
题型五、各种类型统计图表 9
题型六、总体百分位数的估计 14
题型七、平均数、方差等数据特征的计算与性质(难点) 15
题型八、频率分布直方图中数据特征的计算与应用(重点) 19
B综合攻坚・能力跃升 24
题型一、随机数法
1.(25-26高一下·福建厦门·期中)总体由编号为01,02,03,…,49,50的50个个体组成,利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体.选取方法是从随机数表第1行的第9列数字开始由左向右读取,则选出来的第5个个体的编号为_____.
66 67 70 67 14 64 05 71 95 86 11 05 65 09 68 76 83 20 37 90
57 16 00 11 66 14 90 84 45 11 75 73 88 05 90 52 27 41 14 86
2.某校高一年级共有500名学生,学校计划用随机数法抽取30名学生参加一项问卷调查.将500名学生按的顺序进行编号,用下列随机数表进行抽取,从第2行第4个数字开始,按从左到右、从上到下的顺序读取,依次选取符合条件的编号,第2个被选中学生的编号为____________.
3.(25-26高一下·全国·单元测试)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样调查,先将650名学生进行编号:001,002,…,649,650.从中抽取50个样本,下面提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是______.
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 24
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
题型二、简单随机抽样估计总体及其概率问题
1.(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
2.从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
3.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
4.某校要从高一、高二、高三共2 019名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 019名学生中剔除19名,再从剩下的2 000名学生中按分层抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
5.统计学中,常以前个区间的平均长度估计所有区间的平均长度.某工厂生产的零件以个为一箱,成箱出售().每箱中的零件按照生产顺序,从1到连续编号.现从一箱中随机抽取6个零件,发现上面的编号从小到大依次为:12,15,33,38,55,60,则下列4个选项中,作为的估计值,最合适的一项是( )
A.61 B.70 C.98 D.120
6.(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
题型三、分层随机抽样(常考点)
1.(25-26高一下·宁夏银川·期中)高一某班有56名学生,其中男生24人,女生32人.按性别进行分层,用分层随机抽样的方法,从该班学生中抽取14人参加跳绳比赛,如果样本按比例分配,则应抽取的男生人数为( )
A.5 B.6 C.7 D.8
2.(25-26高一下·贵州遵义·期末)一支田径队有运动员84人,其中女运动员有48人,按性别进行分层,用分层随机抽样的方法从全体运动员中抽出一个容量为14的样本.如果样本按比例分配,那么应抽取的男运动员人数是( )
A.4 B.6 C.8 D.10
3.(24-25高一下·山东青岛·期末)某学校有男生2000名和女生1000名,为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法从该校学生中抽取一个容量为的样本,已知从男生中抽取100名学生,则为( )
A.150 B.200 C.250 D.300
4.(24-25高一下·福建厦门·期末)某企业生产甲、乙、丙三种不同型号的产品,产品数量之比依次为,现用按比例分配的分层随机抽样方法,抽取一个容量为的样本,样本中甲型号产品有10件,则的值为( )
A.20 B.30 C.50 D.100
5.(多选题)(24-25高一下·陕西商洛·期末)某学校调查学生对学校食堂意见情况,该学校分高一,高二,高三三个年级,统计可得这三个年级的人数比例为.现用分层随机抽样的方法从这些学生中抽取n名学生进行调研,若高一年级抽到80人,则( ).
A.高二年级抽到60人 B.高三年级抽到90人
C. D.抽取的高二与高三人数之和比高一多40人
6.(2025高一·全国·专题练习)为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中型血、型血、型血、型血的人数比为,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中型血的人数比型血的人数多,则_________.
题型四、分层随机抽样中的平均数和方差
1.树人中学国旗班共有50名学生,其中男女比例,平均身高174cm,用等比例分层随机抽样的方法,从中抽取一个容量为20的样本,若样本中男生的平均身高为178cm,样本中女生人数与女生平均身高的估计值分别为( )
A.8人 168cm B.8人 170cm C.12人 168cm D.12人 170cm
2.(24-25高一下·安徽·期末)某校高一年级“物理方向”有“物化生、物化地、物化政”三种常见的选科组合,选物化生、物化地、物化政的学生期中考试数学成绩的平均数分别为,若按不同选科组合的人数比例采用分层随机抽样的方法抽取一个容量为180的样本,抽到选物化生、物化地、物化政的学生人数分别为,则估计该校高一年级“物理方向”的学生期中考试数学成绩的平均数为( )
A.83 B.82 C.81 D.80
3.(25-26高一下·贵州遵义·月考)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
4.(23-24高一下·河南新乡·期末)在某次调查中,采用分层随机抽样的方法得到10个A类样本,30个B类样本.若A类样本的平均数为5.5,总体的平均数为4,则B类样本的平均数为______.
5.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,样本中有39名女员工,女员工的平均体重为50kg,标准差为6;有21名男员工,男员工的平均体重为70kg,标准差为4.则样本中所有员工的体重的方差为______.
6.(24-25高一下·安徽阜阳·月考)某学校有高中生600人,其中男生400人,女生200人.有人为了获得该校全体高中生的身高信息,采用分层随机抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为174,女生样本的均值为162.
(1)若男、女生样本量按比例分配,则总样本的均值为多少?
(2)若男、女生的样本量都是100,则总样本的均值为多少?它作为总体均值的估计合适吗?为什么?
题型五、各种类型统计图表
1.为弘扬中华优秀传统文化,济南市公开招募“泉润非遗”志愿者.现从所有报名的志愿者中,随机选取300人进行调查,其中青年人、中年人、老年人三个年龄段的比例饼状图如图1所示,各年龄段志愿者的性别百分比等高堆积条形图如图2所示,则下列关于样本数据的分析正确的是( )
A.老年男性志愿者人数为90
B.老年女性志愿者人数大于中年女性志愿者人数
C.青年女性志愿者人数为72
D.中年男性志愿者人数大于青年男性志愿者人数
2.国家能源集团研发的“擎源”大模型用于预测关键节点电价,研究人员利用模型对某节点连续8个小时的实际与预测电价数据进行记录,并利用上述数据绘制成实际值与预测值对比的折线图(两条折线):
观察图表与数据,下列结论不能直接从中得出的是( )
A.实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值
B.这8小时内,预测值与实际值的差异(两个值的差的绝对值)平均在10元/MWh左右
C.模型对所有“价格下跌时段”(如第5-6小时)的预测都出现了滞后性(即预测反应慢于实际变化)
D.模型的预测精度较高,趋势与实际基本一致,对电网调度有重要参考价值
3.(25-26高一下·甘肃酒泉·期中)随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从年月到该地旅游的游客中随机抽取部分游客进行调查,得到各年龄段游客的人数比例和各年龄段中自助游的比例,如图,则下列说法错误的是( )
A.若调查的游客中青年人有人,则一共调查了人
B.估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的
C.用分层随机抽样的方法对所调查游客进行抽样,若老年人有人,则中年人有人
D.估计年月到该地旅游且选择自助游的游客中青年人不超过一半
4.(多选题)三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标,其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等工业部门;第三产业则包括服务业、金融业、信息技术等现代经济部门.如图为我国2019—2023年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2019—2023年第二产业增加值占国内生产总值比重的平均数为37.66%
B.2019—2023年第一产业增加值占国内生产总值比重的中位数为7.2%
C.2019—2023年第三产业增加值占国内生产总值比重逐年递增
D.2019—2023年三次产业中增加值占国内生产总值比重极差最大的是第二产业
5.(多选题)(25-26高一下·全国·单元测试)某商场一年中各月份的收入,支出情况如图所示,下列说法中正确的是( )
A.支出最高值与支出最低值的比是
B.4至6月份的平均收入为50万元
C.利润最高的月份是2月份
D.2至3月份的收入的变化率与11至12月份的收入的变化率相同
6.(多选题)如图是某公司2020年和2024年支出的比例分配图,其中这两年用于文体活动的支出费用相等,则( )
A.2024年总支出比2020年增长
B.用于宣发的支出2024年比2020年多
C.用于水电的支出2024年与2020年相等
D.用于工资的支出2024年比2020年增长
7.南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale)设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次,数据为年末数据),并绘制成南丁格尔玫瑰图(如图所示),根据此图,则下列正确结论的序号是__________.
①2016年至2023年,知识付费用户数量逐年增加
②2017年至2023年,知识付费用户数量逐年增加量2018年最多
③2017年至2023年,知识付费用户数量的逐年增加量逐年递增
④2023年知识付费用户数量超过2016年知识付费用户数量的10倍
题型六、总体百分位数的估计
1.(25-26高一下·宁夏银川·期中)已知一组数据为:26,28,32,38,38,40,48,则这组数据的80%分位数为( )
A.40 B.38 C.37 D.35
2.样本数据38,133,143,177,209,151,210,223, 252,281,218,309的上四分位数是( )
A.223 B.237 C.237.5 D.252
3.从小到大排列的一组数据:80,86,90,96,110,120,126,134,则这组数据的下四分位数为( )
A.86 B.88 C.123 D.126
4.(25-26高一下·江西赣州·期末)已知一组数据:12,14,15,15,18,19,22,26,28,30,的第百分位数是26,则的值可以是( )
A.22 B.23 C.25 D.26
5.某工厂抽检了100个零件,并统计了这些零件的直径(单位:)数据,得到如下表格:
直径/mm
46
47
48
49
50
51
52
53
54
频数
5
8
12
15
20
18
12
6
4
由表可知这100个零件的直径的第60百分位数为( )
A. B. C. D.
6.(24-25高一下·安徽合肥·期末)一组数据按从小到大排列为:1,2,4,6,7,10,.这组数据的第60百分位数等于他们的平均数,则为( )
A.12 B.15 C.17 D.19
题型七、平均数、方差等数据特征的计算与性质(难点)
1.(24-25高一下·全国·课后作业)以下为甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)
甲:9 12 x 24 27
乙:9 15 y 18 24
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.12,15 B.15,15 C.15,18 D.18,18
2.抛掷骰子5次,分别记录每次骰子出现的点数.已知这组数据的数各不相同,且这组数据的极差为5,中位数为3,则( )
A.这组数据一定为
B.这组数据一定为
C.这组数据可能为
D.这组数据可能为
3.已知数据,,的平均数为2,数据,,,,的平均数为10,则数据的平均数为( )
A.4 B.5 C.6 D.7
4.某班级有50名同学,一次数学测试平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为( )
A.92 B.93 C.94 D.95
5.(24-25高一下·广东梅州·期末)某校举行“爱我中华”演讲比赛,评分规则如下:对每个选手的演讲,共有个评委打分,去掉一个最高分与一个最低分,剩下的分数作为有效分,以有效分的平均分作为该选手的得分.设对于某选手的演讲,个评委的原始评分分别为:、、、、、、,则对比原始评分和有效分两组数据,下列特征数中,发生改变的是( )
A.平均数 B.中位数 C.方差 D.众数
6.(23-24高一下·云南曲靖·期末)已知一组数据丢失了其中一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是( )
A.5 B.12 C.18 D.20
7.已知样本数据,,……,的平均数为2,方差为3,设,,……,的平均数为,方差为,则( )
A. B. C. D.
8.(24-25高一下·河北邢台·阶段检测)小明在整理一组数据3,1,5,2,3,6,4,x,y时,不小心漏掉了2个数据,用x,y代替.已知x,y都是1到6中的一个整数(包含1和6),且这组数据的中位数和众数都是3,则的值不可能是( )
A.1 B.2 C.3 D.4
9.(25-26高一下·安徽蚌埠·期末)若一组样本数据的平均数为5,方差为3,则的方差为( )
A. B. C. D.
10.(24-25高一下·河南信阳·期末)数据的平均数为,方差,现在增加两个数据和,则这组新数据的标准差为( )
A. B. C. D.
题型八、频率分布直方图中数据特征的计算与应用(重点)
1.(23-24高一下·广西·月考)一个样本容量为600的频数分布表不小心被损坏了一部分.若样本中数据在内的频率为0.75,则样本中的数据在内的个数为( )
A.225 B.295 C.235 D.305
2.(24-25高一下·福建南平·期末)如图,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态.根据所给图示作出判断,则下列结论正确的是( )
A.图(1)中平均数中位数众数 B.图(2)中平均数众数中位数
C.图(2)中众数平均数中位数 D.图(3)中平均数中位数众数
3.2025年春节期间国产动漫电影《哪吒之魔童闹海》的爆火,引起人们对中国动漫产业的关注.某传媒公司为了了解中国动漫市场受众群体的年龄(单位:岁)占比情况,调查了某电影院某天观看动漫系列电影的观众的年龄情况,并按照,,,,,分组,得到如下频率分布表:
年龄分组
频率
0.03
0.25
0.50
0.18
0.03
0.01
根据该表,估计中国动漫市场受众群体年龄的中位数为( )
A.36.6 B.34.2 C.32.4 D.30.2
4.(多选题)(24-25高一下·山东济南·期末)某校为了解高一学生的体能达标情况,抽调了200名学生进行立定跳远测试,根据统计数据得到如下的频率分布直方图(同一组的数据用该组区间的中点值代表),则( )
A. B.众数是230
C.中位数是210 D.跳远距离在区间的人数为168
5.(多选题)某农业研究部门在面积相等的100块稻田上种植同一种新型水稻,得到各块稻田的亩产量与田块数的关系(单位:),并整理下表
亩产量
田块数
6
12
18
30
24
10
据表中数据,下列结论正确的是( )
A.100块稻田亩产量的中位数小于
B.100块稻田中亩产量低于的稻田所占比例低于
C.100块稻田亩产量的极差介于至之间
D.100块稻田亩产量的平均值介于至之间
6.(23-24高一下·广东·期末)一家品牌连锁公司旗下共有100所加盟店.公司在年底对所有加盟店本年度营销总额(单位:百万元)进行统计,制作频率分布表如下:
分组
频数
频率
10
0.1
x
0.15
20
0.2
30
y
15
0.15
5
0.05
5
0.05
合计
100
1.00
(1)请求出频率分布表中x,y的值,并画出频率分布直方图;
(2)请估计这100所加盟店去年销售总额的平均数(同一组中的数据,用该组区间的中点值作代表);
(3)为了评选本年度优秀加盟店,公司将依据营销总额制定评选标准,按照“不超过的加盟店获评优秀加盟店称号”的要求,请根据频率分布直方图,为该公司提出本年度“评选标准”建议.
7.(25-26高一下·甘肃兰州·期中)某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
1.(25-26高一下·河南·月考)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…,500,假设从第1行第4列的数字开始,则第4个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.455 D.447
2.(23-24高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( ).
A. B. C. D.
3.(25-26高一下·全国·单元测试)容量为20的样本数据,分组后的频数如下表所示
分组
频数
2
3
4
5
4
2
则样本数据的第80百分位数所在区间为( )
A. B. C. D.
4.某校期中考试有 105 名学生参加,且成绩均相异,统计后得到学生成绩的中位数是 62分,后来发现成绩统计有误,其中53 名学生的成绩要各加上 5 分,其余学生成绩不变.则调整后学生成绩的中位数( ).
A.一定是 62 分
B.一定是 67 分
C.一定是62 或67 分(均可能)
D.不一定是 62 或 67 分
5.如图为2014—2022年中国游戏用户规模(单位:百万人)及同比增长率、2010—2022年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014—2022年中国游戏用户规模逐年增长
B.2014—2022年中国游戏用户规模的同比增长率的中位数为
C.2010—2022年中国国产游戏获批版号数量的极差为223个
D.2010—2022年中国国产游戏获批版号数量的平均数超过1600个
6.已知某学习小组一次数学测试成绩(单位:分)分别为78,82,85,90,,95,98,105,若该组数据的第50百分位数为92,则实数( )
A.89 B.92 C.94 D.99
7.(25-26高一下·辽宁沈阳·期末)已知,,,的平均数为3,标准差为2,则,,,的( )
A.平均数为15,标准差为10 B.平均数为15,标准差为50
C.平均数为17,标准差为10 D.平均数为17,标准差为50
8.某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业从业者中,“90后”占比不超过
C.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数多
9.(24-25高一下·湖北十堰·自主招生)有甲、乙、丙三个班,甲班有个人,乙班有个人,丙班有人(以上所有参数均为正整数),在一次考试中甲班平均分是分,乙班平均分是分,丙班平均分是分.则甲、乙、丙三个班在这次考试中的总平均分是( )
A. B.
C. D.
10.从队20人、队30人中,按照分层随机抽样的方法从两队共抽取5人.进行一轮答题竞赛.相关统计情况如下:队答对题目数的平均数为2,方差为1.04;队答对题目数的平均数为1,方差为2.04,则这5人答对题目数的方差为( )
A.0.95 B.1.06 C.1.33 D.1.88
11.(24-25高一下·安徽·期末)某项比赛共有7个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是( )
A.极差 B.45%分位数 C.平均数 D.众数
12.三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标、其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等;第三产业则包括服务业、金融业、信息技术等.如图为我国2020-2024年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2020-2024年第一产业增加值占国内生产总值比重逐年递增
B.2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%
C.2020-2024年第三产业增加值占国内生产总值比重的平均数为55.1%
D.2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第二产业
13.(24-25高一下·湖北黄石·期末)在对某校高三学生体质健康状况的调查中,按照性别比例进行分层随机抽样.已知抽取了男生80人,女生120人,其方差分别为15,10,由此估计样本的方差的最小值为( )
A.10 B.12 C.13 D.15
14.标志重捕法是指的是在一定范围内,对活动能力强、活动范围较大的动物种群进行粗略估算的一种生物统计方法,是根据自由活动的生物在一定区域内被调查与自然个体数的比例关系对自然个体总数进行数学推断.在被调查种群的生存环境中,捕获一部分个体,将这些个体进行标志后再放回原来的环境,经过一段时间后进行重捕,根据重捕中标志个体占总捕获数的比例来估计该种群的数量.标志重捕法估算种群密度是基于以下几种假设:①标记个体与未标记个体在重捕时被捕获的概率相等;②在调查期内标记的个体没有死亡,没有迁出,标记物没有脱落;③标记个体在种群中均匀分布.若应用标志重捕法调查鱼的种群密度,则下列捕鱼过程会导致估算结果与实际情况误差较大的是( ).
A.第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼
B.第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
C.第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼
D.第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
15.(25-26高一下·江西景德镇·月考)已知一组数据由5个正整数组成,下列描述中,能确保这组数据中一定没有出现8的是( )
A.平均数为4,中位数3 B.平均数为4,众数为4
C.平均数为4,方差为3.6 D.中位数为5,方差为3.6
16.(多选题)(24-25高一下·河北雄安·期末)某城市为了解不同年龄段市民对垃圾分类政策的支持情况,对参与同卷调查的市民按老、中、青三十年龄段进行统计,发现三个年龄段的人数比例为4∶3∶3.现用按比例分层随机抽样的方法从这些市民中抽取n名进行深入访谈,若老年市民抽到80人,则下列结论正确的是( )
A.中年市民抽到60人
B.青年市民抽到90人
C.
D.抽取的中年与青年市民人数之和比老年市民多40人
17.(多选题)(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
18.(多选题)(25-26高一下·江苏南京·期中)若是样本数据:,,,的平均数(,,,不全相等),则( )
A.,,,的极差等于,,,,的极差
B.,,,的平均数等于,,,,的平均数
C.,,,的中位数等于,,,,的中位数
D.,,,的标准差大于,,,,的标准差
19.(多选题)一组互不相等的数据从小到大排列为…,去掉后,则( )
A.极差变大 B.平均数变大 C.中位数变小 D.分位数变大
20.(多选题)海水养殖场进行某水产品两种养殖方法的产量对比,甲试验区选择第一种养殖方法,乙试验区选择第二种养殖方法.收获时,从两个试验区各随机抽取了100个网箱,测量各箱水产品的产量(单位:千克),其频率分布直方图如下图所示.
记事件C=“乙试验区产量不低于19千克”,根据直方图得到的估计值为0.70,则( )
A.乙试验区产量频率分布直方图中,
B.甲试验区产量的众数大于乙试验区产量的众数
C.甲试验区产量的平均数小于乙试验区产量的平均数
D.甲试验区产量的75%分位数大于乙试验区产量的中位数
21.(多选题)(25-26高一下·甘肃酒泉·期中)有一组样本数据,其平均数为5,方差为,中位数为.在这组数中,去掉一个最大的数10和一个最小的数1,余下8个数据的中位数为,方差为,极差为,则( )
A. B. C. D.
22.(多选题)(24-25高一下·福建福州·期末)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是( )
A.
B.估计该年级学生跳绳次数的分位数约为
C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为
D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为
23.(24-25高一下·广东惠州·阶段检测)高一年级有男生490人,女生510人,按男生、女生进行分层,抽取总样本量为100.通过分层随机抽样的方法得到男生、女生的平均身高为170.2cm和160.8cm.则估计高一年级全体学生的平均身高为__________cm.(结果保留一位小数)
24.在一次数学测验中,某小组的7位同学的成绩分别为:109,116,122,126,131,134,140,则这7位同学成绩的上四分位数与下四分位数的差为__________.
25.某公司为了调查员工的体重(单位:千克),因为女员工远多于男员工,所以按性别分层,用按比例分层随机抽样的方法抽取样本,已知抽取样本中所有员工体重的方差为120,其中女员工的平均体重为50,方差为50,男员工的平均体重为70,方差为30.若样本中有21名男员工,则样本中女员工的人数为________.
26.(25-26高一下·山西忻州·期末)某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了名学生的成绩作为样本进行统计,将其成绩(满分:分)分成、、、六组,得到如图所示频率分布直方图.
(1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若根据这次成绩,学校准备给成绩较高的前的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数;
(3)若落在中的样本数据的平均数是,方差是,落在中的样本数据的平均数是,方差是,求这两组数据的总平均数和方差.
27.(24-25高一下·四川巴中·期末)统计学家将战争中摧毁敌军的战机序列号作为样本,用样本估计总体的方法推断敌军每年生产的战机数量.假设敌军某年生产的战机数量为,摧毁某年生产的架战机编号从小到大为,,,…,,最大的编号为,摧毁敌军战机是随机的,摧毁战机的编号,,,…,,相当于从中随机抽取的个整数,这个数将区间分成个小区间(如下图),可以用前个区间的平均长度估计所有个区间的平均长度进而得到的估计值.
已知在某次战斗中摧毁敌军的战机编号为:2,5,7,13,15,17,21,据此回答下列问题.
(1)根据材料估计敌军生产的战机数量;
(2)已知敌军所有现役战机分为三个等级(四代战机,四代半战机,五代机),通过分层抽样调查三类战机的飞行高度,得到各个等级飞行高度的样本平均数为,,.
(ⅰ)根据上述信息是否可以估计敌军所有现役战机的平均飞行高度?若不能,还需要什么条件,请补充条件并写出估计式;
(ⅱ)若敌军现役战机是按照比例生产的,四代战机,四代半战机,五代机的战机数量分别为,,,样本量分别为,,,据此证明:
1 / 6
学科网(北京)股份有限公司
$
专题01 统计常考题型全归纳
目录
A题型建模・专项突破 1
题型一、随机数法 1
题型二、简单随机抽样估计总体及其概率问题 2
题型三、分层随机抽样(常考点) 4
题型四、分层随机抽样中的平均数和方差 6
题型五、各种类型统计图表 9
题型六、总体百分位数的估计 14
题型七、平均数、方差等数据特征的计算与性质(难点) 15
题型八、频率分布直方图中数据特征的计算与应用(重点) 19
B综合攻坚・能力跃升 24
题型一、随机数法
1.(25-26高一下·福建厦门·期中)总体由编号为01,02,03,…,49,50的50个个体组成,利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体.选取方法是从随机数表第1行的第9列数字开始由左向右读取,则选出来的第5个个体的编号为_____.
66 67 70 67 14 64 05 71 95 86 11 05 65 09 68 76 83 20 37 90
57 16 00 11 66 14 90 84 45 11 75 73 88 05 90 52 27 41 14 86
【答案】20
【分析】根据随机数表读法分别读取有效的5个数字即可得出结论.
【详解】依题意从随机数表第1行的第9列数字开始由左向右读取,
依次读取两个数字舍去大于50的数且重复的数字只取一次,可得数字为14,05,11,09,20;
所以选出来的第5个个体的编号为20.
故答案为:20
2.某校高一年级共有500名学生,学校计划用随机数法抽取30名学生参加一项问卷调查.将500名学生按的顺序进行编号,用下列随机数表进行抽取,从第2行第4个数字开始,按从左到右、从上到下的顺序读取,依次选取符合条件的编号,第2个被选中学生的编号为____________.
【答案】498
【分析】根据随机数表的用法依次得到学生编号即可.
【详解】从第2行第4个数字开始,读取的数字编号依次为:692,350,498,221,…
其中692大于499,跳过.
所以第二个被选学生的编号为498.
故答案为:498
3.(25-26高一下·全国·单元测试)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样调查,先将650名学生进行编号:001,002,…,649,650.从中抽取50个样本,下面提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是______.
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 24
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
【答案】623
【分析】根据随机表数据的读取方法确定前6个编号,即可得.
【详解】按照随机数表的数据,三位一组进行读数,只取001到650内的数,重复的数只取一次.
从第5行第6列开始向右读取数据,
第一个数是253,
第二个数是313,
第三个数是457,
下一个数是860,不符合,
下一个数是736,不符合,
下一个数是253,重复,不符合,
第四个数是007,
第五个数是328,
第六个数是623.
故答案为:623
题型二、简单随机抽样估计总体及其概率问题
1.(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
【答案】C
【分析】抽签法可知每个个体被抽到的可能性均为,即可得到方程,解得即可.
【详解】根据抽签法可知每个个体被抽到的可能性均为,
依题意可得,解得.
故选:C
2.从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
【答案】B
【分析】根据抽样的概念,每个个体被抽中的概率是均等的,进而即可选择答案.
【详解】因为在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为,
所以.
故选:B.
3.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
【答案】C
【分析】根据抽样取米一把,数得255粒内夹谷29粒,可计算出夹谷的频率,从而得解.
【详解】设这批米内夹谷约为石,根据样本的性质可得,求得,
即这批米内夹谷约为230石,
故选:C.
4.某校要从高一、高二、高三共2 019名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 019名学生中剔除19名,再从剩下的2 000名学生中按分层抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
【答案】A
【分析】根据简单随机抽样及分层抽样的定义可得,每个个体被抽到的概率都是相等的,从而求解.
【详解】根据简单随机抽样及分层抽样的定义可得,每个个体被抽到的概率都相等,
所以每个个体被抽到的概率都等于,故A项正确.
故选:A.
5.统计学中,常以前个区间的平均长度估计所有区间的平均长度.某工厂生产的零件以个为一箱,成箱出售().每箱中的零件按照生产顺序,从1到连续编号.现从一箱中随机抽取6个零件,发现上面的编号从小到大依次为:12,15,33,38,55,60,则下列4个选项中,作为的估计值,最合适的一项是( )
A.61 B.70 C.98 D.120
【答案】B
【分析】根据统计估计计算求解.
【详解】根据已知从1到连续编号.现从一箱中随机抽取6个零件,发现上面的编号从小到大依次为:12,15,33,38,55,60,
则,所以.
6.(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
【答案】D
【分析】由题意结合简单随机抽样的特征即可确定实数,的值.
【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以甲第一次被抽到的可能性为,
第二次被抽到的可能性为.
即甲同学在每次抽样中被抽到的可能性都是,所以,.
故选:D.
题型三、分层随机抽样(常考点)
1.(25-26高一下·宁夏银川·期中)高一某班有56名学生,其中男生24人,女生32人.按性别进行分层,用分层随机抽样的方法,从该班学生中抽取14人参加跳绳比赛,如果样本按比例分配,则应抽取的男生人数为( )
A.5 B.6 C.7 D.8
【答案】B
【详解】因为样本按比例分配,男女比例为,
所以应抽取的男生人数为.
2.(25-26高一下·贵州遵义·期末)一支田径队有运动员84人,其中女运动员有48人,按性别进行分层,用分层随机抽样的方法从全体运动员中抽出一个容量为14的样本.如果样本按比例分配,那么应抽取的男运动员人数是( )
A.4 B.6 C.8 D.10
【答案】B
【分析】利用分层抽样的定义求解.
【详解】由题意可知
抽取男运动员的人数为.
故选:B.
3.(24-25高一下·山东青岛·期末)某学校有男生2000名和女生1000名,为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法从该校学生中抽取一个容量为的样本,已知从男生中抽取100名学生,则为( )
A.150 B.200 C.250 D.300
【答案】A
【分析】根据比值关系直接计算可得.
【详解】由题知,,解得.
故选:A
4.(24-25高一下·福建厦门·期末)某企业生产甲、乙、丙三种不同型号的产品,产品数量之比依次为,现用按比例分配的分层随机抽样方法,抽取一个容量为的样本,样本中甲型号产品有10件,则的值为( )
A.20 B.30 C.50 D.100
【答案】C
【分析】根据分层抽样原理,利用样本容量与频率、频数的关系,即可求出样本容量.
【详解】
因为某企业生产甲、乙、丙三种不同型号的产品,产品数量之比依次为,
现用分层抽样方法抽出一个容量为的样本,样本中甲型号产品有10件,
所以,解得.
故选:C.
5.(多选题)(24-25高一下·陕西商洛·期末)某学校调查学生对学校食堂意见情况,该学校分高一,高二,高三三个年级,统计可得这三个年级的人数比例为.现用分层随机抽样的方法从这些学生中抽取n名学生进行调研,若高一年级抽到80人,则( ).
A.高二年级抽到60人 B.高三年级抽到90人
C. D.抽取的高二与高三人数之和比高一多40人
【答案】ACD
【分析】根据分层抽样的抽样比及人数进行求解即可.
【详解】根据题意,已知高一、高二、高三人数比例为,
设抽取的高一、高二、高三人数分别为、、.
因为高一抽到80人,即,解得.
所以高二抽到人数为人,故A正确;
高三抽到人数为人,故B错误;
所以,故C正确;
高二与高三人数之和为人,比高一多人,故D正确.
故选:ACD.
6.(2025高一·全国·专题练习)为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中型血、型血、型血、型血的人数比为,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中型血的人数比型血的人数多,则_________.
【答案】
【分析】计算出样本中型血、型血的人数,结合题意可得出关于的等式,解之即可.
【详解】因为感染人群中型血、型血、型血、型血的人数比为,
所以,抽取样本量为的样本中,型血的人数为,
型血的人数为,
所以,,解得.
故答案为:.
题型四、分层随机抽样中的平均数和方差
1.树人中学国旗班共有50名学生,其中男女比例,平均身高174cm,用等比例分层随机抽样的方法,从中抽取一个容量为20的样本,若样本中男生的平均身高为178cm,样本中女生人数与女生平均身高的估计值分别为( )
A.8人 168cm B.8人 170cm C.12人 168cm D.12人 170cm
【答案】A
【分析】根据分层抽样的概念求出样本女生人数,根据平均数的计算法即可求样本中女生的身高估计值.
【详解】由题意可知,样本中男生人数为,女生人数为8,
则样本中女生的平均身高为.
故选:A.
2.(24-25高一下·安徽·期末)某校高一年级“物理方向”有“物化生、物化地、物化政”三种常见的选科组合,选物化生、物化地、物化政的学生期中考试数学成绩的平均数分别为,若按不同选科组合的人数比例采用分层随机抽样的方法抽取一个容量为180的样本,抽到选物化生、物化地、物化政的学生人数分别为,则估计该校高一年级“物理方向”的学生期中考试数学成绩的平均数为( )
A.83 B.82 C.81 D.80
【答案】B
【分析】利用分层抽样平均数公式计算得.
【详解】依题意,样本平均数为,
所以估计该校高一年级“物理方向”的学生期中考试数学成绩的平均数为82.
故选:B
3.(25-26高一下·贵州遵义·月考)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
【答案】A
【详解】依题意,在分层随机抽样的方法所抽取的100人中,高一男生有人,高二男生有40人,
记高一男生成绩的平均数和方差分别为和;
高二男生成绩的平均数和方差分别为和,
则样本平均数为,
样本总体方差 .
4.(23-24高一下·河南新乡·期末)在某次调查中,采用分层随机抽样的方法得到10个A类样本,30个B类样本.若A类样本的平均数为5.5,总体的平均数为4,则B类样本的平均数为______.
【答案】3.5
【分析】设B类样本的平均数为x,通过总体的平均数列方程,进而解方程可得B类样本的平均数.
【详解】设B类样本的平均数为x,则,解得.
故答案为:.
5.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,样本中有39名女员工,女员工的平均体重为50kg,标准差为6;有21名男员工,男员工的平均体重为70kg,标准差为4.则样本中所有员工的体重的方差为______.
【答案】
【分析】根据题意先求平均数,再结合分层抽样的方差公式计算样本的方差.
【详解】依题意样本中所有员工的体重的平均值为,
则样本中所有员工的体重的方差,
所以样本中所有员工的体重的方差为.
故答案为:
6.(24-25高一下·安徽阜阳·月考)某学校有高中生600人,其中男生400人,女生200人.有人为了获得该校全体高中生的身高信息,采用分层随机抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为174,女生样本的均值为162.
(1)若男、女生样本量按比例分配,则总样本的均值为多少?
(2)若男、女生的样本量都是100,则总样本的均值为多少?它作为总体均值的估计合适吗?为什么?
【答案】(1)170
(2)168,不合适,原因见解析
【分析】(1)利用分层抽样的均值公式计算得解.
(2)列式求出均值,再抽样是否等可能分析作答.
【详解】(1)总样本的均值为.
(2)总样本的均值为,
不能作为总体均值的估计,因为分层随机抽样中未按比例抽样,
总体中每个个体被抽到的可能性不完全相同,所以样本的代表性差.
题型五、各种类型统计图表
1.为弘扬中华优秀传统文化,济南市公开招募“泉润非遗”志愿者.现从所有报名的志愿者中,随机选取300人进行调查,其中青年人、中年人、老年人三个年龄段的比例饼状图如图1所示,各年龄段志愿者的性别百分比等高堆积条形图如图2所示,则下列关于样本数据的分析正确的是( )
A.老年男性志愿者人数为90
B.老年女性志愿者人数大于中年女性志愿者人数
C.青年女性志愿者人数为72
D.中年男性志愿者人数大于青年男性志愿者人数
【答案】C
【分析】根据各个年龄层的人数,结合等高堆积条形图即可结合选项逐一求解.
【详解】由图1可知300名主播中,青年人有人,
中年人有人,老年人有人,
对于A,由图2可知样本老年男性志愿者人数为人,故A错误;
对于B,由图2可知老年女性志愿者人数为人;
中年女性志愿者有人;故B错误,
青年女性志愿者有人,故C正确,
中年男性志愿者人数为,青年男性志愿者人数,故D错误,
故选:C
2.国家能源集团研发的“擎源”大模型用于预测关键节点电价,研究人员利用模型对某节点连续8个小时的实际与预测电价数据进行记录,并利用上述数据绘制成实际值与预测值对比的折线图(两条折线):
观察图表与数据,下列结论不能直接从中得出的是( )
A.实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值
B.这8小时内,预测值与实际值的差异(两个值的差的绝对值)平均在10元/MWh左右
C.模型对所有“价格下跌时段”(如第5-6小时)的预测都出现了滞后性(即预测反应慢于实际变化)
D.模型的预测精度较高,趋势与实际基本一致,对电网调度有重要参考价值
【答案】C
【详解】由图可知:实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值,A正确;
对于B,差异平均值为,B正确;
由图可知两折线的趋势基本一致,且误差较小,故精确度高,D正确;
对于C,没有足够的理由说明预测变化慢于实际变化,C错误.
3.(25-26高一下·甘肃酒泉·期中)随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从年月到该地旅游的游客中随机抽取部分游客进行调查,得到各年龄段游客的人数比例和各年龄段中自助游的比例,如图,则下列说法错误的是( )
A.若调查的游客中青年人有人,则一共调查了人
B.估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的
C.用分层随机抽样的方法对所调查游客进行抽样,若老年人有人,则中年人有人
D.估计年月到该地旅游且选择自助游的游客中青年人不超过一半
【答案】D
【详解】设年月到该地旅游的游客总人数为.
由题意,游客中老年人、中年人、青年人的人数分别为,
其中选择自助游的老年人、中年人、青年人的人数分别为.
对于A,,解得,即一共调查的游客人数是人,故A正确;
对于B,估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的,故B正确;
对于C,设中年人应抽取人,依题意得,解得,即中年人应抽取人,故C正确;
对于D,因为年月到该地旅游且选择自助游的游客的人数为,其中青年人的人数为,所以选择自助游的游客中青年人超过一半,故D错误.
4.(多选题)三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标,其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等工业部门;第三产业则包括服务业、金融业、信息技术等现代经济部门.如图为我国2019—2023年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2019—2023年第二产业增加值占国内生产总值比重的平均数为37.66%
B.2019—2023年第一产业增加值占国内生产总值比重的中位数为7.2%
C.2019—2023年第三产业增加值占国内生产总值比重逐年递增
D.2019—2023年三次产业中增加值占国内生产总值比重极差最大的是第二产业
【答案】BD
【分析】根据平均数,中位数,极差的计算方法可求答案.
【详解】20192023年第二产业增加值占国内生产总值比重的平均数为
,A错误;
将20192023年第一产业增加值占国内生产总值比重从小到大排序为7.1%,7.1%,7.2%,7.3%,7.7%,则其中位数为7.2%,B正确;
20192023年第三产业增加值占国内生产总值比重先递增再递减再递增,C错误;
20192023年第一产业增加值占国内生产总值比重的极差为,
第二产业的极差为,第三产业的极差为,
因为,所以极差最大的为第二产业,D正确.
故选:BD
5.(多选题)(25-26高一下·全国·单元测试)某商场一年中各月份的收入,支出情况如图所示,下列说法中正确的是( )
A.支出最高值与支出最低值的比是
B.4至6月份的平均收入为50万元
C.利润最高的月份是2月份
D.2至3月份的收入的变化率与11至12月份的收入的变化率相同
【答案】AD
【分析】根据折线统计图即可判断各选项.
【详解】由图可知,支出最高值为60万元,支出最低值为10万元,其比是,故A正确.
由图可知,4至6月份的平均收入为(万元),故B错误.
由图可知,利润最高的月份为3月份和10月份,故C错误.
由图可知,2至3月份的收入的变化率为,
与11至12月份的收入的变化率为,故D正确.
故选:AD
6.(多选题)如图是某公司2020年和2024年支出的比例分配图,其中这两年用于文体活动的支出费用相等,则( )
A.2024年总支出比2020年增长
B.用于宣发的支出2024年比2020年多
C.用于水电的支出2024年与2020年相等
D.用于工资的支出2024年比2020年增长
【答案】ACD
【分析】设年总支出为,年总支出为,依题意可得,即可判断A,再分别求出各年用于宣发、水电、工资的支出,即可判断B、C、D.
【详解】对于A:设年总支出为,年总支出为,
依题意可得,所以,
即年总支出比年增长,故A正确;
对于B:年用于宣发的支出为,
年用于宣发的支出为,
故用于宣发的支出年比年少,故B错误;
对于C:年用于水电的支出为,
年用于水电的支出为,
故用于水电的支出年与年相等,故C正确;
对于D:年用于工资的支出为,
年用于工资的支出为,
因为,
所以工资的支出年比年增长,故D正确;
故选:ACD
7.南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale)设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次,数据为年末数据),并绘制成南丁格尔玫瑰图(如图所示),根据此图,则下列正确结论的序号是__________.
①2016年至2023年,知识付费用户数量逐年增加
②2017年至2023年,知识付费用户数量逐年增加量2018年最多
③2017年至2023年,知识付费用户数量的逐年增加量逐年递增
④2023年知识付费用户数量超过2016年知识付费用户数量的10倍
【答案】①②
【分析】根据图的特征计算判断各个选项.
【详解】对于①,由图可知,2016年至2023年,知识付费用户数量逐年增加,故①正确.
对于②和③,知识付费用户数量的逐年增加量分别为:2017年,;
2018年,;2019年,;
2020年,;2021年,;
2022年,;2023年:.
则知识付费用户数量逐年增加量2018年最多,知识付费用户数量的逐年增加量不是逐年递增,故②正确,③错误.
对于④,由,则2023年知识付费用户数量未超过2016年知识付费用户数量的10倍,故④错误.
故答案为:①②.
题型六、总体百分位数的估计
1.(25-26高一下·宁夏银川·期中)已知一组数据为:26,28,32,38,38,40,48,则这组数据的80%分位数为( )
A.40 B.38 C.37 D.35
【答案】A
【分析】根据百分位数的计算公式求解即可.
【详解】由于,所以这组数据的80%分位数为第6个数40.
故选:A.
2.样本数据38,133,143,177,209,151,210,223, 252,281,218,309的上四分位数是( )
A.223 B.237 C.237.5 D.252
【答案】C
【分析】将数据从小到大排序,结合上四分位数计算公式即可求解.
【详解】数据从小到大排序:38,133,143,151,177,209,210,218,223, 252,281,309,共12个数,
,则上四分位数是第9个数和第10个数的平均数.
3.从小到大排列的一组数据:80,86,90,96,110,120,126,134,则这组数据的下四分位数为( )
A.86 B.88 C.123 D.126
【答案】B
【分析】根据百分位数计算规则计算可得.
【详解】因为,所以这组数据的下四分位数为.
故选:B
4.(25-26高一下·江西赣州·期末)已知一组数据:12,14,15,15,18,19,22,26,28,30,的第百分位数是26,则的值可以是( )
A.22 B.23 C.25 D.26
【答案】D
【分析】根据百分位数的概念求解即可.
【详解】一组数据:12,14,15,15,18,19,22,26,28,30,共11个,
因为,所以第百分位数为从小到大排序的第8个数,
若第百分位数是26,则,故符合的只有D选项.
故选:D.
5.某工厂抽检了100个零件,并统计了这些零件的直径(单位:)数据,得到如下表格:
直径/mm
46
47
48
49
50
51
52
53
54
频数
5
8
12
15
20
18
12
6
4
由表可知这100个零件的直径的第60百分位数为( )
A. B. C. D.
【答案】C
【分析】先确定共有个数小于等于,再结合百分位数定义求结论.
【详解】因为被抽检的零件中,直径小于或等于的零件共有个,
且,
所以这个零件的直径的第百分位数为.
6.(24-25高一下·安徽合肥·期末)一组数据按从小到大排列为:1,2,4,6,7,10,.这组数据的第60百分位数等于他们的平均数,则为( )
A.12 B.15 C.17 D.19
【答案】D
【分析】根据百分位数的计算规则,算出第60百分位数,再算出平均数,列出关于的等式,计算得出的值.
【详解】位置,根据百分位数的计算规则,第60百分位数是第5个数据,即7,
因为这组数据的第60百分位数等于他们的平均数,所以,
解得.
故选:D
题型七、平均数、方差等数据特征的计算与性质(难点)
1.(24-25高一下·全国·课后作业)以下为甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)
甲:9 12 x 24 27
乙:9 15 y 18 24
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.12,15 B.15,15 C.15,18 D.18,18
【答案】C
【分析】根据中位数和平均数的定义求解即可.
【详解】因为甲组数据的中位数为15,所以.
又乙组数据的平均数为16.8,所以,解得,
故选:C.
2.抛掷骰子5次,分别记录每次骰子出现的点数.已知这组数据的数各不相同,且这组数据的极差为5,中位数为3,则( )
A.这组数据一定为
B.这组数据一定为
C.这组数据可能为
D.这组数据可能为
【答案】D
【分析】结合极差与中位数的概念,可列出5个可能的点数得到答案.
【详解】因为点数最小是1,最大是6,而极差是5,所以5个数据中必有1、6;
又中位数是3,将数据从小到大排列后,第三个数为3,因最小数为1且数据各不相同,所以第二个数必为2,
故这5个数据从小到大为1,2,3,,6,又由点数各不相同,则x可能是4或5.
3.已知数据,,的平均数为2,数据,,,,的平均数为10,则数据的平均数为( )
A.4 B.5 C.6 D.7
【答案】D
【分析】根据平均数的概念和公式进行求解即可.
【详解】数据,,的平均数为2,数据,,,,的平均数为10,
数据的平均数为.
故选:D.
4.某班级有50名同学,一次数学测试平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为( )
A.92 B.93 C.94 D.95
【答案】D
【分析】根据加权平均数的计算方法列式求值.
【详解】设20名女生的平均成绩为,则,解得.
故选:D
5.(24-25高一下·广东梅州·期末)某校举行“爱我中华”演讲比赛,评分规则如下:对每个选手的演讲,共有个评委打分,去掉一个最高分与一个最低分,剩下的分数作为有效分,以有效分的平均分作为该选手的得分.设对于某选手的演讲,个评委的原始评分分别为:、、、、、、,则对比原始评分和有效分两组数据,下列特征数中,发生改变的是( )
A.平均数 B.中位数 C.方差 D.众数
【答案】C
【分析】求出原数据和新数据的平均数、中位数、众数、方差,比较后可得出结论.
【详解】原数据由小到大依次为:、、、、、、,
其平均数为,中位数为,众数为,
方差为,
将原数据中去掉一个最高分与一个最低分,剩余的数据由小到大依次为:、、、、,
新数据的平均数为,中位数为,众数为,
方差为,
故平均数、中位数、众数没有发生改变,方差发生改变,
故选:C.
6.(23-24高一下·云南曲靖·期末)已知一组数据丢失了其中一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是( )
A.5 B.12 C.18 D.20
【答案】C
【分析】设丢失的数据为,即可求出平均数与众数,再对分和两种情况讨论,得到中位数,即可得到方程,解得即可;
【详解】设丢失的数据为,则这七个数据的平均数为,众数是3,
若,则中位数为,此时,解得;
若,则中位数为5,此时,解得.
综上所述,丢失的数据可能是4,18.
故选:C.
7.已知样本数据,,……,的平均数为2,方差为3,设,,……,的平均数为,方差为,则( )
A. B. C. D.
【答案】D
【详解】因为样本数据,,……,的平均数为2,
所以,,……,的平均数为,因此选项AB均不正确.
因为样本数据,,……,的方差为3,
所以,,……,的方差为,因此选项C不正确,选项D正确.
8.(24-25高一下·河北邢台·阶段检测)小明在整理一组数据3,1,5,2,3,6,4,x,y时,不小心漏掉了2个数据,用x,y代替.已知x,y都是1到6中的一个整数(包含1和6),且这组数据的中位数和众数都是3,则的值不可能是( )
A.1 B.2 C.3 D.4
【答案】D
【分析】根据数据的众数是3知,x,y中至少有一个为3,再结合数据的中位数为3,通过分情况讨论即可求得答案.
【详解】不妨设,
当时,1,1,2,3,3,3,4,5,6,;
当时,1,2,2,3,3,3,4,5,6,;
当时,1,2,3,3,3,3,4,5,6,;
当时,1,2,3,3,3,4,4,5,6,;
当时,1,2,3,3,3,4,5,5,6,;
当时,1,2,3,3,3,4,5,6,6,.
故选:D.
9.(25-26高一下·安徽蚌埠·期末)若一组样本数据的平均数为5,方差为3,则的方差为( )
A. B. C. D.
【答案】A
【分析】根据方差和平均数的定义进行求解即可.
【详解】因为一组样本数据的平均数为5,方差为3,
所以,
,
的平均数为
的方差为.
故选:A
10.(24-25高一下·河南信阳·期末)数据的平均数为,方差,现在增加两个数据和,则这组新数据的标准差为( )
A. B. C. D.
【答案】B
【分析】根据平均数的计算公式求出新数据的平均数,再根据方差的计算公式求出新数据的方差,最后根据标准差与方差的关系求出新数据的标准差.
【详解】数据的平均数为,方差
即,
则数据,,的平均数为
方差
标准差为.
故选B.
题型八、频率分布直方图中数据特征的计算与应用(重点)
1.(23-24高一下·广西·月考)一个样本容量为600的频数分布表不小心被损坏了一部分.若样本中数据在内的频率为0.75,则样本中的数据在内的个数为( )
A.225 B.295 C.235 D.305
【答案】C
【分析】根据题设条件求出数据在内的频数,去掉内的频数即得.
【详解】因为数据在内的频率为0.75,所以数据在内的频数为,
故样本中数据在内的个数为.
故选:C.
2.(24-25高一下·福建南平·期末)如图,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态.根据所给图示作出判断,则下列结论正确的是( )
A.图(1)中平均数中位数众数 B.图(2)中平均数众数中位数
C.图(2)中众数平均数中位数 D.图(3)中平均数中位数众数
【答案】D
【分析】由频率分步直方图概念,结合中位数,平均数,众数定义结合图形可得答案.
【详解】对于图1,平均数中位数众数,故A错误;
对于图2,众数中位数平均数,故BC错误;
对于图3,平均数中位数众数,故D正确.
故选:D
3.2025年春节期间国产动漫电影《哪吒之魔童闹海》的爆火,引起人们对中国动漫产业的关注.某传媒公司为了了解中国动漫市场受众群体的年龄(单位:岁)占比情况,调查了某电影院某天观看动漫系列电影的观众的年龄情况,并按照,,,,,分组,得到如下频率分布表:
年龄分组
频率
0.03
0.25
0.50
0.18
0.03
0.01
根据该表,估计中国动漫市场受众群体年龄的中位数为( )
A.36.6 B.34.2 C.32.4 D.30.2
【答案】C
【分析】先求出中位数落在内,设中位数为,从而得到方程,求出答案.
【详解】,,
故中位数落在内,
设中国动漫市场受众群体年龄的中位数为,则,
解得.
故选:C.
4.(多选题)(24-25高一下·山东济南·期末)某校为了解高一学生的体能达标情况,抽调了200名学生进行立定跳远测试,根据统计数据得到如下的频率分布直方图(同一组的数据用该组区间的中点值代表),则( )
A. B.众数是230
C.中位数是210 D.跳远距离在区间的人数为168
【答案】AB
【分析】对于A,由各个矩形面积之和为1列方程验算即可;对于B,只需看最高矩形的中间值即可;对于C,由中位数的定义即可验算;对于D,由对应的频率乘以总人数即可验算.
【详解】对于A,由图可知,,解得,故A正确;
对于B,右图可知,最高的矩形是区间所对应的矩形,所以众数是230,故B正确;
对于C,第一组的频率为,第二组的频率为,
第三组的频率为,第四组的频率为,
而,
从而中位数在区间内,设中位数为,
则,解得,故C错误;
对于D,跳远距离在区间的人数为,故D错误.
故选:AB.
5.(多选题)某农业研究部门在面积相等的100块稻田上种植同一种新型水稻,得到各块稻田的亩产量与田块数的关系(单位:),并整理下表
亩产量
田块数
6
12
18
30
24
10
据表中数据,下列结论正确的是( )
A.100块稻田亩产量的中位数小于
B.100块稻田中亩产量低于的稻田所占比例低于
C.100块稻田亩产量的极差介于至之间
D.100块稻田亩产量的平均值介于至之间
【答案】BC
【分析】对于A,计算出前三段频数即可判断;对于B,计算出低于1100kg的频数,再计算比例即可判断;对于C,根据极差计算方法即可判断;对于D,根据平均值计算公式即可判断.
【详解】对于A,根据频数分布表可知,,所以亩产量的中位数不小于1050kg,故A错误;
对于B,亩产量不低于1100kg的频数为,所以低于1100kg的稻田占比为,故B正确;
对于C,稻田亩产量的最大在区间内,最小在区间内,故极差在范围内,故C正确;
对于D,由频数分布表可得,平均值为,故D错误。
故选:BC.
6.(23-24高一下·广东·期末)一家品牌连锁公司旗下共有100所加盟店.公司在年底对所有加盟店本年度营销总额(单位:百万元)进行统计,制作频率分布表如下:
分组
频数
频率
10
0.1
x
0.15
20
0.2
30
y
15
0.15
5
0.05
5
0.05
合计
100
1.00
(1)请求出频率分布表中x,y的值,并画出频率分布直方图;
(2)请估计这100所加盟店去年销售总额的平均数(同一组中的数据,用该组区间的中点值作代表);
(3)为了评选本年度优秀加盟店,公司将依据营销总额制定评选标准,按照“不超过的加盟店获评优秀加盟店称号”的要求,请根据频率分布直方图,为该公司提出本年度“评选标准”建议.
【答案】(1),频率分布直方图见解析.
(2)
(3)选取本年度营销总额大于百万元的加盟店获评优秀加盟店称号.
【分析】(1)根据频率与频数的关系,即可求解,再把频率除以组距即可画出频率分布直方图.
(2)根据平均数计算公式即可求解.
(3)根据百分位数公式即可求解.
【详解】(1),频率分布直方图如图所示,
(2),
故这100所加盟店去年销售总额的平均数为18.2.
(3)第40百分位数为,故应选取本年度营销总额大于百万元的加盟店获评优秀加盟店称号.
7.(25-26高一下·甘肃兰州·期中)某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
【答案】(1)
(2),
(3)众数:75 分;平均数:76.5 分;人
【分析】(1)由频率分布直方图中各个矩形的面积和为1即可求解;
(2)由频率分布直方图确定成绩落在,的频率,再由频率估计人数即可;
(3)由样本数据的数字特征求法依次求解即可.
【详解】(1)由题意得,解得.
(2)设为成绩落在上的概率,为成绩落在的人数,
由题意得,
设为成绩落在上的概率,为成绩落在的人数,
.
(3)由题意得众数为75分;
由(1)得成绩落在的频率为0.1,落在的频率为0.15,
落在的频率为0.35,落在的频率为0.3,落在的频率为0.1,
则平均数为,
设为78分以上的频率,为78分以上的人数,
则
,
故78分以上的人数为47人.
1.(25-26高一下·河南·月考)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…,500,假设从第1行第4列的数字开始,则第4个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.455 D.447
【答案】A
【分析】由随机数法概念即可求解.
【详解】由题意,依次读取的三个数字编号分别是442,175,572,175,455,608,331,047,
剔除一个重复数据175和超过500的数据572,608,
所以符合条件的前5个编号是442,175,455,331,047,
所以第4个是331.
故选:A
2.(23-24高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( ).
A. B. C. D.
【答案】B
【分析】根据已知条件,结合简单随机抽样的定义,即可求解.
【详解】解:从第二次开始抽取时,余下的每个个体被抽到的概率为,
则,
解得,
故在整个抽样过程中,每个个体被抽到的可能性为.
故选:B.
3.(25-26高一下·全国·单元测试)容量为20的样本数据,分组后的频数如下表所示
分组
频数
2
3
4
5
4
2
则样本数据的第80百分位数所在区间为( )
A. B. C. D.
【答案】C
【分析】由百分位数的定义进行求解.
【详解】因为,所以样本数据的第80百分位数为样本数据由小到大排列的第16个数据和第17个数据的平均数,落在区间内.
故选:C
4.某校期中考试有 105 名学生参加,且成绩均相异,统计后得到学生成绩的中位数是 62分,后来发现成绩统计有误,其中53 名学生的成绩要各加上 5 分,其余学生成绩不变.则调整后学生成绩的中位数( ).
A.一定是 62 分
B.一定是 67 分
C.一定是62 或67 分(均可能)
D.不一定是 62 或 67 分
【答案】D
【详解】由中位数的意义,得中位数62分为发现统计有误前的成绩由小到大排列的第53个数,
假设加分的是原成绩排第1至53名的学生,且原成绩中第52名为61分,第54名为63分,
调整后,原第52名的成绩变为66分,原第53名变为67分,而原第54名的成绩63分不变,
排序后,新成绩序列的第53项为66分,即中位数为66分,
因此调整后学生成绩的中位数不一定是 62 或 67 分.
5.如图为2014—2022年中国游戏用户规模(单位:百万人)及同比增长率、2010—2022年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014—2022年中国游戏用户规模逐年增长
B.2014—2022年中国游戏用户规模的同比增长率的中位数为
C.2010—2022年中国国产游戏获批版号数量的极差为223个
D.2010—2022年中国国产游戏获批版号数量的平均数超过1600个
【答案】D
【分析】根据条形统计图、折线统计图逐项分析样本的数字特征即可判断.
【详解】A选项:2022年中国游戏用户规模比2021年少,A错误;
B选项:2014—2022年中国游戏用户规模的同比增长率从小到大依次为,,
,,,,,,,中位数为,B错误;
C选项:2010—2022年中国国产游戏获批版号数量的极差为(个),C错误;
D选项:
,D正确.
故选:D
6.已知某学习小组一次数学测试成绩(单位:分)分别为78,82,85,90,,95,98,105,若该组数据的第50百分位数为92,则实数( )
A.89 B.92 C.94 D.99
【答案】C
【分析】利用百分位数的概念和计算公式求解即可.
【详解】共有8个数据,
故该组数据的第50百分位数为从小到大第4个与第5个数据的平均值,
若,则第50百分位数,不合题意;
若,则第50百分位数,不合题意;
所以,解得.
故选:C
7.(25-26高一下·辽宁沈阳·期末)已知,,,的平均数为3,标准差为2,则,,,的( )
A.平均数为15,标准差为10 B.平均数为15,标准差为50
C.平均数为17,标准差为10 D.平均数为17,标准差为50
【答案】C
【分析】根据平均数和标准差的定义计算即可判断.
【详解】设的平均数为,标准差为,则,,
即,.
所以,,,的平均数为
;
,,,的方差为
,故其标准差为10.
故选:C.
8.某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业从业者中,“90后”占比不超过
C.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数多
【答案】D
【分析】对于A,不知道“80后”从事技术岗位的人数的比例,故无法比较;由图1可判断B;求出芯片、软件行业中从事技术和设计岗位的“90后”人数占比即可判断C;求出“90后”从事市场岗位的人数占比可判断D.
【详解】对于A,芯片、软件行业从事技术岗位的人中,“90后”人数占比为,
芯片、软件行业从业者中“80后”占总人数的,但不知道从事技术岗位的人数的比例,故无法比较,故A不一定正确;
对于B,由图1知芯片、软件行业从业者中,“90后”占比为,超过,故B错误;
对于C,芯片、软件行业中从事技术和设计岗位的“90后”人数占从事这两个行业总人数的,
没有超过从事这两个行业总人数的,故C错误;
对于D,芯片、软件行业中,“90后”从事市场岗位的人数占比为,
因为,
所以芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事芯片、软件行业的总人数多,故D正确.
故选:D.
9.(24-25高一下·湖北十堰·自主招生)有甲、乙、丙三个班,甲班有个人,乙班有个人,丙班有人(以上所有参数均为正整数),在一次考试中甲班平均分是分,乙班平均分是分,丙班平均分是分.则甲、乙、丙三个班在这次考试中的总平均分是( )
A. B.
C. D.
【答案】D
【分析】先求出甲乙丙三班的总分,再运用求平均数的计算公式进行计算即可.
【详解】甲班有个人,乙班有个人,丙班有人,甲班平均分是分,乙班平均分是分,丙班平均分是分,
甲乙丙三班在这次考试中的总分为:分,
甲乙丙三班在这次考试中的总平均分是分.
故选:D.
10.从队20人、队30人中,按照分层随机抽样的方法从两队共抽取5人.进行一轮答题竞赛.相关统计情况如下:队答对题目数的平均数为2,方差为1.04;队答对题目数的平均数为1,方差为2.04,则这5人答对题目数的方差为( )
A.0.95 B.1.06 C.1.33 D.1.88
【答案】D
【分析】根据分层抽样的性质,结合样本方差的公式进行求解即可.
【详解】抽到5人中,队的人数为,队的人数为,
因为队答对题目数的平均数为2,方差为1.04;队答对题目数的平均数为1,方差为2.04,
这5人答对题目数的平均数为.
所以这5人答对题目数的方差为,
故选:D
11.(24-25高一下·安徽·期末)某项比赛共有7个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是( )
A.极差 B.45%分位数 C.平均数 D.众数
【答案】B
【分析】根据极差、百分位数、平均数以及众数的含义逐一判断即可.
【详解】不妨设原始数据为:,
原始数据的极差为:,平均数为,众数为,
去掉一个最高分与一个最低分后剩下数据为:,
剩下数据的极差为:,平均数为,众数为和3,
由此可知,与原始数据相比,剩下数据的极差,平均数,众数可能发生改变,故A,C,D错误,
对于B项,假设这7个数据从小到大为,
去掉一个最高分与一个最低分后剩下数据为:,
因为,,
所以原始数据的分位数为第四个数,即,剩下的数据的分位数为第3个数,即
所以与原始数据相比,剩下数据的分位数不变,故B正确;
故选:B.
12.三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标、其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等;第三产业则包括服务业、金融业、信息技术等.如图为我国2020-2024年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2020-2024年第一产业增加值占国内生产总值比重逐年递增
B.2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%
C.2020-2024年第三产业增加值占国内生产总值比重的平均数为55.1%
D.2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第二产业
【答案】B
【分析】选项A,依据表中数据求出2020-2024年第一产业增加值占国内生产总值比重,通过数据判断选项A错误;选项B,利用中位数的定义得到结论;选项C,求出平均数得解;选项D,分别求出每个产业的极差,从而得解.
【详解】选项A,年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
从数据上看,2020-2021年第一产业增加值占国内生产总值比重递减,2021-2022年第一产业增加值占国内生产总值比重持平,2022-2024年第一产业增加值占国内生产总值比重递减,
故选项A错误;
选项B,2020-2024年第二产业增加值占国内生产总值比重依次为,
将这个数从小到大排列为,则这个数的中位数为,
故2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%,故答案B正确;
选项C,2020-2024年第三产业增加值占国内生产总值比重依次为,
则这个数的平均数为,
2020-2024年第三产业增加值占国内生产总值比重的平均数为,故答案C错误;
选项D,2020-2024年第一产业增加值占国内生产总值比重依次为,
这个数中的最小值为,最大值为,故极差为,
2020-2024年第二产业增加值占国内生产总值比重依次为,
这个数中的最小值为,最大值为,故极差为,
2020-2024年第三产业增加值占国内生产总值比重依次为,这个数中的最小值为,最大值为,故极差为,
故2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第三产业,
故选项D不正确.
故选:B.
13.(24-25高一下·湖北黄石·期末)在对某校高三学生体质健康状况的调查中,按照性别比例进行分层随机抽样.已知抽取了男生80人,女生120人,其方差分别为15,10,由此估计样本的方差的最小值为( )
A.10 B.12 C.13 D.15
【答案】B
【分析】根据题意,设男生体质健康状况的平均数为,女生的平均数为,总体的平均数为,方差为,结合方差的公式,分析选项,即可求解.
【详解】设男生体质健康状况的平均数为,女生的平均数为,总体的平均数为,方差为,
则,
,
.
故选:B.
14.标志重捕法是指的是在一定范围内,对活动能力强、活动范围较大的动物种群进行粗略估算的一种生物统计方法,是根据自由活动的生物在一定区域内被调查与自然个体数的比例关系对自然个体总数进行数学推断.在被调查种群的生存环境中,捕获一部分个体,将这些个体进行标志后再放回原来的环境,经过一段时间后进行重捕,根据重捕中标志个体占总捕获数的比例来估计该种群的数量.标志重捕法估算种群密度是基于以下几种假设:①标记个体与未标记个体在重捕时被捕获的概率相等;②在调查期内标记的个体没有死亡,没有迁出,标记物没有脱落;③标记个体在种群中均匀分布.若应用标志重捕法调查鱼的种群密度,则下列捕鱼过程会导致估算结果与实际情况误差较大的是( ).
A.第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼
B.第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
C.第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼
D.第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
【答案】D
【分析】先计算出理论数量,分别分析四个选项,结合公式,得到ABC选项,采用标志重捕法估算出的种群数量与实际种群数量大致相等;D选项,采用标志重捕法估算出的种群数量越等于种群中大鱼数量,与实际种群数量相比小.
【详解】理论计算公式为,其中为估算的种群数值,为第一次捕获并标记的个体,
为一段时间后,在原来的捕获点再次捕获的个体数,为二次捕获的个体中有标记的数量,
转换后得,
假设池塘中的鱼分为大鱼和小鱼,大鱼是指用大网和小网均能捕获的鱼,小鱼指仅能用小网能捕获的鱼,
A选项,第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼,
第一次用小网眼的渔网捕鱼,,其中为捕获并标记的大鱼,为捕获并标记的小鱼,
设为池塘中实际的大鱼数,为池塘中实际的小鱼数,为池塘中实际的鱼条数,
则,
标记后全部放回池塘后,池塘中被标记的大鱼占全部大鱼比例为,被标记的小鱼占全部小鱼比例为,
假设每条鱼被捕获的概率相等,故,
第二次捕获的大鱼条中,理论上含标记的大鱼有,
第二次捕获的小鱼条中,理论中含标记的小鱼有,
故,
故总的标记条数为,
所以,又,故,
结论:若两次捕鱼都用小网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
B选项,第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
第一次用小网眼的渔网捕鱼,,其中为捕获并标记的大鱼,为捕获并标记的小鱼,
设为池塘中实际的大鱼数,为池塘中实际的小鱼数,
标记后全部放回池塘后,池塘中被标记的大鱼占全部大鱼比例为,被标记的小鱼占全部小鱼比例为,
假设每条鱼被捕获的概率相等,故,其中为池塘中实际的鱼条数,
第二次用大网眼渔网捕鱼,捕获的全部是大鱼,即,
理论上,,故,又,故,
结论:第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
C选项,第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼,
第一次用大网眼的渔网捕鱼,,标记后将鱼全部放回到池塘后,
池塘中被标记的大鱼占全部大鱼比例为,
第二次用小网眼渔网捕鱼,捕获的鱼中既有大鱼也有小鱼,,
由于第一次用大网眼渔网捕鱼,标记的均为大鱼,故第二次捕获的鱼中,只有大鱼也有可能被标记,
理论上,,
其中,
因为每条鱼捕获的概率相等,所以第二次用小网眼渔网捕获的鱼中,
大鱼和小鱼的比例与池塘中的大鱼和小鱼的比例相等,即,
所以,
结论:第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
D选项,第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
第一次用大网眼的渔网捕鱼,,标记后将鱼全部放回到池塘后,
池塘中被标记的大鱼占全部大鱼比例为,
第二次用大网眼渔网捕鱼,捕获的全部是大鱼,即,
理论上,,故,又,故,
结论:第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量约等于种群中大鱼数量,与实际种群数量相比小,误差大;
故选:D
15.(25-26高一下·江西景德镇·月考)已知一组数据由5个正整数组成,下列描述中,能确保这组数据中一定没有出现8的是( )
A.平均数为4,中位数3 B.平均数为4,众数为4
C.平均数为4,方差为3.6 D.中位数为5,方差为3.6
【答案】C
【分析】对于ABD:举反例说明即可;对于C:假设成立,可得,,结合基本不等式分析判断.
【详解】对于选项A:例如1,1,3,7,8,平均数为4,中位数3,故A错误;
对于选项B:例如1,3,4,4,8,平均数为4,众数为4,故B错误;
对于选项D:例如2,5,5,5,8,中位数为5,方差为3.6,故D错误;
对于选项C:假设出现8,设5个正整数为,其平均数为4,方差为3.6,
则,即,
且,可得,
因为,,,,,
当且仅当时,等号成立,
则,
可得,即,显然不成立,
假设不成立,所以一定没有出现8,故C正确.
16.(多选题)(24-25高一下·河北雄安·期末)某城市为了解不同年龄段市民对垃圾分类政策的支持情况,对参与同卷调查的市民按老、中、青三十年龄段进行统计,发现三个年龄段的人数比例为4∶3∶3.现用按比例分层随机抽样的方法从这些市民中抽取n名进行深入访谈,若老年市民抽到80人,则下列结论正确的是( )
A.中年市民抽到60人
B.青年市民抽到90人
C.
D.抽取的中年与青年市民人数之和比老年市民多40人
【答案】ACD
【分析】由分层抽样的性质逐一验算即可.
【详解】设中年市民、青年市民抽到的人数为,
从而,解得,而,
抽取的中年与青年市民人数之和减去老年市民人数:,故ACD正确,B错误.
故选:ACD.
17.(多选题)(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
【答案】ABD
【分析】根据扇形图及条形图得出5条线路的各个数据,再结合选项分别判断即可.
【详解】因为2025年高明线的参与人数是2016年的2倍,则2016年的高明线的参与人数是万人,
对于A:根据扇形图得出万,所以2016年佛山50公里徒步总的参与人数是20万,A选项正确;
2016年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
2025年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
对于B:因为,2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和,B选项正确;
对于C:五条线的参与人数2025年与2016年相比增加人数最少的是高明线,C选项错误;
对于D:南海线的参与人数2025年与2016年相比增长率,顺德线的参与人数2025年与2016年相比增长率,
禅城线的参与人数2025年与2016年相比增长率,三水线的参与人数2025年与2016年相比增长率,
高明线的参与人数2025年与2016年相比增长率,所以五条线的参与人数2025年与2016年相比增长率最高的是南海线,D选项正确;
故选:ABD.
18.(多选题)(25-26高一下·江苏南京·期中)若是样本数据:,,,的平均数(,,,不全相等),则( )
A.,,,的极差等于,,,,的极差
B.,,,的平均数等于,,,,的平均数
C.,,,的中位数等于,,,,的中位数
D.,,,的标准差大于,,,,的标准差
【答案】ABD
【分析】由统计中的数学特征进行计算即可.
【详解】不妨设,此时,A中极差均为,故A对;
,所以,故B对;
C中前者中位数为,后者中位数为或或,故C错;
D中前者标准差为,
后者标准差为,故D对.
19.(多选题)一组互不相等的数据从小到大排列为…,去掉后,则( )
A.极差变大 B.平均数变大 C.中位数变小 D.分位数变大
【答案】BD
【详解】设数据为,去掉后数据为.
A:原极差为,新极差为,由于,所以新极差变小,故A错误.
B:原平均数为,新平均数为,
差值为,所以新平均数变大,故B正确.
C:原中位数为,新中位数为,差值为,新中位数变大,故C错误.
D:原分位数,,向上取整,所以为,新分位数则为,差值为,新分位数变大,故D正确.
20.(多选题)海水养殖场进行某水产品两种养殖方法的产量对比,甲试验区选择第一种养殖方法,乙试验区选择第二种养殖方法.收获时,从两个试验区各随机抽取了100个网箱,测量各箱水产品的产量(单位:千克),其频率分布直方图如下图所示.
记事件C=“乙试验区产量不低于19千克”,根据直方图得到的估计值为0.70,则( )
A.乙试验区产量频率分布直方图中,
B.甲试验区产量的众数大于乙试验区产量的众数
C.甲试验区产量的平均数小于乙试验区产量的平均数
D.甲试验区产量的75%分位数大于乙试验区产量的中位数
【答案】AC
【分析】根据频率分布直方图的概率公式、众数、平均数、百分位数和中位数计算判断各个选项;
【详解】对于A,记事件C=“乙试验区产量不低于19千克”,根据直方图得到的估计值为0.70,
则,
解得,A正确;
对于B,甲试验区产量的众数为,乙试验区产量的众数为,
甲试验区产量的众数小于乙试验区产量的众数,B错误;
对于C,甲试验区产量的平均数为
乙试验区产量的平均数为
甲试验区产量的平均数小于乙试验区产量的平均数,C正确;
对于D,设甲试验区产量的75%分位数为,则,
解得
设乙试验区产量的中位数为,则,解得
甲试验区产量的75%分位数小于乙试验区产量的中位数,D错误;
故选:AC.
21.(多选题)(25-26高一下·甘肃酒泉·期中)有一组样本数据,其平均数为5,方差为,中位数为.在这组数中,去掉一个最大的数10和一个最小的数1,余下8个数据的中位数为,方差为,极差为,则( )
A. B. C. D.
【答案】AD
【分析】根据平均数和方差的运算公式,结合中位数的定义、极差的运算公式逐一判断即可.
【详解】不妨设,则.
因为与的中位数都是,
所以,故A正确.
当时,,故B错误.
,故C错误.
由已知得.
因为,所以,
去掉一个最大的数10和一个最小的数1,余下8个数据的和为,
所以由
,
所以余下8个数据的方差
所以,故D正确.
22.(多选题)(24-25高一下·福建福州·期末)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是( )
A.
B.估计该年级学生跳绳次数的分位数约为
C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为
D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为
【答案】BD
【分析】对于A选项,频率分布直方图里各长方形面积和为,把各区间频率系数相加乘组距得到总面积表达式,令其等于,即可求出;
对于B选项,先算出前几个矩形面积和,通过与比较,确定分位数所在区间.再根据百分位数的定义,用已有的面积和加上该区间的面积等于,列方程求解百分位数;
对于C选项,根据加权平均的方法,以比例为权重乘以对应数值,即可求解平均数;
对于D选项,根据方差公式,以不同区域的比例为权重,分别计算每个区间数值与平均数差值的平方加上给定值,再求和得到方差.
【详解】对于A,由频率分布直方图中各长方形面积和为,得,解得,故A错误;
对于B,根据百分位数的计算,假设该年级学生跳绳次数的分位数为,则,又,所以解得,故B正确;
对于C,该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为,故C错误;
对于D,该年级学生跳绳次数在次及以上的学生跳绳次数的方差为,故D正确.
故选:BD.
23.(24-25高一下·广东惠州·阶段检测)高一年级有男生490人,女生510人,按男生、女生进行分层,抽取总样本量为100.通过分层随机抽样的方法得到男生、女生的平均身高为170.2cm和160.8cm.则估计高一年级全体学生的平均身高为__________cm.(结果保留一位小数)
【答案】165.4
【分析】先由分层抽样比计算抽取男女生人数,再求平均数可得.
【详解】设在男生、女生中分别抽取m名和n名,
则,解得,.
据此可以估计高二年级全体学生的平均身高为
.
故答案为:165.4.
24.在一次数学测验中,某小组的7位同学的成绩分别为:109,116,122,126,131,134,140,则这7位同学成绩的上四分位数与下四分位数的差为__________.
【答案】18
【分析】根据四分位数的定义分别求出上四分位数与下四分位数,再计算它们的差值.
【详解】计算下四分位数,已知数据个数,下四分位数即第分位数,此时,则.
由于1.75不是整数,将1.75向上取整得到,所以下四分位数是排序后第个数据,即.
计算上四分位数,上四分位数即第分位数,此时,则.
由于5.25不是整数,将5.25向上取整得到,所以上四分位数是排序后第个数据,即.
上四分位数与下四分位数的差为.
故答案为:18.
25.某公司为了调查员工的体重(单位:千克),因为女员工远多于男员工,所以按性别分层,用按比例分层随机抽样的方法抽取样本,已知抽取样本中所有员工体重的方差为120,其中女员工的平均体重为50,方差为50,男员工的平均体重为70,方差为30.若样本中有21名男员工,则样本中女员工的人数为________.
【答案】63
【分析】由题意,知样本中男、女员工的平均体重和方差分别为,,,,所占权重分别为和,根据分层抽样的均值和方差公式列方程求出的值,即可求得女员工的人数.
【详解】由题意,记样本中女员工的平均体重和方差分别为,,所占权重为,
男员工的平均体重和方差分别为,,则所占权重为,
则样本中全部员工的平均体重为,
依题意,方差为
.
化简得,解得 或(舍).
所以女员工的人数为: .
故答案为:63.
26.(25-26高一下·山西忻州·期末)某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了名学生的成绩作为样本进行统计,将其成绩(满分:分)分成、、、六组,得到如图所示频率分布直方图.
(1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若根据这次成绩,学校准备给成绩较高的前的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数;
(3)若落在中的样本数据的平均数是,方差是,落在中的样本数据的平均数是,方差是,求这两组数据的总平均数和方差.
【答案】(1),平均数为
(2)
(3),
【分析】(1)根据频率之和为,求图中的值,用该组区间的中点值代表同组数据计算样本数据的平均数;
(2)求出第百分位数可得结果;
(3)利用分层抽样的平均数公式和方差公式可求得结果.
【详解】(1)由题意可得,解得,
平均数为.
(2)设“获得该荣誉证书的最低分数”为,
由于分数介于的频率为、分数介于的频率为,
故获得该荣誉证书的最低分数介于之间,
则有,解得.
(3)成绩位于的学生人数为,
成绩位于的学生人数为,
因为落在中的样本数据的平均数是,方差是,
落在中的样本数据的平均数是,方差是,
所以两组数据的总平均数,
总方差为.
27.(24-25高一下·四川巴中·期末)统计学家将战争中摧毁敌军的战机序列号作为样本,用样本估计总体的方法推断敌军每年生产的战机数量.假设敌军某年生产的战机数量为,摧毁某年生产的架战机编号从小到大为,,,…,,最大的编号为,摧毁敌军战机是随机的,摧毁战机的编号,,,…,,相当于从中随机抽取的个整数,这个数将区间分成个小区间(如下图),可以用前个区间的平均长度估计所有个区间的平均长度进而得到的估计值.
已知在某次战斗中摧毁敌军的战机编号为:2,5,7,13,15,17,21,据此回答下列问题.
(1)根据材料估计敌军生产的战机数量;
(2)已知敌军所有现役战机分为三个等级(四代战机,四代半战机,五代机),通过分层抽样调查三类战机的飞行高度,得到各个等级飞行高度的样本平均数为,,.
(ⅰ)根据上述信息是否可以估计敌军所有现役战机的平均飞行高度?若不能,还需要什么条件,请补充条件并写出估计式;
(ⅱ)若敌军现役战机是按照比例生产的,四代战机,四代半战机,五代机的战机数量分别为,,,样本量分别为,,,据此证明:
【答案】(1)24架;
(2)(ⅰ)不能,需要知道这三个等级战机具体的个体数量,,,或者抽取样本的数量,,,估计式见解析;(ⅱ)证明见解析.
【分析】(1)由题设得求参数,即可得;
(2)(i)根据题意需要知道这三个等级战机具体的个体数量,,,或者抽取样本的数量,,,进而写出公式;(ii)按比例在各层抽取的且各层抽取的样本量分别为、、,得,应用分层等比例性质即可证.
【详解】(1)因为可用估计,所以,得,故敌军每年生产战机24架.
(2)(ⅰ)不能估计敌军所有现役战机的平均飞行高度,
需要知道这三个等级战机具体的个体数量,,,或者抽取样本的数量,,,
估计式为或
(ⅱ)因为样本是按比例在各层抽取的且各层抽取的样本量分别为、、,
所以,则,
所以,,,
又因为样本平均数为,
所以.
1 / 6
学科网(北京)股份有限公司
$