内容正文:
专题06 统计
内容导航
考点聚焦:核心考点+高考考点,有的放矢
重点速记:知识点和关键点梳理,查漏补缺
考点巩固:必考题型讲透练透,能力提升
复习提升:真题感知+提升专练,全面突破
知识点1:获取数据的基本途径及相关概念
1、普查与抽查
(1)普查:对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)抽查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况做出估计和推断的调查方法,称为抽样调查,简称抽查.
2、统计的相关概念
(1)总体:所要考察对象的全体叫做总体.
(2)样本:从总体中抽取出的一部分个体组成的集合叫做样本.
(3)个体:总体中的每一个考察对象叫做个体.
(4)样本容量:样本中个体的数目叫做样本容量.
(5)样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据.
3、获取数据的基本途径
(1)直接获取:通过社会调查或观察、试验等渠道获取数据.直接数据或一手数据.主要通过问卷调查、试验收集等.
(2)间接获取:借助各种媒介包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据.间接数据或二手数据.主要通过报纸杂志、统计报表和年鉴、广播、电视或互联网.
知识点2:抽样
1、抽签法
(1)抽签法的定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本.
(2)抽签法的实施步骤:用抽签法从个数为的总体中抽取一个容量为的样本的步骤
①将总体中的个个体编号;
②将这个号码写在形状、大小相同的号签上;
③将号签放在同一箱中,并搅拌均匀;
④从箱中每次抽出1个号签,连续抽取次;
⑤将总体中与抽到的号签的编号一致的个个体取出.
2、随机数法
(1)随机数法的定义:按一定规则从随机数表中选取号码的抽样方法叫作随机数表.
(2)随机数表法实施步骤:
①将总体中个体编号(每个号码位数一致);
②在随机数表中任选一个数;
③从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;
④根据选定的号码抽取样本.
3、简单随机抽样
从个体数为的总体中逐步不放回地取出个个体作为样本(),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.
抽签法和随机数表法都是简单随机抽样.
4、分层随机抽样
(1)定义:将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫作分层抽样,所分成的各个部分称为“层”.
(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(3)分层随机抽样的相关计算关系:
①=;
②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
知识点3:统计图表
1、扇形统计图、折线统计图、频数直方图
(1)扇形统计图:用整个圆表示总体,扇形统计图中,每一个扇形的圆心角以及弧长都与这一部分表示的数据大小成正比.
(2)折线统计图:用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
(3)频数直方图:一条轴上显示的是数据分组,另一条轴上对应的是在对应组内的数据的数量.
2、频率直方图
(1)频率直方图的定义:把横轴均分成若干段,每一段对应的长度称为组距,然后以此段位底作矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了直方图,称为频率直方图.
(2)频率折线图的作法:将频率直方图中各个矩形的上底的中点顺次连接起来,并将两边端点向外延伸半个组距,就得到频率折线图,简称折线图.
(3)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
(4)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
知识点4:用样本估计总体
1、平均数
(1)均值:一般地,我们把总体中所有数据的算术平均数称为总体的均值,它通常可以代表总体的水平.
(2)平均数:用作为表示这个量的理想近似值,称为这个数据的平均数,一般记为.
2、众数与中位数
(1)众数:一般地,我们将数据集合中出现次数最多的那个数据叫做该数据集合的众数。
(2)中位数:一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在最中间的数据就是这组数据的中位数;如果数据的个数是偶数,那么排在最中间的两个数即为这组数据的中位数.
3、方差与标准差
(1)方差与标准差的定义:设一组样本数据,其平均数为,则称为这个样本的方差,其算数平方根为样本的标准差,分别简称样本方差、样本标准差.
(2)方差的计算
①
②一般地,若取值为的频率分别为,则其方差为.
(3)标准差、方差的意义
①标准差、方差描述了一组数据围绕平均数波动的大小,方差、标准差越大,数据离散程度越大;标准差、方差越小,数据的离散程度越小,标准差的大小不会超过极差.
②标准差、方差的取值范围为标准差、方差为0时,样本各数据相等,说明数据没有波动幅度,数据没有离散型.
4、百分位数
(1)百分位数的定义:一般地,一组数据的百分位数是这样一个值,它使得这组数据中至少的数据小于或等于,且至少有的数据大于或等于这个值.
(2)计算有个数据的大样本的百分位数
第1步,将所有数值按从小到大的顺序排列;
第2步,计算;
第3步,如果结果为正数,那么百分位数位于第位和下一位数之间,通常取这两个位置上数值的平均数为百分位数;
第4步,如果不是整数,那么将其向上取整(即其整数部分加上1,),在该位置上的数值即为百分位数.
(3)四分位数:我们把中位数、25百分位数和75百分位数称为四分位数.
【题型1 普查与抽查的理解与辨析】
高妙技法
选择普查与抽样调查的大体标准是当总体样本量大时,通常是通过科学的抽样方法抽取具有代表性的样本进行抽查;当总体样本较少时,如果所进行的调查没有破坏性,那么可以选择普查,但是,若所进行的调查具有破坏性,无论总样本量是多少,只能选择抽样调查.
【注意】区分某项调查是用普查还是抽样调查的关键是看该项调查是全部调查还是部分调查.
1.(24-25高一下·河北邯郸·月考)(多选)下列调查中,适宜采用抽样调查的是( )
A.调查某市小学生每天的运动时间
B.农业科技人员调查某块地今年麦穗的单穗平均质量
C.某公司初步发现一位职员患有甲肝,对此公司职员进行检查
D.调查某快餐店中全部8位店员的生活质量情况
【答案】AB
【解析】对于A,调查某市小学生每天的运动时间只需抽取部分样本即可,适宜采用抽样调查,即A正确;
对于B,调查某块地今年麦穗的单穗平均质量只需抽取部分麦穗作为样本,
适宜采用抽样调查,即B正确;
对于C,对此公司职员进行检查需检查全体员工才能确定患有甲肝的员工,
不适宜采用抽样调查,即C错误;
对于D,因为需要调查某快餐店中全部8位店员的生活质量情况,
所以不适宜采用抽样调查,即D错误.故选:AB
2.(24-25高一上·江西·月考)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
【答案】B
【解析】全面调查是对调查对象的所有单位一一进行调查的调查方式,
A. 查一个水库所有鱼中草鱼所占的比例.,调查数目较多,不适合全面调查;
B. 调查一个县各村的粮食播种面积适合全面调查;
C.调查一批炮弹的杀伤半径,调查数目较多,可以使用抽样调查;
D. 调查一批玉米种子的发芽率,调查数目较多,且具有破坏性,不适合全面调查.故选:B.
3.(24-25高一上·陕西汉中·月考)在以下调查中,适合用全面调查的是( )
A.了解一个班级学生的身高情况 B.了解一批水稻种子的发芽率
C.调查某城市居民的食品消费结构 D.调查某批次汽车的抗撞击能力
【答案】A
【解析】选项A:一个班级学生的身高情况,人数较少,适合用全面调查;
选项BCD数量较多,全面调查耗时耗力,适宜用抽样调查.故选:A.
4.(23-24高一下·内蒙古通辽·月考)下列调查,比较适用普查而不适用抽样调查方式的是( )
A.为了了解中央电视台春节联欢晚会的收视率
B.为了了解高一某班的每个学生星期六晚上的睡眠时间
C.为了了解夏季冷饮市场上冰淇淋的质量情况
D.为了考查一片实验田某种水稻的穗长情况
【答案】B
【解析】A选项中做普查时数量太大,且该调查对调查结果准确性的要求不高,
适合采用抽样调查的方式;
B选项中班级人数有限,比较容易调查,因而适合普查;
C选项中数量大并且时间长,不适合普查;
D选项中普查时数量太大,要费太大的人力物力,得不偿失,不适合普查.故选:B.
【题型2 总体与样本的相关概念辨析】
高妙技法
求解此类问题时,要注意对概念的明确,明确总体、样本、样本量、总体的分布等含义,从而在题设条件中来选.
5.(23-24高一下·山西太原·期末)为了解某校高中3000名学生的身高情况,从中抽取了100名学生进行调查,则这100名学生是( )
A.总体 B.样本 C.样本量 D.个体
【答案】B
【解析】依题意,从中抽取了100名学生进行调查,则这100名学生是一组样本.故选:B
6.(23-24高二·上海·课堂例题)某高校研究人员希望调查该校大学生平均每天的自习时间.他调查了100名大学生,发现他们每天的平均自习时间是3.5h.这里的总体是( )
A.该校的所有大学生
B.该校所有大学生的平均每天自习时间
C.所调查的100名大学生
D.所调查的100名大学生的平均每天自习时间
【答案】B
【解析】某高校研究人员希望调查该校大学生平均每天的自习时间.
他调查了100名大学生,发现他们每天的平均自习时间是3.5h,
这里的总体是该校所有大学生的平均每天自习时间.故选:B.
7.(23-24高一下·天津河东·期末)为确保食品安全,某市质检部门检查1000袋方便面的质量,抽查总量的.在这个问题中,下列说法正确的是( )
A.总体是指这1000袋方便面 B.个体是1袋方便面
C.样本是按抽取的20袋方便面 D.样本容量为20
【答案】D
【解析】对于A,总体是指这1000袋方便面的质量,故A错误;
对于B,个体是指1袋方便面的质量,故B错误;
对于C,样本是指按照抽取的20袋方便面的质量,故C错误;
对于D,样本容量为,故D正确.故选:D.
8.(23-24高一上·陕西汉中·期末)(多选)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有( )
A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本
C.样本容量为10 D.每个运动员被抽到的机会相等
【答案】ACD
【解析】对于A,1000名运动员的年龄是总体,故A正确;
对于B,所抽取的10名运动员的年龄是一个样本,故B错误;
对于C,样本容量为10,故C正确;
对于D,每个运动员被抽到的机会相等,故D正确.故选:ACD.
【题型3 获取数据的途径选择】
9.(24-25高一上·全国·课后作业)下列获取的数据属于直接数据的是( )
A.看报纸获得的数据 B.通过问卷调查获得的数据
C.通过网络获得的数据 D.听广播获得的数据
【答案】B
【解析】通过看报纸获得的数据,网络获得的数据以及听广播获得的数据叫做二手数据,故A、C、D均错误;
通过问卷调查获得的数据属于直接数据,故B正确.故选:B
10.(多选)影响获取数据可靠程度的因素包括( )
A.获取方法设计 B.所用专业测量设备的精度
C.调查人员的认真程度 D.数据的大小
【答案】ABC
【解析】数据的大小不影响获取数据可靠程度,其他三项均影响获取数据的可靠程度.故选:ABC.
11.(24-25高一上·全国·课后作业)研究下列问题,一般通过试验获取数据的是( )
A.某城市元旦前后的气温
B.某种新型电路元件使用寿命的测定
C.电视台想知道某一个节目的收视率
D.高中生日平均上网时间
【答案】B
【解析】对于A:某城市元旦前后的气温,一般通过观察获取数据,故A错误;
对于B:某种新型电路元件使用寿命的测定,一般通过试验获取数据,故B正确;
对于C:电视台想知道某一个节目的收视率,一般通过调查获取数据,故C错误;
对于D:高中生日平均上网时间,一般通过调查获取数据,故D错误.故选:B
12.(23-24高一下·江苏·期末)以下获取的数据不是通过查询获取的是( )
A.某领导想了解A市的大气环境质量,向当地有关部门咨询该市的PM2.5的浓度
B.张三利用互联网了解到某市居民平均寿命达到82.2岁
C.某中学为了了解学生对课堂禁用手机的认同度,进行了问卷调查
D.从某公司员工年度报告中获知某种信息
【答案】C
【解析】A,B,D都是通过查询获取的数据,C是通过调查获取的数据.故选:C.
【题型4 两种随机抽样的判断】
满分技法
1、简单随机抽样:从总体中随机选择样本,每个样本被选中的概率是相同的.每个单位被选中的机会是均等的,抽样过程不涉及对总体的分组,适用于总体相对均匀的情况.
2、分层随机抽样:首先将总体分成不同的层或组,这些层在某些特征上是同质的,然后在每一层内进行简单随机抽样.总体被分成多个层,每层内部具有相似的特征.每一层的样本大小可以相同,也可以根据层的大小或重要性进行调整.可以提高样本的代表性.
13.(23-24高一下·安徽马鞍山·月考)某高中为了解三个年级学生的课业负担情况,拟从这三个年级中抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 B.简单随机抽样 C.分层随机抽样 D.随机数法
【答案】C
【解析】依题意为了解三个年级学生的课业负担情况,由于三个年级作业情况差异比较明显,
故最合理的抽样方法是分层随机抽样.故选:C
14.(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【答案】B
【解析】因为男、女生的阅读时间差异不大,而小学、初中、高中三个学段学生的课外阅读时间存在较大差异,
故应按照学段分层随机抽样.故选:B.
15.①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【答案】A
【解析】对于①:考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
对于②:总体包含的个体较少,用简单随机抽样比较恰当.故选:A
16.(23-24高一下·广西来宾·期末)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台进行质量检测;②在某校800名学生中,型、型、B型和型血的学生依次有人.为了研究血型与色弱的关系,需从中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法分别是( )
A.①②都采用简单随机抽样
B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样
D.①采用分层随机抽样,②采用简单随机抽样
【答案】C
【解析】由题意对于①,40台刚出厂的大型挖掘机被抽取的可能性一样,故为简单随机抽样,
对于②,为了研究血型与色弱的关系,
说明某校800名学生被抽取的可能性要按照血型比例分层抽取,故为分层随机抽样.故选:C.
【题型5 随机数法的特征及应用】
高妙技法
应用随机数表法的两个关键点:
1、确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;
2、读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
17.(24-25高一下·湖南邵阳·月考)从编号为01,02,…,49,50的50个个体中利用下面的随机数表选取5个个体,选取方法从随机数表第1行第5列的数开始由左到右依次抽取,则选出来的第4个个体的编号为( )
7816
6572
0812
1463
0782
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.14 B.07 C.32 D.43
【答案】B
【解析】依题意选出的个体编号依次为:,,,,……,
所以选出来的第4个个体的编号为.故选:B.
18.(24-25高一下·河北石家庄·月考)某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.328 B.253 C.007 D.860
【答案】A
【解析】从表中第5行第6列开始向右读取数据为:
253,313,457(舍),860(舍),736(舍),253(舍),007,328,
所以第四个数为328.故选:A.
19.(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
【答案】D
【解析】依题意从第2行第7列开始的数为67(舍去),62(舍去),42(舍去),81(舍去),14,
57(舍去),20,42(舍去),53(舍去),32,37,32(舍去),14(舍去),16,
则满足条件的5个样本编号为14,20,32,37,16,则第5个编号为16.故选:D
20.(24-25高一下·山东新泰·月考)某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第5个数的编号是 .
1676622766 5650267107 3290797853 1355385859 8897541410
1256859926 9682731099 1696729315 5712101421 8826498176
5559563564 3854824622 3162430990 0618443253 2383013030
【答案】729
【解析】从685开始向右数,即685,992,696,827,310,991,696,729,
跳过992,991,696重复,跳过,
所以第5个数字为729.
【题型6 分层随机抽样中的相关计算】
高妙技法
解决分层抽样的两个常用公式
先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.
(1)抽样比==;
(2)层1的容量:层2的容量:层3的容量=样本中层1的容量:样本中层2的容量:样本中层3的容量.
21.(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
【答案】D
【解析】依题意高一年级应抽取的人数为人.故选:D.
22.(24-25高一上·北京石景山·期末)某田径队有运动员人,其中男运动员人,女运动员人.为了解该田径队运动员的睡眠情况,采用分层抽样的方法获得一个容量为的样本,那么应抽取男运动员的人数为( )
A. B. C. D.
【答案】B
【解析】由题得应抽取男运动员的人数为.故选:B.
23.(24-25高一下·河北邯郸·月考)中国古代科举制度始于隋而成于唐,兴盛于明、清两朝.明代会试分南卷、北卷、中卷,按的比例录取,若某年会试录取人数为400,则中卷录取人数为( )
A.40 B.70 C.110 D.150
【答案】A
【解析】依题意,中卷录取的比率为:,
故会试录取人数为400时,中卷录取人数为.故选:A.
24.(23-24高一下·江苏南通·月考)某工厂生产三种不同型号的产品,产量之比为2:3:5.现用分层抽样的方法抽取1个容量为的样本,若样本中种型号的产品有16件,则样本容量( )
A.40 B.60 C.80 D.100
【答案】C【解析】设种型号的产品有件,
因为三种不同型号的产品,产量之比为2:3:5,
所以种型号的产品有件,种型号的产品有件,
由已知可得,所以,故选:C.
【题型7 扇形图、折线图及条形图的应用】
高妙技法
1、条形图:一般与小长方形的宽无关,主要是高的值;要注意条形图横、纵坐标的含义;复合条形图是不同数据在同一条形图中反映,对相同横坐标含义进行对比,准确确定彼此间的差异.
2、折线图:可以观察点的个数,从而得到数据的数量,同时直观得出数据变化趋势以及变化幅度的大小,也可得到所有数据中的最大值与最小值,因而容易得到所要解决的问题数值,如果不同的折线图反映在同一坐标系中,可以已通过比较观察期波动程度大小,并进行优劣判断.
3、扇形图:需要运用各个圆心角或弧长得百分比,同时可清楚得到各部分与总体检的关系,用百分比×总体个体数,估算某含义的个体数.
25.(24-25高一下·河北·月考)在统计学中,月度同比是指本月份和上一年同月份相比较的增长率,月度环比是指本月份和上一个月份相比较的增长率.如图是国家统计局发布的2023年全国居民消费价格月度涨跌幅度折线图,则下列说法正确的是( )
A.2023年2月至6月居民的消费价格持续下降
B.2023年7月居民消费价格高于2022年同期
C.2023年4月居民消费价格环比上涨0.1%,同比下降0.1%
D.2023年8月的居民消费价格是全年最高的
【答案】A
【解析】对于A:2月至6月环比增长率分别是,
故消费价格持续下降;正确
对于B:由月度同比图可知2023年7月居民消费价格低于2022年同期;错误
对于C:2023年4月居民消费价格环比下降0.1%,同比上升0.1%,错误
对于D:虽然2023年8月的月度环比上涨幅度较大,
但仅根据环比数据不能直接得出8月的居民消费价格是全年最高的,
因为前面的月份价格也有变化情况,例如1月同比上涨,且后续月份价格变化复杂,
不能简单判断8月价格最高,错误.故选:A
26.(24-25高一下·云南大理·月考)(多选)我国在2024年的全国发电装机容量为33.5亿千瓦,包括水电、火电、核电、风电、太阳能发电,其占比如图所示,根据此扇形图,下列说法错误的是( )
A.2024年我国太阳能发电装机容量部分的扇形圆心角小于
B.2024年我国火电发电装机容量超过15亿千瓦
C.2024年我国火电发电装机容量超过新能源(太阳能、风电、核电)的发电装机容量
D.若2025年核电规模要达到2024年全国发电装机容量规模的,则还要再建设的核电的发电装机容量为3.35亿千瓦
【答案】ABC
【解析】太阳能发电装机容量占,超过,则扇形圆心角大于,A错误.
2024年我国火电发电装机容量占,因为,所以B错误.
2024年我国火电发电装机容量占,
新能源(太阳能、风电、核电)的发电装机容量占比和为,C错误.
还要再建设的核电的发电装机容量为亿千瓦,所以D正确.故选:ABC.
27.(24-25高一上·江西宜春·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则估计该校参加舞蹈社团的学生人数为( )
A.300 B.225 C.150 D.40
【答案】A
【解析】由条形图得合唱人数为70,演讲人数为30,由饼状图得合唱人数占比,
因此演讲人数占比为,舞蹈人数占比为,
用样本估计总体,估计该校参加舞蹈社团的人数为.故选:A.
28.(24-25高一下·甘肃·月考)(多选)如图1为某省2024年1~4月份快递业务量统计图,图2为该省2024年1~4月份快递业务收入统计图,对统计图理解正确的是( )
A.2024年月份快递业务量3月份最高,2月份最低,差值接近2000万件
B.2024年月份快递业务量同比增长率均超过,在3月份最高,和春节蛰伏后网购迎来喷涨有关
C.从两图中看,业务量与业务收入变化高度一致
D.从月份来看,业务量与业务收入有波动,但整体保持高速增长
【答案】ABC
【解析】对于A,由图1可知,快递业务量3月份为4397万件,2月份为2411万件,
差值为万件,故A正确;
对于B,由图1可知2024年月份快递业务量同比增长率均超过,
在3月份最高,故B正确;
对于C,由两图易知业务量从高到低是3月4月1月2月,
业务收入从高到低是3月4月1月2月,保持高度一致,故C正确;
对于D,由图2知业务收入2月比1月减少,4月比3月减少,
整体不具备高速增长之说,故D错误;故选:ABC.
【题型8 频率直方图的应用】
高妙技法
由频率分布直方图进行相关计算需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
29.(24-25高一上·江西抚州·月考)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组抽样结果绘成的频率分布直方图如图所示,则实数 .
【答案】
【解析】由图可得各分组频率之和为:
因各分组频率之和为1,则
30.(24-25高一下·广东广州·期中)为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为,则该班学生数学成绩在之间的学生人数是( )
A.32 B.27 C.24 D.33
【答案】D
【解析】高的比就是频率的比,所以各区间上的频率可依次设为,,,,,,
它们的和为,所以,
所以该班学生数学成绩在之间的学生人数的频率为,
则对应人数为.故选:D.
31.(23-24高一下·吉林·期末)随着卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第四组与第五组共有150人,第二组中女性球迷有75人,则第二组中男性球迷的人数为( )
A.140 B.120 C.100 D.80
【答案】C
【解析】由题意结合频率分布直方图可得,第四组与第五组的频率之和为,
第二组频率为.
因为第四组与第五组共有150人,所以样本容量,
所以第二组人数为,所以第二组中男性球迷人数为.故选:C.
32.(23-24高一下·山东济宁·期末)(多选)将样本容量为100的样本数据分为4组:,得到频率分布直方图如图所示,则下列说法中正确的是( )
A.样本数据分布在内的频率为0.32
B.样本数据分布在内的频数为40
C.样本数据分布在内的频数为40
D.估计总体数据大约有分布在内
【答案】ABC
【解析】对于A,由图可得,样本数据分布在内的频率为,故A正确;
对于B,由图可得,样本数据分布在内的频数为,故B正确;
对于C,由图可得,样本数据分布在内的频数为,故C正确;
对于D,由图可估计,总体数据分布在内的比例约为,故D错误.
故选:ABC.
【题型9 平均数、众数与中位数的求解】
高妙技法
利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
33.(24-25高三下·山西·月考)样本数据25,17,26,31,29,18,28,40的中位数为( )
A.31 B.29 C.30 D.27
【答案】D
【解析】样本数据按照从小到大的顺序排列为17,18,25,26,28,29,31,40,
中间的两个数为26,28,故中位数为.故选:D
34.(24-25高一下·广西贵港·月考)已知数据,,…,的平均数为4,那么数据,,…,的平均数为( )
A. B. C.1 D.17
【答案】B
【解析】由题意可得,即
所以.故选:B.
35.(24-25高一下·浙江金华·月考)已知某台机器生产一种零件,在10天中,每天生产的次品数为:1,0,2,0,4,3,4,1,3,3,则该机器生产次品数的中位数为 .
【答案】2.5
【解析】10天中的次品数由小到大排成一列为:0,0, 1,1,2,3,3,3,4,4,
所以该机床的次品数的中位数为.
36.(23-24高一下·云南大理·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的中位数、平均数和众数,则的大小关系为 .
【答案】
【解析】根据直方图矩形高低以及数据的分布趋势判断,可得出结论:众数是最高矩形的中点横坐标,
因此众数在第二列的中点处.
因为直方图第一、二、三、四列高矩形较多,且在右边拖尾低矩形有三列,
所以中位数大于众数,
右边拖尾的有三列,所以平均数大于中位数,因此有.
【题型10 方差与标准差的计算】
高妙技法
方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为.
37.(2025·广东深圳·二模)下列各组数据中方差最大的一组是( )
A.6,6,6,6,6 B.5,5,6,7,7 C.4,5,6,7,8 D.4,4,6,8,8
【答案】D
【解析】对于A:
数据全部为6,相等,没有波动,所以方差为0.
对于B:平均数为,方差为.
对于C:平均数为,方差为.
对于D:平均数为,方差为.
通过比较可知,选项D的方差最大.故选:D.
38.(24-25高一下·湖南长沙·月考)设一组样本数据,,…,的方差为3,则数据,,…,的方差为( )
A.0.03 B.0.3 C.3 D.30
【答案】A
【解析】由已知条件可知样本数据,,,的平均数,
方差,
则数据,,…,的平均数为,
所以这组数据的方差
.故选:A.
39.(24-25高一上·河南驻马店·期末)某高中一、二、三年级的学生人数分别为1000、2000、3000,为调查该校学生的身高情况,采用分层抽样的方法从全体学生中抽取30人,抽出的一、二、三年级学生的平均身高分别为、、,则估计该校学生的平均身高是 .
【答案】169
【解析】由题意得所抽取的高中一、二、三年级的学生人数分别为
,,,
因为抽出的一、二、三年级学生的平均身高分别为、、,
所以这30人的平均身高为,
所以该校学生的平均身高约为169cm.
40.(2024高二上·云南·学业考试)学校从甲、乙两名射击运动员中推荐一人参加市中学生运动会,甲、乙两人参加测试的成绩(单位:环)如下:
甲:7,8,8,9,7,8,8,9,7,9;
乙:6,8,7,7,8,9,10,7,9,9.
经计算得:,,,.
根据上述信息,学校应推荐 参加市中学生运动会.
【答案】甲
【解析】因为,,
所以两人平均水平相当,但甲发挥较为稳定,故学校应推荐甲参加市中学生运动会.
【题型11 k百分位数的计算】
高妙技法
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
41.(24-25高二下·广东江门·期中)现有一组数据1.3,1.2,1.2,1.4,1.6,1.3,1.1,则这组数据的分位数为( )
A.1.2 B.1.3 C.1.4 D.1.6
【答案】B
【解析】从小到大排序:1.1 1.2 1.2 1.3 1.3 1.4 1.6,
,
所以第60百分位数为第五个数1.3,故选:B
42.(24-25高一下·安徽·月考)某班级的老师随机抽查了该班12名同学周末在家学习的时长(单位:),所得数据如下:3,6,7,4,5,6,6,7,8,5,4,6,则这组数据的分位数为( )
A.6.5 B.6 C.5.5 D.5
【答案】A
【解析】由题意,将数据按从小到大的顺序排列,可得,
因为,所以分位数为第九位和第十位的平均数,为.故选:A.
43.(24-25高一下·广东·月考)已知27名女生身高的数据排序如下:148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0 158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0 163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0则第一四分位数是( )
A.155.0 B.155.5 C.161.0 D.164.0
【答案】B
【解析】由题意,27名女生身高的数据排序,则,
所以27名女生身高的数据的第一四分位数是数据的第7个数,即为.故选:B.
44.(24-25高一下·海南海口·月考)已知一组数据a,b,c,d,e,f的第40百分位数与方差分别为m,n,则新数据,,,,,的第40百分位数与方差分别为( )
A.m,n B.2m, C., D.,4n
【答案】D
【解析】一组数据a,b,c,d,e,f的第40百分位数为m,
则新数据,,,,,的第40百分位数为;
一组数据a,b,c,d,e,f的第40百分位数与方差为n,
则新数据,,,,,的方差为.故选:D.
提升专练
一、单选题
1.(23-24高一下·江苏无锡·月考)某单位有青年职工160人,中年职工人数180人,老年职工有90人,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.16 B.18 C.27 D.36
【答案】B
【解析】因为样本中有青年职工32人,所以抽样比为:,
所以样本中的老年职工人数为,故选:B.
2.(24-25高一下·山西·月考)若数据,,,,的方差为9,则数据,,,,的方差为( )
A.2007 B.1989 C.36 D.18
【答案】C
【解析】因数据,,,,的方差为,
则数据,,,,的方差
应是.故选:C.
3.(24-25高一下·河北邯郸·月考)一组单调递增数据,,…,的平均数、极差、中位数、方差依次为,,m,,构造一组新的数据,,…,,其中,新数据的平均数、极差、中位数、方差依次为,,n,,则下列结论中不正确的是( )
A.若,则 B.
C.若,则 D.若,则
【答案】A
【解析】对于A:因为,所以,因为,所以,故A错误;
对于B:因为数据,,…,单调递增,所以数据,,…,也单调递增,
所以极差,,故B正确;
对于C:由A知,因为,所以,故C正确;
对于D:因为,所以,即,
因为,所以,故D正确.故选:A.
二、多选题
4.(24-25高一下·河北·月考)(多选)在一次射击决赛中,某位选手射击了一组子弹,得分分别为,,则( )
A.该组数据的极差为1.8
B.该组数据的众数为10.1
C.该组数据的分位数为9.9
D.若该组数据去掉一个数得到一组新数据,则这两组数据的平均数可能相等
【答案】ACD
【解析】对于A项,极差等于,故A正确;
对于B项,该组数据的众数为10.1和,故B错误;
对于C项,,故分位数为,故C正确;
对于D项,平均数等于,
去掉后,这两组数据的平均数相等,故D正确.故选:ACD.
5.(23-24高一下·山东烟台·期末)(多选)已知一组样本数据满足,则去掉后的新数据与原数据相比( )
A.平均数不变 B.中位数不变
C.方差不变 D.极差不变
【答案】ABD
【解析】由得.
对于A: 的平均数,
又的平均数等于,故A正确;
对于B:的中位数为,
又的中位数为,故B正确;
对于C:的方差等于,
又的方差等于,故C错误;
对于D:与的极差都等于,故D正确.故选:ABD.
6.(23-24高一上·江西景德镇·月考)(多选)某商户收集并整理了其在2023年1月到8月线上和线下收入的数据,并绘制如图所示的折线图,则下列结论正确的是( )
A.该商户这8个月中,月收入最高的是7月
B.该商户这8个月的线上总收入低于线下总收入
C.该商户这8个月中,线上、线下收入相差最小的是7月
D.该商户这8个月中,月收入不少于17万元的频率是
【答案】ACD
【解析】对于A:该商户这8个月中,计算可得月收入分别为16万元,13.5万元,16万元,17万元,17万元,16万元,20万元,17.5万元,月收入最高的是7月,A正确;
对于B:该商户这8个月的线上总收入为72万元,线下总收入为61万元,B错误;
对于C:根据折线图可看出线上、线下收入折线距离最近的时7月份,
即该商户这8个月中线上、线下收入相差最小的是7月,C正确;
对于D:根据A选项可知该商户这8个月中,月收入不少于17万元的有4个月,
故所求频率为,D正确.故选:ACD
三、填空题
7.(24-25高二下·上海奉贤·期中)某校从450名同学中用随机数法抽取30人参加这一项调查.将这450名同学编号为,假设从第1行第7列的数字开始,则第5个被抽到的同学的编号为 .
64844217 55721754 55068331
04744767 21763350 25839212
06766301 63785916 95556719
【答案】447
【解析】依题意,被抽到的前5个不重复的编号依次为:175,068,331,047,447,
所以第5个被抽到的同学的编号为447.
8.(24-25高二上·安徽阜阳·期中)某高一班级有40名学生,在一次物理考试中统计出平均分数为70,方差为95,后来发现有2名同学的成绩有误,甲实得70分却记为50分,乙实得60分却记为80分,则更正后的方差是 .
【答案】85
【解析】设更正前甲,乙,丙...的成绩依次为,
则,即,
所以,
,
即,
所以.
更正后的平均分,
更正后的方差
.
9.(23-24高一下·江苏南通·月考)为获得某中学高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为176,标准差为10,女生样本的均值为166,标准差为20.则总样本的方差为 .
【答案】275
【解析】记男生样本的均值为,方差为,女生样本的均值为,方差为,
容量为50的样本均值为,方差为,
则,,所以,
.
四、解答题
10.(24-25高一下·安徽·月考)某学校高中部最近组织了一次野外郊游活动,活动分为登山看日出组和海边看日落组,且每位学生至多参加其中一组.在参加活动的学生中,高一学生占20%,高二学生占30%,登山组的学生占参加活动的总人数的,且该组高一学生占50%,高二学生占30%.为了了解各组不同年级的学生对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体学生中抽取一个容量为80的样本.
(1)求在海边看日落组中,高一学生、高二学生、高三学生分别所占的比例;
(2)求在海边看日落组中,高三年级应抽取的人数.
【答案】(1);(2)
【解析】(1)设登山看日出组的人数为x,在海边看日落组中,
设高一学生、高二学生、高三学生所占的比例分别为,
则,解得,
所以.
故在海边看日落组中,高一学生、高二学生、高三学生所占的比例分别为.
(2)由(1)可得高三学生所占的比例分别为,
所以在海边看日落组中,高三年级应抽取的人数为人.
11.(23-24高一下·湖北武汉·期末)现随机抽取1000名A校学生和1000名B校学生参加一场知识问答竞赛,得到的竞赛成绩全部位于区间中,现分别对两校学生的成绩作统计分析:对A校学生的成绩经分析后发现,可将其分成组距为10,组数为6,作频率分布直方图,且频率分布直方图中的Y()满足函数关系(n为组数序号,),关于B校学生成绩的频率分布直方图如图所示,假定每组组内数据都是均匀分布的.
(1)求k的值;
(2)若B校准备给前50名的学生奖励,应该奖励多少分以上的学生?
(3)现在设置一个标准t来判定某一学生是属于A校还是B校,将成绩小于t的学生判为B校,大于t的学生判为A校,将A校学生误判为B校学生的概率称为误判率A,将B校学生误判为A校学生的概率称为误判率B,误判率A与误判率B之和称作总误判率.若,求总误判率的最小值,以及此时t的值.
【答案】(1);(2)奖励72分以上的学生;(3)总误判率最小为,
【解析】(1)由频率之和为1,故之和为0.1,,解得;
(2)根据B校学生成绩的频率分布直方图,设所求的分数为,
则,解得,所以应该奖励分以上的学生;
(3)设总误判率为,又,则时,
,
时,,
由的单调性知,当,最小,此时,
所以总误判率最小为,此时.
12.(24-25高一下·海南海口·月考)年,国家统计局海南调查总队为制定自贸港民生政策,从海南省某城乡区随机抽取户居民的单户收入作为样本数据,将这户居民的单户收入(,单位:万元)分成六段:、、、,并作出如图所示的频率分布直方图,其中.
(1)求、的值;
(2)若要对单户收入高于第百分位数的居民进行个税统计,则应对单户收入多少以上的居民进行统计?
(3)已知落在上的样本数据的平均数是,方差是,上的样本数据的平均数是,方差是.求这两组数据的总平均数和总方差.
参考公式:分层随机抽样抽取的两层的样本量为、,若这两层的平均数和方差分别为、与、,记总的样本平均数为,样本方差为,则①;②.
【答案】(1),;(2)万元;(3),
【解析】(1)由题意知,,
所以,又,则,.
(2)由直方图知,第组的频率为,第组的频率为,
故前组的频率之和为,前组的频率之和为,
故第百分位数在第组内,
则第百分位数为,
故应对单户收入万元以上的居民进行个税统计.
(3)样本数据在区间的样本数为,
在区间上的样本数为,
所以,
.
真题感知
1.(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
【答案】D
【解析】对于A,了解某一品牌空调的使用寿命,选择抽样调查更符合经济效益,故A错误;
对于B,了解神舟飞船的设备零件的质量情况,
安全是最重要的,应该采取普查,故B错误;
对于C,了解一批袋装食品是否含有防腐剂,选择抽样调查更符合经济效益,故C错误;
对于D,了解某公园全年的游客流量,选择抽样调查比较符合经济效益,故D正确.故选:D.
2.(23-24高一下·江苏苏州·期末)某工厂生产A,B,C,3种不同型号的产品,产量之比为.现用分层抽样的方法抽取1个容量为的样本,若样本中A种型号的产品有18件,则样本容量( )
A.40 B.60 C.80 D.100
【答案】B
【解析】分层抽样抽样比为,样本中A种型号的产品有18件,
则样本中B,C种型号的产品有12件,30件.则样本容量.故选:B.
3.(24-25高一下·江苏·期末)某生活超市2025年第一季度各区域营业收入占比和净利润占比统计如下表所示:
生鲜区
熟食区
乳制品区
日用品区
其他区
营业收入占比
48.6%
15.8%
20.1%
10.8%
4.7%
净利润占比
65.8%
-4.3%
16.5%
20.2%
1.8%
已知该生活超市本季度的总营业利润率为32.5%(营业利润率是净利润占营业收入的百分比),下列结论不正确的是( )
A.本季度此生活超市的营业净利润超过一半来自生鲜区
B.本季度此生活超市营业利润率最高的是日用品区
C.本季度此生活超市生鲜区的营业利润率超过40%
D.本季度此生活超市营业收入最低的是熟食区
【答案】D
【解析】生鲜区的净利润占比,故A正确.
生鲜区的营业利润率为,故C正确.
熟食区的营业利润率为;
乳制品区的营业利润率为;
其他区的营业利润率为;
日用品区的营业利润率为,最高,故B正确.
由题中数据知,其他区的营业收入占比4.7%为最低的,故D错误.故选:D
4.(24-25高一下·甘肃兰州·期中)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是( )
A. B. C. D.
【答案】C
【解析】由数据分布图知,众数是最高矩形下底边的中点横坐标,
因此众数为右起第二个矩形下底边的中点值,
直线左右两边矩形面积相等,而直线左边矩形面积大于右边矩形面积,则,
又数据分布图左拖尾,则平均数小于中位数,即,所以.故选:C.
5.(23-24高一下·江苏连云港·期末)根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和三个月以上六个月以下暂扣驾驶证,并处500元以上2000元以下罚款.2024年3月以来,某地区交警查处酒后驾车和醉酒驾车共20人.如图,这是对这20人酒后驾车血液中酒精含量进行检测所得结果的频率直方图,则属于醉酒驾车的人数约为( )
A.1 B.2 C.3 D.4
【答案】C
【解析】由频率分布直方图可知酒精浓度在80mg/100ml(含80)以上的频率为,
所以样本中属于醉酒驾车的人数约为人.故选:C
6.(24-25高一上·安徽蚌埠·期末)(多选)已知数据的平均数为,方差为,由生成新数据,则( )
A.新数据的平均数为
B.新数据的方差为
C.新数据的中位数一定比原数据的中位数大
D.新数据的极差一定比原数据的极差大
【答案】AD
【解析】A.新数据的平均数为,故正确;
B.新数据的方差为
,故错误;
C. 设原数据的中位数为m,则新数据的中位数为,
当时,;当时,;当时,,故错误;
D. 原数据的极差为,新数据的极差,故正确;故选:AD
7.(24-25高一上·安徽宿州·期末)(多选)2021年某地居民人均可支配收入的构成比例如图所示,已知该地居民人均经营净收入为5250元,则( )
A.2021年该地居民人均经营净收入占居民人均可支配收入的21%
B.2021年该地居民人均可支配收入为25000元
C.2021年该地居民人均转移净收入低于人均经营净收入
D.2021年该地居民人均工资性收入比人均转移净收入多6750元
【答案】ABD
【解析】对于A,2021年该地居民人均经营净收入占居民人均可支配收入的百分比
为,A正确;
对于B,2021年该地居民人均可支配收入为(元),B正确;
对于C,由,得2021年该地居民人均转移净收入高于人均经营净收入,C错误;
对于D,2021年该地居民人均工资性收入为(元),
人均转移净收入为(元),,D正确.故选:ABD
8.(24-25高二下·上海·期中)运动员在平时训练时通常会将自己的训练成绩记录下来,以此评估自己的训练成果.小明记录了他在2月份的8次训练成绩和3月份的12次训练成绩.通过计算,他发现2月份的训练成绩平均值为72,方差为4.2;3月份的训练成绩平均值为75,方差为6.1.则他在这两个月的20次训练的方差为 .
【答案】7.5
【解析】这两个月的20次训练的平均数为,
故这两个月的20次训练的方差为.
9.(23-24高一下·天津·期末)某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40.为了检测该大队的射击水平,从整个大队用按比例分配分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8,8.5,8.1,估计该武警大队队员的平均射击水平为 环.
【答案】
【解析】该武警大队共有(人),
按比例分配得第一中队参加考核人数为;
第二中队参加考核人数为;
第三中队参加考核人数为,
所以参加考核的30人的平均射击环数为,
所以估计该武警大队队员的平均射击水平为环.
10.(24-25高一下·陕西咸阳·期中)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者,遵义市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,⋯,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第80百分位数;
(2)求样本成绩的平均数,中位数和众数;
(3)已知落在的平均成绩是55,方差是7,落在的平均成绩为67,方差是4,求两组成绩合并后的平均数和方差.
【答案】(1),86;(2)74,75,75;(3),
【解析】(1)根据题意可得,解得;
因为前几组的频率依次为0.05,0.1,0.2,0.3,0.25,
所以样本成绩的第80百分位数在内,且为.
(2)本成绩的平均数为;
因为前几组的频率依次为0.05,0.1,0.2,0.3,
所以样本成绩的中位数在内,且为;
样本成绩的众数为.
(3)因为与的频率之比为,
又落在的平均成绩是55,方差是7,落在的平均成绩为67,方差是4,
所以两组成绩合并后的平均数;
所以两组成绩合并后的方差.
2 / 2
学科网(北京)股份有限公司
$$
专题06 统计
内容导航
考点聚焦:核心考点+高考考点,有的放矢
重点速记:知识点和关键点梳理,查漏补缺
考点巩固:必考题型讲透练透,能力提升
复习提升:真题感知+提升专练,全面突破
知识点1:获取数据的基本途径及相关概念
1、普查与抽查
(1)普查:对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)抽查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况做出估计和推断的调查方法,称为抽样调查,简称抽查.
2、统计的相关概念
(1)总体:所要考察对象的全体叫做总体.
(2)样本:从总体中抽取出的一部分个体组成的集合叫做样本.
(3)个体:总体中的每一个考察对象叫做个体.
(4)样本容量:样本中个体的数目叫做样本容量.
(5)样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据.
3、获取数据的基本途径
(1)直接获取:通过社会调查或观察、试验等渠道获取数据.直接数据或一手数据.主要通过问卷调查、试验收集等.
(2)间接获取:借助各种媒介包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据.间接数据或二手数据.主要通过报纸杂志、统计报表和年鉴、广播、电视或互联网.
知识点2:抽样
1、抽签法
(1)抽签法的定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本.
(2)抽签法的实施步骤:用抽签法从个数为的总体中抽取一个容量为的样本的步骤
①将总体中的个个体编号;
②将这个号码写在形状、大小相同的号签上;
③将号签放在同一箱中,并搅拌均匀;
④从箱中每次抽出1个号签,连续抽取次;
⑤将总体中与抽到的号签的编号一致的个个体取出.
2、随机数法
(1)随机数法的定义:按一定规则从随机数表中选取号码的抽样方法叫作随机数表.
(2)随机数表法实施步骤:
①将总体中个体编号(每个号码位数一致);
②在随机数表中任选一个数;
③从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;
④根据选定的号码抽取样本.
3、简单随机抽样
从个体数为的总体中逐步不放回地取出个个体作为样本(),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.
抽签法和随机数表法都是简单随机抽样.
4、分层随机抽样
(1)定义:将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫作分层抽样,所分成的各个部分称为“层”.
(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(3)分层随机抽样的相关计算关系:
①=;
②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
知识点3:统计图表
1、扇形统计图、折线统计图、频数直方图
(1)扇形统计图:用整个圆表示总体,扇形统计图中,每一个扇形的圆心角以及弧长都与这一部分表示的数据大小成正比.
(2)折线统计图:用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
(3)频数直方图:一条轴上显示的是数据分组,另一条轴上对应的是在对应组内的数据的数量.
2、频率直方图
(1)频率直方图的定义:把横轴均分成若干段,每一段对应的长度称为组距,然后以此段位底作矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率,这些矩形就构成了直方图,称为频率直方图.
(2)频率折线图的作法:将频率直方图中各个矩形的上底的中点顺次连接起来,并将两边端点向外延伸半个组距,就得到频率折线图,简称折线图.
(3)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
(4)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
知识点4:用样本估计总体
1、平均数
(1)均值:一般地,我们把总体中所有数据的算术平均数称为总体的均值,它通常可以代表总体的水平.
(2)平均数:用作为表示这个量的理想近似值,称为这个数据的平均数,一般记为.
2、众数与中位数
(1)众数:一般地,我们将数据集合中出现次数最多的那个数据叫做该数据集合的众数。
(2)中位数:一般地,将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在最中间的数据就是这组数据的中位数;如果数据的个数是偶数,那么排在最中间的两个数即为这组数据的中位数.
3、方差与标准差
(1)方差与标准差的定义:设一组样本数据,其平均数为,则称为这个样本的方差,其算数平方根为样本的标准差,分别简称样本方差、样本标准差.
(2)方差的计算
①
②一般地,若取值为的频率分别为,则其方差为.
(3)标准差、方差的意义
①标准差、方差描述了一组数据围绕平均数波动的大小,方差、标准差越大,数据离散程度越大;标准差、方差越小,数据的离散程度越小,标准差的大小不会超过极差.
②标准差、方差的取值范围为标准差、方差为0时,样本各数据相等,说明数据没有波动幅度,数据没有离散型.
4、百分位数
(1)百分位数的定义:一般地,一组数据的百分位数是这样一个值,它使得这组数据中至少的数据小于或等于,且至少有的数据大于或等于这个值.
(2)计算有个数据的大样本的百分位数
第1步,将所有数值按从小到大的顺序排列;
第2步,计算;
第3步,如果结果为正数,那么百分位数位于第位和下一位数之间,通常取这两个位置上数值的平均数为百分位数;
第4步,如果不是整数,那么将其向上取整(即其整数部分加上1,),在该位置上的数值即为百分位数.
(3)四分位数:我们把中位数、25百分位数和75百分位数称为四分位数.
【题型1 普查与抽查的理解与辨析】
高妙技法
选择普查与抽样调查的大体标准是当总体样本量大时,通常是通过科学的抽样方法抽取具有代表性的样本进行抽查;当总体样本较少时,如果所进行的调查没有破坏性,那么可以选择普查,但是,若所进行的调查具有破坏性,无论总样本量是多少,只能选择抽样调查.
【注意】区分某项调查是用普查还是抽样调查的关键是看该项调查是全部调查还是部分调查.
1.(24-25高一下·河北邯郸·月考)(多选)下列调查中,适宜采用抽样调查的是( )
A.调查某市小学生每天的运动时间
B.农业科技人员调查某块地今年麦穗的单穗平均质量
C.某公司初步发现一位职员患有甲肝,对此公司职员进行检查
D.调查某快餐店中全部8位店员的生活质量情况
2.(24-25高一上·江西·月考)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
3.(24-25高一上·陕西汉中·月考)在以下调查中,适合用全面调查的是( )
A.了解一个班级学生的身高情况 B.了解一批水稻种子的发芽率
C.调查某城市居民的食品消费结构 D.调查某批次汽车的抗撞击能力
4.(23-24高一下·内蒙古通辽·月考)下列调查,比较适用普查而不适用抽样调查方式的是( )
A.为了了解中央电视台春节联欢晚会的收视率
B.为了了解高一某班的每个学生星期六晚上的睡眠时间
C.为了了解夏季冷饮市场上冰淇淋的质量情况
D.为了考查一片实验田某种水稻的穗长情况
【题型2 总体与样本的相关概念辨析】
高妙技法
求解此类问题时,要注意对概念的明确,明确总体、样本、样本量、总体的分布等含义,从而在题设条件中来选.
5.(23-24高一下·山西太原·期末)为了解某校高中3000名学生的身高情况,从中抽取了100名学生进行调查,则这100名学生是( )
A.总体 B.样本 C.样本量 D.个体
6.(23-24高二·上海·课堂例题)某高校研究人员希望调查该校大学生平均每天的自习时间.他调查了100名大学生,发现他们每天的平均自习时间是3.5h.这里的总体是( )
A.该校的所有大学生
B.该校所有大学生的平均每天自习时间
C.所调查的100名大学生
D.所调查的100名大学生的平均每天自习时间
7.(23-24高一下·天津河东·期末)为确保食品安全,某市质检部门检查1000袋方便面的质量,抽查总量的.在这个问题中,下列说法正确的是( )
A.总体是指这1000袋方便面 B.个体是1袋方便面
C.样本是按抽取的20袋方便面 D.样本容量为20
8.(23-24高一上·陕西汉中·期末)(多选)为了了解参加运动会的1000名运动员的年龄情况,从中抽取了10名运动员的年龄进行统计分析.下列说法中正确的有( )
A.1000名运动员的年龄是总体 B.所抽取的10名运动员是一个样本
C.样本容量为10 D.每个运动员被抽到的机会相等
【题型3 获取数据的途径选择】
9.(24-25高一上·全国·课后作业)下列获取的数据属于直接数据的是( )
A.看报纸获得的数据 B.通过问卷调查获得的数据
C.通过网络获得的数据 D.听广播获得的数据
10.(多选)影响获取数据可靠程度的因素包括( )
A.获取方法设计 B.所用专业测量设备的精度
C.调查人员的认真程度 D.数据的大小
11.(24-25高一上·全国·课后作业)研究下列问题,一般通过试验获取数据的是( )
A.某城市元旦前后的气温
B.某种新型电路元件使用寿命的测定
C.电视台想知道某一个节目的收视率
D.高中生日平均上网时间
12.(23-24高一下·江苏·期末)以下获取的数据不是通过查询获取的是( )
A.某领导想了解A市的大气环境质量,向当地有关部门咨询该市的PM2.5的浓度
B.张三利用互联网了解到某市居民平均寿命达到82.2岁
C.某中学为了了解学生对课堂禁用手机的认同度,进行了问卷调查
D.从某公司员工年度报告中获知某种信息
【题型4 两种随机抽样的判断】
满分技法
1、简单随机抽样:从总体中随机选择样本,每个样本被选中的概率是相同的.每个单位被选中的机会是均等的,抽样过程不涉及对总体的分组,适用于总体相对均匀的情况.
2、分层随机抽样:首先将总体分成不同的层或组,这些层在某些特征上是同质的,然后在每一层内进行简单随机抽样.总体被分成多个层,每层内部具有相似的特征.每一层的样本大小可以相同,也可以根据层的大小或重要性进行调整.可以提高样本的代表性.
13.(23-24高一下·安徽马鞍山·月考)某高中为了解三个年级学生的课业负担情况,拟从这三个年级中抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 B.简单随机抽样 C.分层随机抽样 D.随机数法
14.(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
15.①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
16.(23-24高一下·广西来宾·期末)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台进行质量检测;②在某校800名学生中,型、型、B型和型血的学生依次有人.为了研究血型与色弱的关系,需从中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法分别是( )
A.①②都采用简单随机抽样
B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样
D.①采用分层随机抽样,②采用简单随机抽样
【题型5 随机数法的特征及应用】
高妙技法
应用随机数表法的两个关键点:
1、确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;
2、读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
17.(24-25高一下·湖南邵阳·月考)从编号为01,02,…,49,50的50个个体中利用下面的随机数表选取5个个体,选取方法从随机数表第1行第5列的数开始由左到右依次抽取,则选出来的第4个个体的编号为( )
7816
6572
0812
1463
0782
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.14 B.07 C.32 D.43
18.(24-25高一下·河北石家庄·月考)某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.328 B.253 C.007 D.860
19.(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
20.(24-25高一下·山东新泰·月考)某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第5个数的编号是 .
1676622766 5650267107 3290797853 1355385859 8897541410
1256859926 9682731099 1696729315 5712101421 8826498176
5559563564 3854824622 3162430990 0618443253 2383013030
【题型6 分层随机抽样中的相关计算】
高妙技法
解决分层抽样的两个常用公式
先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.
(1)抽样比==;
(2)层1的容量:层2的容量:层3的容量=样本中层1的容量:样本中层2的容量:样本中层3的容量.
21.(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
22.(24-25高一上·北京石景山·期末)某田径队有运动员人,其中男运动员人,女运动员人.为了解该田径队运动员的睡眠情况,采用分层抽样的方法获得一个容量为的样本,那么应抽取男运动员的人数为( )
A. B. C. D.
23.(24-25高一下·河北邯郸·月考)中国古代科举制度始于隋而成于唐,兴盛于明、清两朝.明代会试分南卷、北卷、中卷,按的比例录取,若某年会试录取人数为400,则中卷录取人数为( )
A.40 B.70 C.110 D.150
24.(23-24高一下·江苏南通·月考)某工厂生产三种不同型号的产品,产量之比为2:3:5.现用分层抽样的方法抽取1个容量为的样本,若样本中种型号的产品有16件,则样本容量( )
A.40 B.60 C.80 D.100
【题型7 扇形图、折线图及条形图的应用】
高妙技法
1、条形图:一般与小长方形的宽无关,主要是高的值;要注意条形图横、纵坐标的含义;复合条形图是不同数据在同一条形图中反映,对相同横坐标含义进行对比,准确确定彼此间的差异.
2、折线图:可以观察点的个数,从而得到数据的数量,同时直观得出数据变化趋势以及变化幅度的大小,也可得到所有数据中的最大值与最小值,因而容易得到所要解决的问题数值,如果不同的折线图反映在同一坐标系中,可以已通过比较观察期波动程度大小,并进行优劣判断.
3、扇形图:需要运用各个圆心角或弧长得百分比,同时可清楚得到各部分与总体检的关系,用百分比×总体个体数,估算某含义的个体数.
25.(24-25高一下·河北·月考)在统计学中,月度同比是指本月份和上一年同月份相比较的增长率,月度环比是指本月份和上一个月份相比较的增长率.如图是国家统计局发布的2023年全国居民消费价格月度涨跌幅度折线图,则下列说法正确的是( )
A.2023年2月至6月居民的消费价格持续下降
B.2023年7月居民消费价格高于2022年同期
C.2023年4月居民消费价格环比上涨0.1%,同比下降0.1%
D.2023年8月的居民消费价格是全年最高的
26.(24-25高一下·云南大理·月考)(多选)我国在2024年的全国发电装机容量为33.5亿千瓦,包括水电、火电、核电、风电、太阳能发电,其占比如图所示,根据此扇形图,下列说法错误的是( )
A.2024年我国太阳能发电装机容量部分的扇形圆心角小于
B.2024年我国火电发电装机容量超过15亿千瓦
C.2024年我国火电发电装机容量超过新能源(太阳能、风电、核电)的发电装机容量
D.若2025年核电规模要达到2024年全国发电装机容量规模的,则还要再建设的核电的发电装机容量为3.35亿千瓦
27.(24-25高一上·江西宜春·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则估计该校参加舞蹈社团的学生人数为( )
A.300 B.225 C.150 D.40
28.(24-25高一下·甘肃·月考)(多选)如图1为某省2024年1~4月份快递业务量统计图,图2为该省2024年1~4月份快递业务收入统计图,对统计图理解正确的是( )
A.2024年月份快递业务量3月份最高,2月份最低,差值接近2000万件
B.2024年月份快递业务量同比增长率均超过,在3月份最高,和春节蛰伏后网购迎来喷涨有关
C.从两图中看,业务量与业务收入变化高度一致
D.从月份来看,业务量与业务收入有波动,但整体保持高速增长
【题型8 频率直方图的应用】
高妙技法
由频率分布直方图进行相关计算需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
29.(24-25高一上·江西抚州·月考)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组抽样结果绘成的频率分布直方图如图所示,则实数 .
30.(24-25高一下·广东广州·期中)为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为,则该班学生数学成绩在之间的学生人数是( )
A.32 B.27 C.24 D.33
31.(23-24高一下·吉林·期末)随着卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第四组与第五组共有150人,第二组中女性球迷有75人,则第二组中男性球迷的人数为( )
A.140 B.120 C.100 D.80
32.(23-24高一下·山东济宁·期末)(多选)将样本容量为100的样本数据分为4组:,得到频率分布直方图如图所示,则下列说法中正确的是( )
A.样本数据分布在内的频率为0.32
B.样本数据分布在内的频数为40
C.样本数据分布在内的频数为40
D.估计总体数据大约有分布在内
【题型9 平均数、众数与中位数的求解】
高妙技法
利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
33.(24-25高三下·山西·月考)样本数据25,17,26,31,29,18,28,40的中位数为( )
A.31 B.29 C.30 D.27
34.(24-25高一下·广西贵港·月考)已知数据,,…,的平均数为4,那么数据,,…,的平均数为( )
A. B. C.1 D.17
35.(24-25高一下·浙江金华·月考)已知某台机器生产一种零件,在10天中,每天生产的次品数为:1,0,2,0,4,3,4,1,3,3,则该机器生产次品数的中位数为 .
36.(23-24高一下·云南大理·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的中位数、平均数和众数,则的大小关系为 .
【题型10 方差与标准差的计算】
高妙技法
方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为.
37.(2025·广东深圳·二模)下列各组数据中方差最大的一组是( )
A.6,6,6,6,6 B.5,5,6,7,7 C.4,5,6,7,8 D.4,4,6,8,8
38.(24-25高一下·湖南长沙·月考)设一组样本数据,,…,的方差为3,则数据,,…,的方差为( )
A.0.03 B.0.3 C.3 D.30
39.(24-25高一上·河南驻马店·期末)某高中一、二、三年级的学生人数分别为1000、2000、3000,为调查该校学生的身高情况,采用分层抽样的方法从全体学生中抽取30人,抽出的一、二、三年级学生的平均身高分别为、、,则估计该校学生的平均身高是 .
40.(2024高二上·云南·学业考试)学校从甲、乙两名射击运动员中推荐一人参加市中学生运动会,甲、乙两人参加测试的成绩(单位:环)如下:
甲:7,8,8,9,7,8,8,9,7,9;
乙:6,8,7,7,8,9,10,7,9,9.
经计算得:,,,.
根据上述信息,学校应推荐 参加市中学生运动会.
【题型11 k百分位数的计算】
高妙技法
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
41.(24-25高二下·广东江门·期中)现有一组数据1.3,1.2,1.2,1.4,1.6,1.3,1.1,则这组数据的分位数为( )
A.1.2 B.1.3 C.1.4 D.1.6
42.(24-25高一下·安徽·月考)某班级的老师随机抽查了该班12名同学周末在家学习的时长(单位:),所得数据如下:3,6,7,4,5,6,6,7,8,5,4,6,则这组数据的分位数为( )
A.6.5 B.6 C.5.5 D.5
43.(24-25高一下·广东·月考)已知27名女生身高的数据排序如下:148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0 158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0 163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0则第一四分位数是( )
A.155.0 B.155.5 C.161.0 D.164.0
44.(24-25高一下·海南海口·月考)已知一组数据a,b,c,d,e,f的第40百分位数与方差分别为m,n,则新数据,,,,,的第40百分位数与方差分别为( )
A.m,n B.2m, C., D.,4n
提升专练
一、单选题
1.(23-24高一下·江苏无锡·月考)某单位有青年职工160人,中年职工人数180人,老年职工有90人,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.16 B.18 C.27 D.36
2.(24-25高一下·山西·月考)若数据,,,,的方差为9,则数据,,,,的方差为( )
A.2007 B.1989 C.36 D.18
3.(24-25高一下·河北邯郸·月考)一组单调递增数据,,…,的平均数、极差、中位数、方差依次为,,m,,构造一组新的数据,,…,,其中,新数据的平均数、极差、中位数、方差依次为,,n,,则下列结论中不正确的是( )
A.若,则 B.
C.若,则 D.若,则
二、多选题
4.(24-25高一下·河北·月考)(多选)在一次射击决赛中,某位选手射击了一组子弹,得分分别为,,则( )
A.该组数据的极差为1.8
B.该组数据的众数为10.1
C.该组数据的分位数为9.9
D.若该组数据去掉一个数得到一组新数据,则这两组数据的平均数可能相等
5.(23-24高一下·山东烟台·期末)(多选)已知一组样本数据满足,则去掉后的新数据与原数据相比( )
A.平均数不变 B.中位数不变
C.方差不变 D.极差不变
6.(23-24高一上·江西景德镇·月考)(多选)某商户收集并整理了其在2023年1月到8月线上和线下收入的数据,并绘制如图所示的折线图,则下列结论正确的是( )
A.该商户这8个月中,月收入最高的是7月
B.该商户这8个月的线上总收入低于线下总收入
C.该商户这8个月中,线上、线下收入相差最小的是7月
D.该商户这8个月中,月收入不少于17万元的频率是
三、填空题
7.(24-25高二下·上海奉贤·期中)某校从450名同学中用随机数法抽取30人参加这一项调查.将这450名同学编号为,假设从第1行第7列的数字开始,则第5个被抽到的同学的编号为 .
64844217 55721754 55068331
04744767 21763350 25839212
06766301 63785916 95556719
8.(24-25高二上·安徽阜阳·期中)某高一班级有40名学生,在一次物理考试中统计出平均分数为70,方差为95,后来发现有2名同学的成绩有误,甲实得70分却记为50分,乙实得60分却记为80分,则更正后的方差是 .
9.(23-24高一下·江苏南通·月考)为获得某中学高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为176,标准差为10,女生样本的均值为166,标准差为20.则总样本的方差为 .
四、解答题
10.(24-25高一下·安徽·月考)某学校高中部最近组织了一次野外郊游活动,活动分为登山看日出组和海边看日落组,且每位学生至多参加其中一组.在参加活动的学生中,高一学生占20%,高二学生占30%,登山组的学生占参加活动的总人数的,且该组高一学生占50%,高二学生占30%.为了了解各组不同年级的学生对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体学生中抽取一个容量为80的样本.
(1)求在海边看日落组中,高一学生、高二学生、高三学生分别所占的比例;
(2)求在海边看日落组中,高三年级应抽取的人数.
11.(23-24高一下·湖北武汉·期末)现随机抽取1000名A校学生和1000名B校学生参加一场知识问答竞赛,得到的竞赛成绩全部位于区间中,现分别对两校学生的成绩作统计分析:对A校学生的成绩经分析后发现,可将其分成组距为10,组数为6,作频率分布直方图,且频率分布直方图中的Y()满足函数关系(n为组数序号,),关于B校学生成绩的频率分布直方图如图所示,假定每组组内数据都是均匀分布的.
(1)求k的值;
(2)若B校准备给前50名的学生奖励,应该奖励多少分以上的学生?
(3)现在设置一个标准t来判定某一学生是属于A校还是B校,将成绩小于t的学生判为B校,大于t的学生判为A校,将A校学生误判为B校学生的概率称为误判率A,将B校学生误判为A校学生的概率称为误判率B,误判率A与误判率B之和称作总误判率.若,求总误判率的最小值,以及此时t的值.
12.(24-25高一下·海南海口·月考)年,国家统计局海南调查总队为制定自贸港民生政策,从海南省某城乡区随机抽取户居民的单户收入作为样本数据,将这户居民的单户收入(,单位:万元)分成六段:、、、,并作出如图所示的频率分布直方图,其中.
(1)求、的值;
(2)若要对单户收入高于第百分位数的居民进行个税统计,则应对单户收入多少以上的居民进行统计?
(3)已知落在上的样本数据的平均数是,方差是,上的样本数据的平均数是,方差是.求这两组数据的总平均数和总方差.
参考公式:分层随机抽样抽取的两层的样本量为、,若这两层的平均数和方差分别为、与、,记总的样本平均数为,样本方差为,则①;②.
真题感知
1.(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
2.(23-24高一下·江苏苏州·期末)某工厂生产A,B,C,3种不同型号的产品,产量之比为.现用分层抽样的方法抽取1个容量为的样本,若样本中A种型号的产品有18件,则样本容量( )
A.40 B.60 C.80 D.100
3.(24-25高一下·江苏·期末)某生活超市2025年第一季度各区域营业收入占比和净利润占比统计如下表所示:
生鲜区
熟食区
乳制品区
日用品区
其他区
营业收入占比
48.6%
15.8%
20.1%
10.8%
4.7%
净利润占比
65.8%
-4.3%
16.5%
20.2%
1.8%
已知该生活超市本季度的总营业利润率为32.5%(营业利润率是净利润占营业收入的百分比),下列结论不正确的是( )
A.本季度此生活超市的营业净利润超过一半来自生鲜区
B.本季度此生活超市营业利润率最高的是日用品区
C.本季度此生活超市生鲜区的营业利润率超过40%
D.本季度此生活超市营业收入最低的是熟食区
4.(24-25高一下·甘肃兰州·期中)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是( )
A. B. C. D.
5.(23-24高一下·江苏连云港·期末)根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和三个月以上六个月以下暂扣驾驶证,并处500元以上2000元以下罚款.2024年3月以来,某地区交警查处酒后驾车和醉酒驾车共20人.如图,这是对这20人酒后驾车血液中酒精含量进行检测所得结果的频率直方图,则属于醉酒驾车的人数约为( )
A.1 B.2 C.3 D.4
6.(24-25高一上·安徽蚌埠·期末)(多选)已知数据的平均数为,方差为,由生成新数据,则( )
A.新数据的平均数为
B.新数据的方差为
C.新数据的中位数一定比原数据的中位数大
D.新数据的极差一定比原数据的极差大
7.(24-25高一上·安徽宿州·期末)(多选)2021年某地居民人均可支配收入的构成比例如图所示,已知该地居民人均经营净收入为5250元,则( )
A.2021年该地居民人均经营净收入占居民人均可支配收入的21%
B.2021年该地居民人均可支配收入为25000元
C.2021年该地居民人均转移净收入低于人均经营净收入
D.2021年该地居民人均工资性收入比人均转移净收入多6750元
8.(24-25高二下·上海·期中)运动员在平时训练时通常会将自己的训练成绩记录下来,以此评估自己的训练成果.小明记录了他在2月份的8次训练成绩和3月份的12次训练成绩.通过计算,他发现2月份的训练成绩平均值为72,方差为4.2;3月份的训练成绩平均值为75,方差为6.1.则他在这两个月的20次训练的方差为 .
9.(23-24高一下·天津·期末)某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40.为了检测该大队的射击水平,从整个大队用按比例分配分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8,8.5,8.1,估计该武警大队队员的平均射击水平为 环.
10.(24-25高一下·陕西咸阳·期中)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者,遵义市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,⋯,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第80百分位数;
(2)求样本成绩的平均数,中位数和众数;
(3)已知落在的平均成绩是55,方差是7,落在的平均成绩为67,方差是4,求两组成绩合并后的平均数和方差.
2 / 2
学科网(北京)股份有限公司
$$