内容正文:
2026年高考数学一轮复习考点精析与题型全解(上海专用)
专题46 统计
知识点一、总体与样本 数据的获取
1.统计的概念
总体:所考察对象的某一数值指标的全体构成的集合看作总体.
个体:构成总体的每一个元素作为个体.
样本:从总体中抽出若干个体所组成的集合叫做样本.
样本容量:样本中个体的数目叫样本容量.
统计的基本思想:通过分析样本的统计特征,去推断总体的统计特征。样本的代表性和数据获取方式很重要。
2、数据的获取
(1)数据按收集的方法分为观测数据和实验数据。
观测数据是通过调查或观测而收集到的数据,是在没有对事物人为控制的条件下得到的。
实验数据是指实验中控制实验对象而获取的数据
(2)数据获取方法:普查、抽样调查或已收集数据
普查:为某一特定目的而作的全面调查.
抽样调查:从总体中抽取样本进行调查的方法叫抽样调查.
知识点二、抽样的方法
1、简单随机抽样
(1)定义:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
(3)抽签法与随机数法的适用情况
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
(4)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
只有四个特点都满足的抽样才是简单随机抽样.
2、分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”
注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).
知识点三、统计图表
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
2、茎叶图
(1)特点
①保留原始数据信息:茎叶图能够保留原始数据的所有信息,不会造成数据的丢失
②便于记录和表示:茎叶图可以随时记录和添加数据,方便数据的更新和展示
③直观展示数据分布:茎叶图能够直观地展示数据的分布情况,包括数据的集中趋势和离散程度④适用于两位有效数字的数据:茎叶图最适合表示具有两位有效数字的数据
(2)适用范围
①小样本数据:当样本数据较少时,茎叶图的效果较好,②数据分析:茎叶图是一种有效的探索性数据分析工具,特别适用于初步数据分析阶段
③比较两组数据:茎叶图非常适合用来比较两组数据,
④教学和演示:由于其直观性和简单性,茎叶图在教学和演示中也非常有用.
3、 散点图
①展示相关性:散点图可以直观地呈现两个变量之间的关系
②反映数据分布:通过观察数据点的聚集程度和分布范围,能够对数据的整体特征有初步的了解
③发现异常值:散点图能够快速识别出与其他数据点显著不同的数据点,即异常值,
④灵活性高:在数据可视化方面具有较高的灵活性,可以通过改变数据点的颜色、大小、形状等属性来表示额外的信息或区分不同的数据类别,
⑤适用范围广:既适用于小规模的数据集,以便快速直观地展示数据之间的关系;又能对大规模的数据集很好地发挥作用,帮助人们从海量数据中发现潜在的规律和趋势
知识点四、统计估计
1、估计总体的分布
当样本量很大时每组数据的频率都稳定于一个 相应的概率,我们把这个概率作为总体中的个体在相应区间内取值的概率,这样就可以用样本的频率分布表或频率分布直方图来 估计总体的分布情况.
当总体中的个体数较多时,抽样时样本容量就不能太小.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图将趋于一条光滑的曲线,称这条光滑曲线为总体分布密度曲线.
2、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
(2)标准差和方差
①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
3、百分位数
(1)定义:一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
考点一 总体与样本 数据的获取
题型01:总体与样本的有关概念
1.(2025上海高二阶段练习)学校为了考察某校八年级同学的视力情况,从八年级的160名学生中,抽取了20名进行分析,在这个问题中,样本的容量是 .
【答案】20
【知识点】总体、个体、样本、样本容量
【分析】本题考查了样本与样本容量,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目,是不带单位的量.理解样本容量是解题的关键.根据样本容量的概率即可解答.
【详解】解:抽取的20名八年级同学的视力情况是样本,样本容量是20;
故答案为:20.
2.(2025上海格致中学高二阶段练习)某中学为了了解初中部学生的某项行为规范的养成情况,在校门口每分钟随机抽取一名学生,登记佩戴了胸卡的学生的名字,结果在名学生中有名学生佩戴胸卡.学校调查了初中部的所有学生,发现有名学生佩戴胸卡.则估计该中学初中部共有 名学生.
【答案】
【分析】设该中学初中部一共有名学生,列出等式,即可求解.
【解析】设该中学初中部一共有名学生,
则,解得,
故该中学初中部一共有1250名学生.
故答案为:.
题型02:观测数据与实验数据
3.(2025上海高二阶段练习)某科研团队研发出一批相同规格航空用耐热垫片,检测该批耐热垫片的品质时所获得的数据是 数据.(填“观测”或“实验”)
【答案】实验
【分析】分析数据获取的途径或方式即可分辨是“观测”还是“实验”数据.
【解析】若需要检测该批耐热垫片的品质,则需要通过在特定的条件或环境下实验获得数据,故获得的数据为实验数据.
故答案为:实验.
4.(2025上海高二阶段练习)截至2021年1月底,全球共有17种疫苗进入完成了Ⅲ期临床测试,公布了疫苗的Ⅲ期临床与保护率数据,国药新冠疫苗公布有效率为79%.在统计学中,数据79%来自 .(填写“观测数据”或“实验数据”)
【答案】实验数据
【分析】利用统计学中获取数据的方法分析判断.
【解析】因为国药新冠疫苗有效率为79%是在实验中控制实验对象而收集到的变量数据,所以数79%来自于实验数据.
故答案为:实验数据.
题型03:普查与抽样调查
5.(2025上海高二阶段练习)为了得到全国总人口数,我们需要采取 方式.
【答案】普查
【分析】根据需要得到数据的精确度,确定采取的方式.
【解析】因为全国总人口数是需要得到的一个精准数据,所以要采取普查方式.
故答案为:普查
6.(2025上海大同中学高二阶段练习)为了解我省中小学生每天课外体育活动时间情况,比较适合的调查方式是 (填“全面调查”或“抽样调查”).
【答案】抽样调查
【知识点】判断全面调查与抽样调查
【分析】本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.据此进行进行判断.
【详解】解:为了解我省中小学生每天课外体育活动时间情况,比较适合的调查方式是抽样调查,
故答案为:抽样调查.
7.(2025上海高二阶段练习)在统计里,为了使对总体特性的估计、推断更加准确,抽样时要注意样本的 性.
【答案】代表性和广泛
【知识点】抽样调查的可靠性
【分析】本题主要考查了抽样调查的可靠性,此题比较简单,只要了解抽样调查的特点就可以了.
【详解】解:在统计里,为了使对总体特性的估计、推断更加准确,抽样时要注意样本的代表性和广泛性.
故答案为:代表性和广泛.
考点二 抽样的方法
题型04:简单随机抽样
8.(2025上海高二阶段练习)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的5 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5 000件产品中抽取10件进行质量检验
【答案】B
【详解】因为A,D中总体的个体数较大,不适合用抽签法;
C中甲、乙两厂生产的产品质量可能差别较大,
因此未达到搅拌均匀的条件,也不适合用抽签法;
B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.
故选:B
9.(2025上海七宝中学高三阶段练习)某工厂利用随机数表对生产的 50 个零件进行抽样测试, 先将 50 个零件进行编号, 编号分别为 01, 02, ......, 50. 从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 7 列开始向右依次读取数据, 则得到的第5个样本编号是 ______
【分析】根据随机数表的读法,注意除去重复的,得到第5组符合要求的编码.
【详解】第一行第7列为3,依次往右读,37,14,05,11,09.
09为第5个样本编号,
故选:A
10. (23-24高三上·新疆·期末)总体由编号为01,02,…,30的30个个体组成.利用所给的随机数表选取6个个体,选取的方法是从随机数表第1行的第3列开始,由左到右一次选取两个数字,则选出来的第5个个体的编号为_______
(第一行)1712 1340 3320 3826 1389 5103 7417 7637
(第二行)1304 0774 2119 3056 6218 3735 9683 5087
A.20 B.26 C.17 D.03
【分析】先把编号按要求在随机数表中选出来,再剔除掉总体编号以外的编号,以及重复的编号,即可得到选出的个体编号.
【详解】从随机数表第1行的第3列开始,由左到右一次选取两个数字,
选出的编号依次为:12,13,40,33,20,38,26,13,89,51,03,…,
剔除掉总体编号以外的编号,以及重复的编号,
则选出来的个体的编号依次为:12,13,20,26,03,…,
所以选出来的第5个个体的编号为03.
题型05:分层随机抽样
11.(2024·上海黄浦·二模)某学校为了解学生参加体育运动的情况,用分层抽样的方法作抽样调查,拟从初中部和高中部两层共抽取40名学生,已知该校初中部和高中部分别有500和300名学生,则不同的抽样结果的种数为( )
A. B.
C. D.
【答案】B
【分析】由分层抽样先求出初中部和高中部应抽取的学生,再由组合数公式和分步计数原理即可得出答案.
【详解】该校初中部和高中部分别有500和300名学生,
所以初中部应抽取名学生,
高中部应抽取名学生,
所以不同的抽样结果的种数为.
故选:B.
12.(2023·上海闵行·统考一模)某校读书节期间,共120名同学获奖(分金、银、铜三个等级),从中随机抽取24名同学参加交流会,若按高一、高二、高三分层随机抽样,则高一年级需抽取6人;若按获奖等级分层随机抽样,则金奖获得者需抽取4人.下列说法正确的是( )
A.高二和高三年级获奖同学共80人 B.获奖同学中金奖所占比例一定最低
C.获奖同学中金奖所占比例可能最高 D.获金奖的同学可能都在高一年级
【答案】D
【分析】直接根据分层抽样的比例关系计算得到答案.
【详解】对选项A:高二和高三年级获奖同学共,错误;
对选项B:不能确定银奖和铜奖的人数,错误;
对选项C:金奖人数为,银奖和铜奖的人数和为人,
故获奖同学中金奖所占比例不可能最高,错误;
对选项D:高一年级人数为,金奖人数为,故获金奖的同学可能都在高一年级,
正确;
故选:D
13.(2025上海高三阶段练习)某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办了“校园安全知识”竞赛.现按比例分配的分层随机抽样的方法,分别抽取初中生名,高中生名,经统计:名学生的平均成绩为74分,其中名初中生的平均成绩为72分,名高中生的平均成绩为分,则____
【知识点】计算几个数的平均数、抽样比、样本总量、各层总数、总体容量的计算
【分析】根据分层随机抽样的特点求出与的关系,再利用平均数的计算公式列出关于的方程,进而求解的值.
【详解】由题意,得可得,解得.
14.(2025上海高三阶段练习)为了更好地应对新高考改革以及调整日常教学,某地区教育局对该地区的三所高中的二年级学生进行了抽样调查,采用分层抽样的方式抽取了1000名学生参加物理学科的抽样质量测试,其中A校、B校、C校的学生人数分别为300人、500人、200人,考试结束后对这1000名同学的物理成绩进行统计,得知A,B,C三所学校的高二年级的物理平均分依次为60分、75分、58分,则这1000名同学物理成绩的总平均分为 分.
【答案】67.1
【难度】0.85
【知识点】计算几个数的平均数、抽样比、样本总量、各层总数、总体容量的计算
【分析】利用平均数的求解公式可得答案.
【详解】由分层抽样的平均数计算可得总样本1000名同学物理成绩的总平均分为分.
故答案为:67.1
考点三 统计图表
题型06:频率分布表和频率分布直方图
15.(2023·上海宝山·二模)如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
【答案】
【详解】由茎叶图可知:,的频数分别为5,2;
由频率分布直方图可得:每组的频率依次为,
设样本容量为,
则,解得,
故.
故答案为:.
16.(2025上海高三阶段练习)某市教育主管部门为了解高三年级学生学业达成的情况,对高三年级学生进行抽样调查,随机抽取了1000名学生,他们的学业达成情况按照从高到低都分布在五个层次内,分男、女生统计得到以下样本分布统计图,则下列叙述正确的是( )
A.样本中层次的女生比相应层次的男生人数多
B.估计样本中男生学业达成的中位数比女生学业达成的中位数小
C.层次的女生和层次的男生在整个样本中频率相等
D.样本中层次的学生数和层次的学生数一样多
【答案】B
【难度】0.65
【知识点】根据扇形统计图解决实际问题、由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数
【分析】频率分布直方图,得女生学业达成在各层次的频率,对选项中的频率频数问题进行判断.
【详解】对于AC,设女生学业达成频率分布直方图中的组距为,
由,得,
所以女生学业达成频率分布直方图中层次频率为,层次频率为,
层次频率为,层次频率为,层次频率为,
因为男、女生样本数未知,所以层次中男、女生人数不能比较,即A选项错误;
同理,层次女生在女生样本数中频率与层次男生在男生样本数中频率相等,都是,
但因男、女生人数未知,所以在整个样本中频率不一定相等,即C选项错误;
对于D,设女生人数为,男生人数为,但因男、女生人数可能不相等,
则层次的学生数为,
层次的学生数为,
因为不确定,所以与可能不相等,即D选项错误;
对于B,女生两个层次的频率之和为,
所以女生的样本学业达成的中位数为B,C层次的分界点,
男生两个层次的频率之和为,显然中位数落在C层次内,
所以样本中男生学业达成的中位数比女生学业达成的中位数小,B选项正确.
故选:B.
17.(2025上海高三阶段练习)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则下列不正确的是( )
A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
【答案】A
【知识点】补全频率分布直方图、计算频率分布直方图中的方差、标准差、由频率分布直方图估计中位数、由频率分布直方图估计平均数
【分析】A项,由各组频率之和为求参数;B项可由频率分布直方图面积与比较,估计中位数所在区间,利用面积关系建方程求解可得;C项,两组求加权平均数可得;D项,由分别两组成绩的方差与两组总方差的关系求解即可.
【详解】A项,在频率分布直方图中,所有直方图的面积之和为1,
则,解得,故A错误;
项,前两个矩形的面积之和为
前三个矩形的面积之和为.
设该年级学生成绩的中位数为,则,
根据中位数的定义可得,解得,
所以,估计该年级学生成绩的中位数约为,故B正确;
C项,估计成绩在80分以上的同学的成绩的平均数为
分,故C正确;
D项,估计该年级成绩在80分及以上的学生成绩的方差为
,故D正确.
故选:A.
18.(2025华师大二附中高三阶段练习)某校根据学生情况将物理考试成绩进行赋分,目的是为了更好地对新高考改革中不同选科学生的考试成绩进行横向对比,经过对全校300名学生的成绩统计,可得到如图所示的频率分布直方图,则这些同学物理成绩大于等于60分的人数为_____
A.270 B.240 C.180 D.150
【详解】,解得,
故物理成绩大于等于60分的人数为.
19.
从某小学随机抽取部分同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).已知身高在内的人数为10人,则身高在内的学生人数为__
【详解】依题意,身高在内的学生人数为人.
题型07:茎叶图
20.(2023·上海崇明·统考一模)如图是小王同学在篮球赛中得分记录的茎叶图,则他平均每场得 分.
【答案】
【分析】根据平均数的求法求得平均数.
【详解】平均数为.
故答案为:
21.(2025·上海青浦·模拟预测)如图是6株果树植株挂果个数(两位数)的茎叶图,则6株果数植株挂果个数的中位数为 .
【答案】21.5
【分析】将茎叶图中的数据按照从小到大排列后,根据中位数的定义即可求得.
【详解】将这6个数从小到大排列为16,18,21,22,22,31,
因数据有偶数个,则中位数是中间两个数的平均数,故中位数为.
故答案为:21.5.
22.(2025·上海崇明·二模)某次数学考试后,随机选取14位学生的成绩,得到如下茎叶图,其中个数部分作为“叶”,百位数和十位数作为“茎”,若该组数据的第25百分位数是87,则x的值为 .
【答案】7
【分析】根据题意结合百分位数的概念运算求解.
【详解】,则该组数据从小到大排列后的第四位数是87,即,
故答案为:7.
题型08:散点图
23.(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【答案】D
【分析】根据相关系数的概念逐一判断.
【详解】对于A:去掉图中右下方的点后,根据图象,两个变量还是负相关,A错误;
对于BCD:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高,
但因为是负相关,相关系数会更接近线性相关系数会变小,故D正确,BC错误.
故选:D.
考点四 统计估计
题型09:估计总体的分布
24.(2023·上海徐汇·统考一模)某学校组织全校学生参加网络安全知识竞赛,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为,若该校的学生总人数为1000,则成绩低于60分的学生人数为 .
【答案】
【分析】先利用频率分布直方图求得成绩低于60分的频率,进而求得该校成绩低于60分的学生人数.
【详解】图中成绩低于60分的频率为,
则该校成绩低于60分的学生人数为(人)
故答案为:
25.(2023上·上海黄浦·高三统考期中)某校共有400名学生参加了趣味知识竞赛(满分:150分),且每位学生的竞赛成绩均不低于90分.将这400名学生的竞赛成绩分组如下:,得到的频率分布直方图如图所示,则这400名学生中竞赛成绩不低于120分的人数为 .
【答案】
【分析】由频率分布直方图的面积和为求出,再计算出结果即可.
【详解】由频率分布直方图可知,解得,
这400名学生中竞赛成绩不低于120分的人数为,
故答案为:
26.(2025上海高三阶段练习)某商场为了了解顾客的停车时长(单位:分钟),现随机抽取了100辆该商场到访顾客的车辆进行停车时长调查,将数据整理得到如下频率分布直方图:
则样本中停车时长在区间上的车辆数为 辆.
【答案】
【难度】0.85
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】利用频率直方图中频率之和为1求得的频率,进而求得的频数,从而得解.
【详解】依题意,设的频率为,
则,解得,
所以样本中停车时长在区间上的车辆数为.
故答案为:.
27.从某中学随机抽取100名学生,将他们的身高数据(单位:cm)绘制成频率分布直方图,若要从身高在,,三组内的学生中,用分层抽样的方法选取32人参加一次活动.则从身高在内的学生中选取的人数应为( )
A.7 B.8 C.9 D.10
【答案】B
【详解】由频率分布直方图的性质得:,解得,
所以身高在,,三组内的学生比例为,
用分层抽样的方法选取32人参加一次活动,则从身高在内的学生中选取的人数为人.
故选:B.
28.
(2025上海高三阶段练习)为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:)进行分组,区间为,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率之比为,且第一组的频数为6,则报考飞行员的学生人数是( )
A.48 B.5 C.54 D.60
【答案】A
【详解】由题前三组频率之和为,
又第一组、第二组和第三组的频率之比为,
所以第一组的频率为,又第一组的频数为,
所以报考飞行员的学生人数为人.
故选:A.
题型10:估计总体的集中趋势
29.(2023·上海宝山·统考一模)下列说法中错误的是( )
A.一组数据的平均数、中位数可能相同
B.一组数据中比中位数大的数和比中位数小的数一样多
C.平均数、众数和中位数都是描述一组数据的集中趋势的统计量
D.极差、方差、标准差都是描述一组数据的离散程度的统计量
【答案】B
【分析】A选项,可举出实例;B选项,可举出反例;CD选项,根据平均数、众数和中位数,极差、方差、标准差的定义进行判断.
【详解】A选项,例如,这组数据的平均数、中位数相同,均为2,A正确;
B选项,例如,中位数为2,这组数据中比中位数大的数只有1个,比中位数小的数有2个,两者不一样多,B错误;
C选项,平均数、众数和中位数都是描述一组数据的集中趋势的统计量,C正确;
D选项,极差、方差、标准差都是描述一组数据的离散程度的统计量,D正确.
故选:B
30.(2025·吉林长春·模拟预测)某唱歌比赛共有10位评委分别给出某选手的原始评分,评定该选手的成绩时,从10个原始评分中去掉1个最高分、1个最低分,得到8个有效评分.8个有效评分与10个原始评分相比,一定不变的数字特征是( )
A.众数 B.中位数 C.平均数 D.标准差
【答案】B
【分析】根据众数、平均数、中位数、标准差概念来进行求解,得到答案.
【详解】设10位评委评分按从小到大排列为,
对A,可能存在两个一样的最低分,且仅最低分为原众数,
则去掉1个最低分后,其众数发生了变化,故A错误;
对B,原始中位数为,去掉最低分,最高分,
后剩余,中位数仍为,故B正确;
对C,原始平均数,
后来平均数,平均数受极端值影响较大,
与不一定相同,C错误;
对D,原标准差为,
后标准差为,两者可能不等,故D错误.
故选:B.
31.(2023上·上海松江·高三统考期末)如图所示的茎叶图记录了甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分).则下列说法正确的是 ( )
A.甲队数据的中位数大于乙队数据的中位数;
B.甲队数据的平均值小于乙队数据的平均值;
C.甲队数据的标准差大于乙队数据的标准差;
D.乙队数据的第75百分位数为27.
【答案】D
【分析】根据中位数、平均数、方程、百分位数等知识对选项进行分析,从而确定正确答案.
【详解】A选项,甲队的中位数是,乙队的中位数是,
两者相等,所以A选项错误.
B选项,甲队的平均数为,
乙队的平均数为,
两者相等,所以B选项错误.
C选项,甲队的标准差为:
,
乙队的标准差为:
,
所以甲队数据的标准差小于乙队数据的标准差,所以C选项错误.
D选项,乙队的数据为,,
所以乙队数据的第75百分位数为,D选项正确.
故选:D
32.(2025·上海闵行·二模)已知数据的平均数为2,方差为5,则的平均数为 .
【答案】9
【分析】由方差和平均数的计算公式结合已知计算即可.
【详解】由题意可得,,
所以,
又,
即,即,
所以的平均数为9.
故答案为:9.
33.某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a,b,c,则( )
A. B. C. D.
【答案】B
【详解】解:由频率分布直方图可知众数为65,即,
由表可知,组距为10,
所以平均数为:,
故,记中位数为,
则有:,
解得:,即,
所以.
故选:B.
34.某市为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度.为了确定一个比较合理的标准,通过简单随机抽样,获得了100户居民的月均用水量数据(单位:吨),得到如图所示的频率分布直方图.估计该市居民月均用水量的中位数为( )
A. B. C. D.
【答案】A
【详解】由频率分布直方图,得月均用水量在吨以下的居民用户所占的比例为,
月均用水量在吨以下的居民用户所占的比例为,
故中位数落在区间内,设样本的中位数为,则,
解得,即样本的中位数为,
由样本估计总体的思想,估计该市居民月均用水量的中位数为.
故选:A
题型11:估计总体的离散趋势
35.(24-25高三上·上海浦东新·期末)对一组数据3,3,3,1,1,5,5,2,4,若任意去掉其中一个数据,剩余数据的统计量一定会发生变化的为( )
A.中位数 B.众数 C.平均数 D.方差
【答案】D
【分析】求出给定数据组的中位数、众数、平均数,举例说明判断ABC;利用数据的波动大小判断D.
【详解】数据由小到大排列为:1,1,2,3,3,3,4,5,5,其中位数、众数、平均数都为3,
去掉数据1,剩余数据的中位数、众数都不变;去掉数据3,剩余数据的平均数不变,ABC不是;
若任意去掉其中一个数据,剩余数据的波动性发生变化,方差一定发生变化,D是.
故选:D
36.(2024·上海嘉定·二模)数据1、2、3、4、5的方差为,数据3、6、9、12、15的方差为,则 .
【答案】9
【分析】由两组数据满足的一次函数关系,得方差间的关系,即可得结果.
【详解】数据1、2、3、4、5依次记为,数据3、6、9、12、15依次记为,
则有,所以,即.
故答案为:9
37.(2024·上海杨浦·一模)某次杨浦区高三质量调研数学试卷中的填空题第八题,答对得5分,答错或不答得0分,全区共4000人参加调研,该题的答题正确率是,则该次调研中全区同学该题得分的方差为 .
【答案】6
【分析】根据平均数和方差的定义计算求解即可.
【详解】同全区同学中答对的人数为人,答错或不答的人数为人,
所以全区同学该题得分的平均数为分,
则全区同学该题得分的方差为.
故答案为:6.
38.(2024·山东·二模)甲乙两名歌手参加选拔赛,5位评委评分情况如下:甲:;乙:,记甲、乙两人的平均得分分别为,则下列判断正确的是( )
A.,甲比乙成绩稳定 B.,乙比甲成绩稳定
C.,甲比乙成绩稳定 D.,乙比甲成绩稳定
【答案】B
【难度】0.65
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】由平均数和方差公式求出,,,即可得出答案.
【详解】;
;
,
所以,乙比甲成绩稳定.
故选:B.
39.(2023·上海嘉定·统考一模)两位跳水运动员甲和乙,某次比赛中的得分如下表所示,则正确的选项为( )
第一跳
第二跳
第三跳
第四跳
第五跳
甲
85.5
96
86.4
75.9
94.4
乙
79.5
80
95.7
94.05
86.4
A.甲和乙的中位数相等,甲的平均分小于乙
B.甲的平均分大于乙,甲的方差大于乙
C.甲的平均分大于乙,甲的方差等于乙
D.甲的平均分大于乙,甲的方差小于乙
【答案】B
【分析】计算出两者的中位数,平均分和方差,比较后得到结论.
【详解】甲的比赛得分从小到大排序为,
选择第三个数作为中位数,
甲的平均分为,
甲的方差为,
乙的比赛得分从小到大排序为,
选择第三个数作为中位数,
乙的平均分为,
乙的方差为,
甲和乙的中位数相等,因为,故甲的平均分大于乙的平均数,
因为,所以甲的方差大于乙的方差.
故选:B
40.(2023·上海普陀·统考一模)已知一组数据3、1、5、3、2,现加入,两数对该组数据进行处理,若经过处理后的这组数据的极差为,则经过处理后的这组数据与之前的那组数据相比,一定会变大的数字特征是( )
A.平均数 B.方差 C.众数 D.中位数
【答案】B
【分析】根据平均数、方差、众数和中位数的概念,并通过举反例即可判断.
【详解】对A,将原数据从小到大进行排序得1,2,3,3,5;其平均数为,众数为3,中位数为3,
若加入的数据为,则平均数,众数为3,中位数为3,平均数、众数和中位数均不变,故ACD错误;
对B,因为加入,两数后,极差变为,则数据波动程度变大,则方差一定变大,故B正确.
故选:B.
41.(2025·上海宝山·二模)甲、乙两名篮球运动员在8场比赛中的单场得分用茎叶图表示如左下图,茎叶图中甲的得分有部分数据丢失,但甲得分的折线图完好(右下图),则下列结论正确的是( )
A.甲得分的极差小于乙得分的极差
B.甲得分的第25百分位数大于乙得分的第75百分位数
C.甲得分的平均数大于乙得分的平均数
D.甲得分的方差小于乙得分的方差
【答案】C
【分析】利用极差、百分位数和平均数的计算公式可以判断A、B、C三个选项,对于D选项,利用数据的分散程度判断方差的大小即可.
【详解】对于A选项,甲得分的极差为:,乙得分的极差为:,
因为,所以甲得分的极差大于乙得分的极差,故A错误;
对于B选项,因为,所以甲得分的第25百分位数为,
又,所以乙得分的第75百分位数为,
因为,所以甲得分的第25百分位数小于乙得分的第75百分位数,故B错误;
对于C选项,由折线图可知,在茎叶图中甲的得分中丢失的数据一个为,另一个设为,其中,
所以甲的平均数为,
乙的平均数为,
因为,所以,所以,
所以甲得分的平均数大于乙得分的平均数,故C正确;
对于D选项,方差是刻画数据离散程度或波动幅度的指标.
从茎叶图中可以看到,甲的得分分布比乙的得分分布分散,
所以甲得分的方差大于乙得分的方差,故D错误.
故选:C
42.(2025·上海黄浦·二模)设,随机变量取值、、、的概率均为0.25,随机变量取值、、、的概率也均为0.25,随机变量取值、、、的概率也均为0.25.若记、分别为、的方差,则( )
A.
B.
C.
D.与的大小关系与、、、的取值有关
【答案】A
【分析】根据随机变量的取值情况,计算出它们的期望和方差,再借助均值不等式即可判断作答.
【详解】由随机变量的取值情况,它们的期望分别为:,
,即,
,
则
同理,
则
则
,
因为
所以,
因为,不能取等号,所以,所以
所以.
故选:A.
43.(2024·安徽·模拟预测)某小学对四年级的某个班进行数学测试,男生的平均分和方差分别为91和11,女生的平均分和方差分别为86和8,已知该班男生有30人,女生有20人,则该班本次数学测试的总体方差为 .
【答案】
【难度】0.65
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】先求出总体的平均数,在利用计算得解.
【详解】设全体同学数学成绩的平均分为,方差为,
记,,,,,,
依题意有,
则
.
故答案为:.
44..(22-23高三下·安徽亳州·开学考试)现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
【答案】D
【难度】0.4
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】利用平均数和方差公式可求得新数据的方差.
【详解】设甲组数据分别为、、、,乙组数据分别为、、、,
甲组数据的平均数为,可得,方差为,可得,
乙组数据的平均数为,可得,方差为,可得,
混合后,新数据的平均数为,
方差为
.
故选:D.
题型12:估计总体的百分位数
45.(2024·上海宝山·一模)某运动员在某次男子米气手枪射击比赛中的得分数据(单位:环)为:,,,,,,,,,,,,则这组数据的第百分位数为 .
【答案】/
【分析】将数据从小到大排序,再根据百分位数的概念求解即可.
【详解】分数据从小到大为:,,,,,,,,,,,,
共个数,则,
所以这组数据的第百分位数为.
故答案为:.
46.(2023上·上海黄浦·高三统考期中)某城市30天的空气质量指数如下:29,26,28,29,38,29,26,26,40,31,35,44,33,28,80,86,65,53,70,34,36,,31,38,63,60,56,34,74,34.则这组数据的第75百分位数为 .
【答案】56
【分析】把给定数据按由小到大的顺序排列,再根据第p百分位数的定义求解即得.
【详解】显然,30个数据由小到大排列为:
26,26,26,28,28,29,29,29,31,31,33,34,34,34,35,36,38,38,40,
44,,53,56,60,63,65,70,74,80,86,
或者26,26,26,28,28,29,29,29,31,31,33,34,34,34,35,36,38,38,
40,,44,53,56,60,63,65,70,74,80,86,
由,得这组数据的第75百分位数为上述排列后的从小到大的第23个数56.
故答案为:56
47.(2023·上海青浦·统考一模)某家大型超市统计了八次节假日的客流量(单位:百人)分别为29,30,38,25,37,40,42,32,那么这组数据的第百分位数为 .
【答案】
【分析】根据第75百分位数的定义计算可得答案.
【详解】将这8个数据按从小到大排列为:25,29,30,32,37,38,40,42,
因为,所以第75百分位数为.
故答案为:39.
48.(2024·上海徐汇·一模)某景点对30天内每天的游客人数(单位:万人)进行统计,得到样本的茎叶图(如图所示),则该样本的第75百分位数是 .
【答案】51
【分析】根据百分位数的定义求解即可.
【详解】因为,
所以该样本的第75百分位数是按照从小到大的顺序排列的第个数,即为.
故答案为:.
49.(2025·上海浦东新·二模)李老师在整理建模小组10名学生的成绩时不小心遗失了一位学生的成绩,且剩余学生的成绩数据如下:5 6 6 7 7 7 8 9 9,但李老师记得这名学生的成绩恰好是本组学生成绩的第25百分位数,则这10名学生的成绩的方差为 .
【答案】
【分析】现根据百分位数得出该生的成绩,再利用方差公式计算.
【详解】,则该学生的成绩为从小到大排列的第个,
故该生的成绩为,
则这10名学生的成绩的平均数为,
方差为
故答案为:
50.(2025·甘肃定西·模拟预测)某品牌电动汽车公司为了解车主使用电动车辅助驾驶功能的情况,进行了问卷调查,从中抽取了100位车主进行抽样分析,得出这100位车主每人在100次驾驶途中使用辅助驾驶功能的次数的频率分布直方图,则样本中车主使用辅助驾驶功能次数的分位数为( )
A.62 B.64 C.66 D.68
【答案】C
【难度】0.65
【知识点】总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】先判断出40%分位数所在的区间,并设为,再利用概率之和也就是小长方形的面积之和等于0.40,求出即可.
【详解】因为,
,
所以样本中车主使用辅助驾驶功能次数的40%分位数位于内,
设样本中车主使用辅助驾驶功能次数的分位数为,
则,
解得.
故选:C.
51.(2025·甘肃·模拟预测)杜老师随机抽取了本校参加市一模的100名学生的数学成绩(单位:分),并将成绩整理成如图的频率分布直方图,估计这100名学生市一模的数学成绩的第65百分位数约为( )
A.120.5 B.121.7 C.123.3 D.125
【答案】B
【分析】由频率分布直方图中所有矩形面积和为1求得a的值,则可写出各区间的频率。由频率判断第65百分位数所在的区间,然后设其为值为x,利用x以左的所有面积和为0.65解得x的值即可。
【详解】,解得:,
∴,,
各组的频率为
,
,
,
.
∵,,
∴第65百分位数在区间内,
设第65百分位数为x,则,
∴,
故第65百分位数约为121.67.
故选:B.
考点五 统计与概率综合
题型13:统计图表与古典概率
52.(24-25高三上·上海松江·期末)某日用品按行业质量标准分成五个等级,等级系数依次为1、2、3、4、5,现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:
1
2
3
4
5
(1)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a、b、c的值;
(2)在(1)的条件下,将等级系数为4的3件日用品记为、、,等级系数为5的2件日用品记为、,现从、、、、这5件日用品中任取两件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这两件日用品的等级系数恰好相等的概率.
【答案】(1),,
(2)所有可能的结果详见解析;概率为.
【分析】(1)根据频率和频数的关系可求的值,根据频率和为可求的值.
(2)用列举法写出所有的可能性,再结合古典概型公式求解即可.
【详解】(1)因为等级系数为4的恰有3件,所以;
等级系数为5的恰有2件,所以;
因为,所以.
故,,.
(2)从、、、、这5件日用品中任取两件,所有可能得结果有:
,,,,,,,,,共10种情况.
这两件日用品的等级系数恰好相等的结果有:,,,,共4个.
因为每种结果出现的可能性相同,所以这两件日用品的等级系数恰好相等的概率为:.
53.(2024·上海杨浦·一模)为加强学生睡眠监测督导,学校对高中三个年级学生的日均睡眠时间进行调查.根据分层随机抽样法,学校在高一、高二和高三年级中共抽取了100名学生的日均睡眠时间作为样本,其中高一35人,高二33人.已知该校高三年级一共512人.
(1)学校高中三个年级一共有多少个学生?
(2)若抽取100名学生的样本极差为2,数据如下表所示(其中是正整数)
日均睡眠时间(小时)
8.5
9
9.5
10
学生数量
32
13
11
4
求该样本的第40百分位数.
(3)从这100名学生的样本中随机抽取三个学生的日均睡眠时间,求其中至少有1个数据来自高三学生的概率.
【答案】(1)1600
(2)
(3)
【分析】根据分层抽样,按比例抽取即可得到答案.
根据极差可得,再结合学生总数量为100,可求出,再根据求第百分位数的方法即可求得.
根据古典概型的概率计算,如果一次实验中可能出现的结果有个,而且所有结果出现的可能性都相等,如果某个事件包含的结果有个,那么事件的概率为,即可解得.
【详解】(1)设学校高中三个年级一共有个学生,
因为采用分层抽样法抽取一个容量为100的样本,
在高一年级抽取了35人,高二年级抽取了33人,
所以高三抽取的人数为:人,
又因为高三年级一共512人,所以有:,解得.
所以学校高中三个年级一共有1600个学生.
(2)因为抽取100名学生的样本极差为2,所以
又因为,所以样本的第40百分位数为:
(3)因为100名学生的样本中随机抽取三个学生的总情况数为:
其中至少有1个数据来自高三学生的情况为:
所以至少有1个数据来自高三学生的概率为:
题型14:统计图表与随机事件的独立性
54.(2024·上海长宁·一模)2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”.
(1)求所抽取的“青年人”的人数;
(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.
①简述如何采用抽签法任选2人;
②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.
【答案】(1)80
(2)①答案见解析;②事件A与事件B不独立,理由见解析
【分析】(1)根据频率分布直方图求得的值,然后求得“青年人”人数占比,从而可得“青年人”人数;
(2)①利用简单随机抽样设计抽签法任选2人即可;②根据独立事件判断公式,结合超几何分布概率问题求解,从而可得结论.
【详解】(1)由频率分布直方图可得,解得:,
又“青年人”占比为,
所以所抽取的“青年人”人数为人;
(2)①先将10名参会者进行编号:1、2、、10,并将10个号码写在完全相同的纸片上,
放入某容器中充分混合均匀,再取出2张,2张纸片上所对应的参会者就是要选取的人,
②“青年人”“中年人”“老年人”的人数之比为,
所以10人中“中年人”共有5人,
2人均为“中年人”的概率,
2人中至少有1人为男性的概率,
2人均为“中年人”且至少有1人为男性的概率,
因为,所以事件A与事件B不独立.
55.(2024·上海徐汇·一模)某企业招聘员工,指定“英语听说”、“信息技术”、“逻辑推理”作为三门考试课程,有两种考试方案.
方案一:参加三门课程的考试,至少有两门及格为通过;
方案二:在三门课程中,随机选取两门,并参加这两门课程的考试,两门都及格为通过.
假设某应聘者参加三门指定课程考试及格的概率分别是.,且三门课程考试是否及格相互之间没有影响.
(1)分别求该应聘者选方案一考试通过的概率和选方案二考试通过的概率;
(2)试比较该应聘者在上述两种方案下考试通过的概率的大小,并说明理由.
【答案】(1);
(2),理由见解析
【分析】(1)记该应聘者对三门指定课程考试及格的事件分别为,方案一即可表示为,方案二先考虑随机选取两门的概率为,再计算这两门都及格的概率即可.
(2)为了比较概率大小,可作差与比较即可.
【详解】(1)记该应聘者对三门指定课程考试及格的事件分别为,
则.
应聘者选方案一考试通过的概率
应聘者选方案二考试通过的概率
(2)
,
因为,所以,即.
故,即选方案一,该应聘者考试通过的概率较大.
1
学科网(北京)股份有限公司
$
2026年高考数学一轮复习考点精析与题型全解(上海专用)
专题46 统计
知识点一、总体与样本 数据的获取
1.统计的概念
总体:所考察对象的某一数值指标的全体构成的集合看作总体.
个体:构成总体的每一个元素作为个体.
样本:从总体中抽出若干个体所组成的集合叫做样本.
样本容量:样本中个体的数目叫样本容量.
统计的基本思想:通过分析样本的统计特征,去推断总体的统计特征。样本的代表性和数据获取方式很重要。
2、数据的获取
(1)数据按收集的方法分为观测数据和实验数据。
观测数据是通过调查或观测而收集到的数据,是在没有对事物人为控制的条件下得到的。
实验数据是指实验中控制实验对象而获取的数据
(2)数据获取方法:普查、抽样调查或已收集数据
普查:为某一特定目的而作的全面调查.
抽样调查:从总体中抽取样本进行调查的方法叫抽样调查.
知识点二、抽样的方法
1、简单随机抽样
(1)定义:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
(3)抽签法与随机数法的适用情况
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
(4)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
只有四个特点都满足的抽样才是简单随机抽样.
2、分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”
注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).
知识点三、统计图表
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
2、茎叶图
(1)特点
①保留原始数据信息:茎叶图能够保留原始数据的所有信息,不会造成数据的丢失
②便于记录和表示:茎叶图可以随时记录和添加数据,方便数据的更新和展示
③直观展示数据分布:茎叶图能够直观地展示数据的分布情况,包括数据的集中趋势和离散程度④适用于两位有效数字的数据:茎叶图最适合表示具有两位有效数字的数据
(2)适用范围
①小样本数据:当样本数据较少时,茎叶图的效果较好,②数据分析:茎叶图是一种有效的探索性数据分析工具,特别适用于初步数据分析阶段
③比较两组数据:茎叶图非常适合用来比较两组数据,
④教学和演示:由于其直观性和简单性,茎叶图在教学和演示中也非常有用.
3、 散点图
①展示相关性:散点图可以直观地呈现两个变量之间的关系
②反映数据分布:通过观察数据点的聚集程度和分布范围,能够对数据的整体特征有初步的了解
③发现异常值:散点图能够快速识别出与其他数据点显著不同的数据点,即异常值,
④灵活性高:在数据可视化方面具有较高的灵活性,可以通过改变数据点的颜色、大小、形状等属性来表示额外的信息或区分不同的数据类别,
⑤适用范围广:既适用于小规模的数据集,以便快速直观地展示数据之间的关系;又能对大规模的数据集很好地发挥作用,帮助人们从海量数据中发现潜在的规律和趋势
知识点四、统计估计
1、估计总体的分布
当样本量很大时每组数据的频率都稳定于一个 相应的概率,我们把这个概率作为总体中的个体在相应区间内取值的概率,这样就可以用样本的频率分布表或频率分布直方图来 估计总体的分布情况.
当总体中的个体数较多时,抽样时样本容量就不能太小.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图将趋于一条光滑的曲线,称这条光滑曲线为总体分布密度曲线.
2、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
(2)标准差和方差
①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
3、百分位数
(1)定义:一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
考点一 总体与样本 数据的获取
题型01:总体与样本的有关概念
1.(2025上海高二阶段练习)学校为了考察某校八年级同学的视力情况,从八年级的160名学生中,抽取了20名进行分析,在这个问题中,样本的容量是 .
2.(2025上海格致中学高二阶段练习)某中学为了了解初中部学生的某项行为规范的养成情况,在校门口每分钟随机抽取一名学生,登记佩戴了胸卡的学生的名字,结果在名学生中有名学生佩戴胸卡.学校调查了初中部的所有学生,发现有名学生佩戴胸卡.则估计该中学初中部共有 名学生.
题型02:观测数据与实验数据
3.(2025上海高二阶段练习)某科研团队研发出一批相同规格航空用耐热垫片,检测该批耐热垫片的品质时所获得的数据是 数据.(填“观测”或“实验”)
4.(2025上海高二阶段练习)截至2021年1月底,全球共有17种疫苗进入完成了Ⅲ期临床测试,公布了疫苗的Ⅲ期临床与保护率数据,国药新冠疫苗公布有效率为79%.在统计学中,数据79%来自 .(填写“观测数据”或“实验数据”)
题型03:普查与抽样调查
5.(2025上海高二阶段练习)为了得到全国总人口数,我们需要采取 方式.
6.(2025上海大同中学高二阶段练习)为了解我省中小学生每天课外体育活动时间情况,比较适合的调查方式是 (填“全面调查”或“抽样调查”).
7.(2025上海高二阶段练习)在统计里,为了使对总体特性的估计、推断更加准确,抽样时要注意样本的 性.
考点二 抽样的方法
题型04:简单随机抽样
8.(2025上海高二阶段练习)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的5 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验
D.从某厂生产的5 000件产品中抽取10件进行质量检验
9.(2025上海七宝中学高三阶段练习)某工厂利用随机数表对生产的 50 个零件进行抽样测试, 先将 50 个零件进行编号, 编号分别为 01, 02, ......, 50. 从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 7 列开始向右依次读取数据, 则得到的第5个样本编号是 ______
10. (23-24高三上·新疆·期末)总体由编号为01,02,…,30的30个个体组成.利用所给的随机数表选取6个个体,选取的方法是从随机数表第1行的第3列开始,由左到右一次选取两个数字,则选出来的第5个个体的编号为_______
(第一行)1712 1340 3320 3826 1389 5103 7417 7637
(第二行)1304 0774 2119 3056 6218 3735 9683 5087
A.20 B.26 C.17 D.03
题型05:分层随机抽样
11.(2024·上海黄浦·二模)某学校为了解学生参加体育运动的情况,用分层抽样的方法作抽样调查,拟从初中部和高中部两层共抽取40名学生,已知该校初中部和高中部分别有500和300名学生,则不同的抽样结果的种数为( )
A. B.
C. D.
12.(2023·上海闵行·统考一模)某校读书节期间,共120名同学获奖(分金、银、铜三个等级),从中随机抽取24名同学参加交流会,若按高一、高二、高三分层随机抽样,则高一年级需抽取6人;若按获奖等级分层随机抽样,则金奖获得者需抽取4人.下列说法正确的是( )
A.高二和高三年级获奖同学共80人 B.获奖同学中金奖所占比例一定最低
C.获奖同学中金奖所占比例可能最高 D.获金奖的同学可能都在高一年级
13.(2025上海高三阶段练习)某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办了“校园安全知识”竞赛.现按比例分配的分层随机抽样的方法,分别抽取初中生名,高中生名,经统计:名学生的平均成绩为74分,其中名初中生的平均成绩为72分,名高中生的平均成绩为分,则____
14.(2025上海高三阶段练习)为了更好地应对新高考改革以及调整日常教学,某地区教育局对该地区的三所高中的二年级学生进行了抽样调查,采用分层抽样的方式抽取了1000名学生参加物理学科的抽样质量测试,其中A校、B校、C校的学生人数分别为300人、500人、200人,考试结束后对这1000名同学的物理成绩进行统计,得知A,B,C三所学校的高二年级的物理平均分依次为60分、75分、58分,则这1000名同学物理成绩的总平均分为 分.
考点三 统计图表
题型06:频率分布表和频率分布直方图
15.(2023·上海宝山·二模)如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
16.(2025上海高三阶段练习)某市教育主管部门为了解高三年级学生学业达成的情况,对高三年级学生进行抽样调查,随机抽取了1000名学生,他们的学业达成情况按照从高到低都分布在五个层次内,分男、女生统计得到以下样本分布统计图,则下列叙述正确的是( )
A.样本中层次的女生比相应层次的男生人数多
B.估计样本中男生学业达成的中位数比女生学业达成的中位数小
C.层次的女生和层次的男生在整个样本中频率相等
D.样本中层次的学生数和层次的学生数一样多
17.(2025上海高三阶段练习)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则下列不正确的是( )
A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
18.(2025华师大二附中高三阶段练习)某校根据学生情况将物理考试成绩进行赋分,目的是为了更好地对新高考改革中不同选科学生的考试成绩进行横向对比,经过对全校300名学生的成绩统计,可得到如图所示的频率分布直方图,则这些同学物理成绩大于等于60分的人数为_____
A.270 B.240 C.180 D.150
19.
从某小学随机抽取部分同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).已知身高在内的人数为10人,则身高在内的学生人数为__
题型07:茎叶图
20.(2023·上海崇明·统考一模)如图是小王同学在篮球赛中得分记录的茎叶图,则他平均每场得 分.
21.(2025·上海青浦·模拟预测)如图是6株果树植株挂果个数(两位数)的茎叶图,则6株果数植株挂果个数的中位数为 .
22.(2025·上海崇明·二模)某次数学考试后,随机选取14位学生的成绩,得到如下茎叶图,其中个数部分作为“叶”,百位数和十位数作为“茎”,若该组数据的第25百分位数是87,则x的值为 .
题型08:散点图
23.(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
考点四 统计估计
题型09:估计总体的分布
24.(2023·上海徐汇·统考一模)某学校组织全校学生参加网络安全知识竞赛,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为,若该校的学生总人数为1000,则成绩低于60分的学生人数为 .
25.(2023上·上海黄浦·高三统考期中)某校共有400名学生参加了趣味知识竞赛(满分:150分),且每位学生的竞赛成绩均不低于90分.将这400名学生的竞赛成绩分组如下:,得到的频率分布直方图如图所示,则这400名学生中竞赛成绩不低于120分的人数为 .
26.(2025上海高三阶段练习)某商场为了了解顾客的停车时长(单位:分钟),现随机抽取了100辆该商场到访顾客的车辆进行停车时长调查,将数据整理得到如下频率分布直方图:
则样本中停车时长在区间上的车辆数为 辆.
27.从某中学随机抽取100名学生,将他们的身高数据(单位:cm)绘制成频率分布直方图,若要从身高在,,三组内的学生中,用分层抽样的方法选取32人参加一次活动.则从身高在内的学生中选取的人数应为( )
A.7 B.8 C.9 D.10
28.
(2025上海高三阶段练习)为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:)进行分组,区间为,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率之比为,且第一组的频数为6,则报考飞行员的学生人数是( )
A.48 B.5 C.54 D.60
题型10:估计总体的集中趋势
29.(2023·上海宝山·统考一模)下列说法中错误的是( )
A.一组数据的平均数、中位数可能相同
B.一组数据中比中位数大的数和比中位数小的数一样多
C.平均数、众数和中位数都是描述一组数据的集中趋势的统计量
D.极差、方差、标准差都是描述一组数据的离散程度的统计量
30.(2025·吉林长春·模拟预测)某唱歌比赛共有10位评委分别给出某选手的原始评分,评定该选手的成绩时,从10个原始评分中去掉1个最高分、1个最低分,得到8个有效评分.8个有效评分与10个原始评分相比,一定不变的数字特征是( )
A.众数 B.中位数 C.平均数 D.标准差
31.(2023上·上海松江·高三统考期末)如图所示的茎叶图记录了甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分).则下列说法正确的是 ( )
A.甲队数据的中位数大于乙队数据的中位数;
B.甲队数据的平均值小于乙队数据的平均值;
C.甲队数据的标准差大于乙队数据的标准差;
D.乙队数据的第75百分位数为27.
32.(2025·上海闵行·二模)已知数据的平均数为2,方差为5,则的平均数为 .
33.某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a,b,c,则( )
A. B. C. D.
34.某市为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度.为了确定一个比较合理的标准,通过简单随机抽样,获得了100户居民的月均用水量数据(单位:吨),得到如图所示的频率分布直方图.估计该市居民月均用水量的中位数为( )
A. B. C. D.
题型11:估计总体的离散趋势
35.(24-25高三上·上海浦东新·期末)对一组数据3,3,3,1,1,5,5,2,4,若任意去掉其中一个数据,剩余数据的统计量一定会发生变化的为( )
A.中位数 B.众数 C.平均数 D.方差
36.(2024·上海嘉定·二模)数据1、2、3、4、5的方差为,数据3、6、9、12、15的方差为,则 .
37.(2024·上海杨浦·一模)某次杨浦区高三质量调研数学试卷中的填空题第八题,答对得5分,答错或不答得0分,全区共4000人参加调研,该题的答题正确率是,则该次调研中全区同学该题得分的方差为 .
38.(2024·山东·二模)甲乙两名歌手参加选拔赛,5位评委评分情况如下:甲:;乙:,记甲、乙两人的平均得分分别为,则下列判断正确的是( )
A.,甲比乙成绩稳定 B.,乙比甲成绩稳定
C.,甲比乙成绩稳定 D.,乙比甲成绩稳定
39.(2023·上海嘉定·统考一模)两位跳水运动员甲和乙,某次比赛中的得分如下表所示,则正确的选项为( )
第一跳
第二跳
第三跳
第四跳
第五跳
甲
85.5
96
86.4
75.9
94.4
乙
79.5
80
95.7
94.05
86.4
A.甲和乙的中位数相等,甲的平均分小于乙
B.甲的平均分大于乙,甲的方差大于乙
C.甲的平均分大于乙,甲的方差等于乙
D.甲的平均分大于乙,甲的方差小于乙
40.(2023·上海普陀·统考一模)已知一组数据3、1、5、3、2,现加入,两数对该组数据进行处理,若经过处理后的这组数据的极差为,则经过处理后的这组数据与之前的那组数据相比,一定会变大的数字特征是( )
A.平均数 B.方差 C.众数 D.中位数
41.(2025·上海宝山·二模)甲、乙两名篮球运动员在8场比赛中的单场得分用茎叶图表示如左下图,茎叶图中甲的得分有部分数据丢失,但甲得分的折线图完好(右下图),则下列结论正确的是( )
A.甲得分的极差小于乙得分的极差
B.甲得分的第25百分位数大于乙得分的第75百分位数
C.甲得分的平均数大于乙得分的平均数
D.甲得分的方差小于乙得分的方差
42.(2025·上海黄浦·二模)设,随机变量取值、、、的概率均为0.25,随机变量取值、、、的概率也均为0.25,随机变量取值、、、的概率也均为0.25.若记、分别为、的方差,则( )
A.
B.
C.
D.与的大小关系与、、、的取值有关
43.(2024·安徽·模拟预测)某小学对四年级的某个班进行数学测试,男生的平均分和方差分别为91和11,女生的平均分和方差分别为86和8,已知该班男生有30人,女生有20人,则该班本次数学测试的总体方差为 .
44..(22-23高三下·安徽亳州·开学考试)现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
题型12:估计总体的百分位数
45.(2024·上海宝山·一模)某运动员在某次男子米气手枪射击比赛中的得分数据(单位:环)为:,,,,,,,,,,,,则这组数据的第百分位数为 .
46.(2023上·上海黄浦·高三统考期中)某城市30天的空气质量指数如下:29,26,28,29,38,29,26,26,40,31,35,44,33,28,80,86,65,53,70,34,36,,31,38,63,60,56,34,74,34.则这组数据的第75百分位数为 .
47.(2023·上海青浦·统考一模)某家大型超市统计了八次节假日的客流量(单位:百人)分别为29,30,38,25,37,40,42,32,那么这组数据的第百分位数为 .
48.(2024·上海徐汇·一模)某景点对30天内每天的游客人数(单位:万人)进行统计,得到样本的茎叶图(如图所示),则该样本的第75百分位数是 .
49.(2025·上海浦东新·二模)李老师在整理建模小组10名学生的成绩时不小心遗失了一位学生的成绩,且剩余学生的成绩数据如下:5 6 6 7 7 7 8 9 9,但李老师记得这名学生的成绩恰好是本组学生成绩的第25百分位数,则这10名学生的成绩的方差为 .
50.(2025·甘肃定西·模拟预测)某品牌电动汽车公司为了解车主使用电动车辅助驾驶功能的情况,进行了问卷调查,从中抽取了100位车主进行抽样分析,得出这100位车主每人在100次驾驶途中使用辅助驾驶功能的次数的频率分布直方图,则样本中车主使用辅助驾驶功能次数的分位数为( )
A.62 B.64 C.66 D.68
51.(2025·甘肃·模拟预测)杜老师随机抽取了本校参加市一模的100名学生的数学成绩(单位:分),并将成绩整理成如图的频率分布直方图,估计这100名学生市一模的数学成绩的第65百分位数约为( )
A.120.5 B.121.7 C.123.3 D.125
考点五 统计与概率综合
题型13:统计图表与古典概率
52.(24-25高三上·上海松江·期末)某日用品按行业质量标准分成五个等级,等级系数依次为1、2、3、4、5,现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:
1
2
3
4
5
(1)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a、b、c的值;
(2)在(1)的条件下,将等级系数为4的3件日用品记为、、,等级系数为5的2件日用品记为、,现从、、、、这5件日用品中任取两件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这两件日用品的等级系数恰好相等的概率.
53.(2024·上海杨浦·一模)为加强学生睡眠监测督导,学校对高中三个年级学生的日均睡眠时间进行调查.根据分层随机抽样法,学校在高一、高二和高三年级中共抽取了100名学生的日均睡眠时间作为样本,其中高一35人,高二33人.已知该校高三年级一共512人.
(1)学校高中三个年级一共有多少个学生?
(2)若抽取100名学生的样本极差为2,数据如下表所示(其中是正整数)
日均睡眠时间(小时)
8.5
9
9.5
10
学生数量
32
13
11
4
求该样本的第40百分位数.
(3)从这100名学生的样本中随机抽取三个学生的日均睡眠时间,求其中至少有1个数据来自高三学生的概率.
题型14:统计图表与随机事件的独立性
54.(2024·上海长宁·一模)2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”.
(1)求所抽取的“青年人”的人数;
(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.
①简述如何采用抽签法任选2人;
②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.
55.(2024·上海徐汇·一模)某企业招聘员工,指定“英语听说”、“信息技术”、“逻辑推理”作为三门考试课程,有两种考试方案.
方案一:参加三门课程的考试,至少有两门及格为通过;
方案二:在三门课程中,随机选取两门,并参加这两门课程的考试,两门都及格为通过.
假设某应聘者参加三门指定课程考试及格的概率分别是.,且三门课程考试是否及格相互之间没有影响.
(1)分别求该应聘者选方案一考试通过的概率和选方案二考试通过的概率;
(2)试比较该应聘者在上述两种方案下考试通过的概率的大小,并说明理由.
1
学科网(北京)股份有限公司
$