内容正文:
专题05 统计(期末复习讲义)
内 容 导 航
明·期末考情 把握命题趋势,明确备考路径
记·必备知识 梳理核心脉络,扫除知识盲区
破·重难题型 题型分类突破,方法技巧精讲
题型01样本与总体的概念辨析 题型02简单随机抽样的概率问题
题型03随机数表法的应用 题型04分层随机抽样的计算
题型05频率分布直方图及其计算 题型06条形图、扇形图与折线图的应用
题型07百分位数的计算 题型08计算几个数的平均数、中位数、众数
题型09计算几个数的标准差与方差 题型10用方差、标准差说明数据的波动程度
题型11统计的综合应用
过·分层验收 阶梯实战演练,验收复习成效
核心考点
复习目标
考情规律
简单随机抽样
1、掌握简单随机抽样的特征,能准确判定抽样类型;
2、熟悉抽签法、随机数法的操作步骤;
3、能利用抽样特征解决简单判定、样本估计问题
基础必考点,小题为主,难度低;
命题趋势:依托课本基础情境考查抽样判定;
易错点:忽略“等概率、不放回”核心条件,混淆有放回与不放回抽样
分层随机抽样
1、掌握分层抽样的特点,区分与简单随机抽样的差异;
2、会按比例计算各层样本数量,掌握分层均值计算方法;
3、能解决实际情境中的抽样计算与总体估计问题
高频考点,小题、解答题均会考查;
命题趋势:结合实际统计情境综合命题,是抽样核心考点;
易错点:分层比例计算出错,分层均值未加权计算,混淆抽样类型
频率分布表与频率分布直方图
1、掌握频率分布表、直方图的绘制规则,明晰频数、频率、频率/组距的区别;
2、能熟练计算各类直方图核心参数;
3、能利用图表数据分析、估计总体分布规律
期末核心必考考点,小题、大题高频考查;命题趋势:常结合百分位数、统计量综合出题,为大题核心载体;
易错点:混淆频率与频率/组距,边界数据处理失误,计算频数频率出错
总体百分位数的估计
1、理解百分位数的定义与统计意义,熟记计算步骤;
2、能根据原始数据、频率直方图求解百分位数;
3、能用百分位数分析数据分布特征
高频易错考点,小题为主,难度中等;
命题趋势:结合频率直方图考查计算与定位
易错点:计算步骤不规范,直方图中百分位数定位错误,混淆百分位数与百分比
总体集中趋势的估计
1、理解众数、中位数、平均数的定义与区别;
2、能对原始数据、直方图数据求解三类统计量;
3、能结合实际情境选用统计量、解释数据特征
高频核心考点,大小题均有考查,综合性强;命题趋势:常与直方图、百分位数结合综合命题;
易错点:中位数计算未排序,直方图统计量求解出错,忽略极端值对平均数的影响
总体离散程度的估计
1、理解方差、标准差的定义与统计意义;2、能准确计算方差、标准差,判断数据离散与稳定性;
3、能结合实际情境分析数据波动情况
高频必考考点,小题直接计算,大题常综合考查;
命题趋势:搭配平均数、直方图命题,考查数据分析能力;
易错点:方差公式运用错误,混淆总体与样本方差,不会结合实际分析数据稳定性
说明:相当于“知识工具箱”,梳理本章节基础知识,提炼本单元核心概念、公式、法则、以及解题技巧方法等,注意添加示例或易错点以理解透彻该知识点。
知识点01 全面调查与抽样调查
1、全面调查
(1)定义:对每一个调查对象都进行调查的方法,成为全面调查,又称普查.在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体本.
(2)优点和缺点:优点是所有资料较为全面可靠;缺点是调查花费的人力、物力、财力较多,且调查时间较长,全面调查只在样本少的情况下适合采用本.
2、抽样调查
(1)定义:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查本.
(2)相关的概念:
①总体:所要考察对象的全体叫做总体
②样本:从总体中抽取出的若干个个体组成的集合叫作总体的一个样本
③个体:总体中的每一个考察对象叫作个体
④样本容量:样本中个体的数目叫作样本容量
⑤样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据本.
(3)优点和缺点:优点是迅速及时;节约人力、物力和财力;
缺点是调查结果不如全面调查全面、系统本.
知识点02 简单随机抽样
1、定义:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
2、两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.适用于总体个数较少的情况。
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.适用于总体个数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
3、简单随机抽样的特征(只有四个特点都满足的抽样才是简单随机抽样)
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
知识点03 分层随机抽样
1、定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
2、分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”
【注意】分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).
知识点04 用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于.
(2)频率分布直方图中数字特征的计算
①最高的小长方形底边中点的横坐标即是众数.
②中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
2、百分位数
(1)定义:一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
(3)四分位数:我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
3、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
(2)标准差和方差
①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
【注意】标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
③平均数、方差的性质:如果数据的平均数为,方差为,那么
一组新数据的平均数为,方差是.
一新数据的平均数为,方差是.
一组新数据的平均数为,方差是.
题型一 样本与总体的概念辨析
解|题|技|巧
1、概念辨析关键点:总体、样本均是研究对象的某项数量指标,而非对象本身.
2、混淆样本和样本容量:误将抽取的个体当作样本容量,或给样本容量添加单位.
【典例1】(24-25高一下·河北沧州·期末)某校高中有42个班,每个班有50名学生,现从该校高中每班随机选派3名学生参加交通安全知识竞赛并统计参赛人员的成绩,则其样本量是( )
A.42 B.50 C.126 D.150
【变式1-1】(25-26高一上·陕西渭南·期末)为了解某校七年级学生的近视情况,从中随机抽取40名学生进行调查,其中40是该调查的( )
A.总体 B.样本容量 C.个体 D.样本
【变式1-2】(24-25高一下·甘肃兰州·阶段检测)某校为了解高三年级学生体重情况,从该年级1000名学生中抽取125名学生测量他们的体重进行分析.在这项调查中,抽取的125名学生的体重是( )
A.总体 B.样本 C.总体容量 D.样本容量
【变式1-3】(2026高一上·山东东营·专题练习)某高中为了了解高一年级1200名学生的视力情况,抽查了其中200名学生的视力,并进行统计分析.下列叙述正确的是( )
A.上述调查属于普查 B.每名学生是总体的一个个体
C.200名学生的视力是总体的一个样本 D.1200名学生是总体
题型二 简单随机抽样的概率问题
解|题|技|巧
1、简单随机抽样核心性质:总体中每个个体被抽到的概率均等,与抽样先后、抽取顺序无关.
2、概率通用公式:单个个体被抽取概率:P=样本容量/总体容量.
3、核心前提:满足等概率、不放回、随机性三大条件,方可套用公式计算.
【典例2】(25-26高一上·河南·期末)采用简单随机抽样的方法,从含有25个个体的总体中抽取1个容量为10的样本,则某个个体被抽到的概率为( )
A. B. C. D.
【变式2-1】(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【变式2-2】(25-26高二上·广东中山·阶段检测)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( )
A. B. C. D.
【变式2-3】(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = , B.a = , C.a = , D.a = ,
题型三 随机数表法的应用
解|题|技|巧
应用随机数表法的两个关键点
1、确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;
2、读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
【典例3】(25-26高一上·辽宁大连·期末)现从编号为的50支水笔中抽取10支水笔进行书写长度检测,若从以下随机数表第9个数字开始由左向右读取,则抽取的第3支水笔的编号为__________.
【变式3-1】(24-25高一下·福建福州·期末)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
【变式3-2】(25-26高一上·江西景德镇·期末)从某班55位学生中利用下面的随机数表抽取10位同学参加一项活动,将这55位学生按01、02、…、55进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,则选出来的第5个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
A.51 B.25 C.32 D.12
【变式3-3】(25-26高一上·山东潍坊·期末)某学校举行了“我向航天员提问”的趣味活动,现从同学们提出的问题中初选个不同类型问题进行连续编号(每个编号都由两个数字组成):利用随机数表法从中抽取个问题回答.若从下列随机数表第行第个数字开始,每次从左向右选取两个数字,则选出的第个问题编号为( )
A. B. C. D.
题型四 分层随机抽样的计算
解|题|技|巧
解决分层抽样的常用公式
先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.
(1)抽样比==;
(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.
【典例4】(24-25高一下·河北唐山·期末)某公司生产,,三种不同型号的电子产品,产量分别为100,400,300件,为检验不同产品的质量,现用分层抽样的方法从以上产品中抽取40件进行检验,则应从种型号的产品中抽取的件数为( )
A.5 B.10 C.15 D.20
【变式4-1】(24-25高一下·山东青岛·期末)某学校有男生2000名和女生1000名,为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法从该校学生中抽取一个容量为的样本,已知从男生中抽取100名学生,则为( )
A.150 B.200 C.250 D.300
【变式4-2】(24-25高一下·河南商丘·期末)某羽毛球俱乐部有队和队,其中队有名学员,队有名学员,为了解俱乐部学员的羽毛球水平,用比例分配的分层随机抽样的方法从该俱乐部中抽取一个容量为的样本,已知从队中抽取了名学员,则的值为( )
A. B. C. D.
【变式4-3】(24-25高一下·河北衡水·期末)某林区有针叶林、阔叶林、混交林三类树种区域,面积占比为,每个区域树种种植密度均相同.现采用分层随机抽样调查各类树种生长情况,若从针叶林区域抽取了120株样树,则在该林区总共抽取的树种数量为_______.
题型五 频率分布直方图及其计算
解|题|技|巧
由频率分布直方图进行相关计算需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
【典例5】(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
【变式5-1】(24-25高一下·北京平谷·期末)已知某校高一年级1000人,为普及航天知识,开展了航天知识竞赛.将成绩(单位:分)分成6组,绘制成频率分布直方图,如图所示:则成绩在分的有______人.
【变式5-2】(24-25高一下·河南许昌·期末)(多选)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级组织开展数学文化知识竞赛.从参赛的2000名考生成绩中随机抽取100个成绩进行统计,得到如图所示的频率分布直方图,其中90分以上视为优秀,则频率/组距( )
A.a的值为0.030
B.抽取的考生成绩的极差介于40分至60分之间
C.2000名考生中约有10名成绩优秀
D.估计有一半以上的考生的成绩介于70分至90分之间
【变式5-3】(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
题型六 条形图、扇形图与折线图的应用
解|题|技|巧
1、条形图:直读数值,快速计算数据最值、差值、总和、差值;
2、扇形图:依托整体占比100%计算,核心公式:部分量=总体量×占比、总体量=部分量÷占比、圆心角=360°×占比;
3、折线图:读取拐点数值,精准判断数据上升、下降、平稳的变化趋势.
【典例6】(24-25高一下·广东河源·期末)(多选)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
【变式6-1】(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【变式6-2】(24-25高一下·新疆喀什·期末)(多选)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总数为
B.该校高一学生中选考物化政组合的人数为
C.该校高一学生中选考物理的人数比选考历史的人数多
D.用比例分配的分层随机抽样方法从该校高一学生抽取人,则生史地组合抽取人
【变式6-3】(24-25高一上·河南南阳·期末)(多选)下图是2003年4月21日至5月15日上午10时,北京市非典型肺炎疫情新增数据走势图.
则下列说法正确的有( )
A.新增疑似的人数最多的是4月29日,新增确诊的人数最多的是4月27日
B.新增疑似的人数最多的是4月27日,新增确诊的人数最多的是4月29日
C.新增治愈的人数最多的是5月13日,新增死亡的人数最少的是5月15日
D.从图中可以看出,本次疫情得到了有效控制
题型七 百分位数的计算
解|题|技|巧
百分位数的计算步骤
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
【典例7】(24-25高一下·湖南邵阳·期末)数据13,15,18,20,21,26,27,29,31,35的第70百分位数是( )
A.27 B.28 C.29 D.30
【变式7-1】(24-25高一下·黑龙江·期末)2024年巴黎奥运会奖牌榜前8名的金牌数依次为40,40,20,18,16,15,14,13,则这组数据的上四分位数为( )
A.40 B.30 C.15 D.14.5
【变式7-2】(25-26高一上·江苏南通·期末)现有从小到大排列的数据2,3,4,,5,6,7,8,9,,10,11的25百分位数为( )
A.4 B. C.a D.
【变式7-3】(24-25高一下·安徽合肥·期末)一组数据按从小到大排列为:1,2,4,6,7,10,.这组数据的第60百分位数等于他们的平均数,则为( )
A.12 B.15 C.17 D.19
题型八 计算几个数的平均数、中位数、众数
易|错|提|醒
1、求中位数忘记排序,直接取原始数据中间值,导致结果错误;
2、误以为一组数据只有唯一一个众数,忽略多个众数的情况;
3、忽略极端值对平均数的影响,错误用平均数代表整体水平;
4、偶数个数据求中位数时,直接取中间两数之一,未计算平均值.
【典例8】(24-25高一下·浙江台州·期末)已知数据,,,的平均数为5,数据,,,的平均数为6,则数据,,…,,,,…,的平均数为( )
A. B.5 C.6 D.
【变式8-1】(24-25高一上·江西宜春·期末)数据的平均数是5,则数据的平均数是( )
A.9 B.5 C.10 D.4
【变式8-2】(24-25高一下·安徽·期末)某项比赛共有7个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是( )
A.极差 B.45%分位数 C.平均数 D.众数
【变式8-3】(24-25高一下·河北邯郸·期末)已知高一三班的某次数学测试中,某学习小组的成绩如下:70,75,94,85,85,90,86,90,85,100,则该小组成绩的平均数、众数、中位数的大小关系是( )
A.众数=中位数<平均数 B.众数<中位数<平均数
C.众数<平均数<中位数 D.众数=平均数<中位数
题型九 计算几个数的标准差与方差
易|错|提|醒
1、忘记先求平均数,直接代入计算,整体公式完全错误;
2、偏差未平方直接求和,混淆方差计算公式;
3、算出方差后漏开根号,误将方差当作标准差;
4、不会运用数据平移、缩放规律,计算量大、容易算错.
【典例9】(25-26高一上·江西上饶·期末)一组数据的平均数为7,则其方差为( )
A. B. C. D.
【变式9-1】(24-25高一下·内蒙古包头·期末)在某次测验中,有6位同学的平均成绩为75分,且前5位同学的成绩分别是70,76,72,70,72.则这6位同学成绩的标准差________.
【变式9-2】(25-26高一上·辽宁沈阳·阶段检测)若样本数据的标准差为6,则数据的方差为______
【变式9-3】(24-25高一下·湖南衡阳·期末)衡阳市一中高一某班45名学生成立了A、B两个数学兴趣小组,A组25人,B组20人,经过一个月的强化培训后进行了一次测试,在该次测试中,A组的平均成绩为82分,方差为8,B组的平均成绩为86.5分,方差为2,则在这次测试中全班学生成绩的方差为________.
题型十 用方差、标准差说明数据的波动程度
解|题|技|巧
利用样本的数字特征解决优化决策问题的依据
(1)标准差、方差越大,数据的离散程度越大,越不稳定;
标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【典例10】(24-25高一下·吉林·期末)下列叙述中,错误的是( )
A.样本数据的中位数可能不受少数几个极端值的影响
B.数据的标准差比较小时,数据比较分散
C.数据的极差反映了数据的集中程度
D.任何一个样本数据的改变都会引起平均数的改变
【变式10-1】(24-25高一下·广东汕头·期末)(多选)在某年的中国足球超级联赛上,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;乙队每场比赛平均失球数是2.1,全年失球个数的标准差是0.4.下列说法中正确的是( )
A.平均说来甲队比乙队防守技术好 B.甲队比乙队技术水平更稳定
C.甲队有时表现很差,有时表现又非常好 D.乙队很少不失球
【变式10-2】(24-25高一下·海南海口·期末)(多选)在一次对甲、乙两个工厂生产的相同数量的零件质量(单位:克)统计中,得到如下表:
工厂
平均质量
中位数
众数
方差
甲厂
63
63
61
乙厂
63
62
61
其中,根据统计数据,下列结论中正确的是( )
A.甲厂生产的零件质量稳定性优于乙厂
B.甲厂生产零件质量的极差可能小于乙厂
C.甲、乙两厂生产的零件中61克出现的次数相同
D.甲厂生产的零件中质量大于63克的数量多于乙厂
【变式10-3】(24-25高一下·山东德州·期末)(多选)为加强青少年科学健身普及和健康干预,让年轻一代在运动中强意志、健身心,某校举办一场篮球赛,其中每队上场5人,每人得分情况如下表(单位:分),则下列结论正确的是( )
甲队
乙队
5
10
23
12
8
8
8
15
7
6
A.运动员得分极差甲队大于乙队 B.运动员得分均值甲队小于乙队
C.甲队运动员得分的75%分位数为8 D.相较于甲队,乙队运动员实力更均衡
题型十一 统计的综合应用
解|题|技|巧
利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
【典例11】(24-25高一下·北京丰台·期末)为了解某校学生日均运动时长,某研究小组在该校随机抽取了200名学生,统计了他们日均运动时长,并将所得数据分组整理,得到右侧的频率分布直方图,给出下列四个结论:
①;
②这200名学生日均运动时长的平均数小于中位数;
③估计该校学生日均运动时长的第85百分位数约为2;
④从该校随机抽取一名学生,估计该学生日均运动时长不低于1小时的概率为.
其中所有正确结论的序号是( )
A.①② B.③④ C.①③④ D.①②③④
【变式11-1】(24-25高一下·湖南邵阳·期末)某校组织学生参加交通安全知识培训,培训后进行测试(满分:100分).现从该校参加培训测试的学生中随机抽取100名学生并统计他们的测试分数,按,,,,分成五组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计该校学生这次测试成绩的平均分(同一组中的数据以该组区间的中点值作代表);
(3)已知该校参加培训测试的学生有3500人,记测试成绩不低于90分的学生为优秀学员,估计该校这次测试的优秀学员的人数.
【变式11-2】(24-25高一下·内蒙古呼伦贝尔·期末)某零食超市某天接待了1250名顾客,老年375人,中青年625人,少年250人,景点为了提升服务质量,采用分层抽样从当天游客中抽取100人,以评分方式进行满意度回访.将统计结果按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,制成频率分布直方图如图:
(1)求抽取的样本中老年、中青年、少年的人数;
(2)求的值并估计当天游客满意度分值的平均数.(同一组中的数据以这组数据所在区间中点的值作代表);
(3)求样本数据的第85百分位数.
【变式11-3】(24-25高一下·天津·期末)2025年秋天将在天津举办上合组织峰会,为了加深师生对上合峰会的了解,天津某校举办了“上合组织峰会”知识竞赛,并将100名师生的竞赛成绩(满分100分,成绩取整数)分成六段后得到如下频率分布直方图.观察图形信息,回答下列问题:
(1)求a的值,并估计本次竞赛成绩的平均分(同一组中的数据用该组区间的中点值作代表);
(2)估计这组数据的第75百分位数;
(3)用分层抽样的方法在分数落在内的师生中随机抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人的分数在内的概率.
期末基础通关练(测试时间:10分钟)
1.(24-25高一下·黑龙江绥化·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
2.(23-24高一下·四川达州·期末)根据统计,2024年五一假期,网红城市C和H接待的旅客数分别为1亿和8千万,在这两城市用分层随机抽样的方法抽取360名旅客,则应在H城市抽取的人数为( )
A.80 B.100 C.200 D.160
3.(24-25高一下·河南濮阳·期末)2025年5月14日,长征二号丁运载火箭一次性将12颗太空计算卫星成功送入预定轨道.若各卫星从星箭分离至入轨所需时间(单位:秒)按升序排列为82,85,87,89,91,93,95,97,99,101,103,105,则这组数据的中位数为( )
A.94 B.93 C.92 D.91
4.(24-25高一下·湖北黄石·期末)用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为______.
5.(24-25高一下·安徽芜湖·期末)(多选)某学生一日时间分配饼形图,如图,下列说法正确的有( )
A.该饼形图为某一位中学生的一日时间分配情况
B.该饼形图为中学生这个群体的平均一日时间分配情况
C.该图表明中学生一日睡眠时间约为7小时
D.该图表明中学生一天花费在课外活动的时间与自由活动、通勤时间总和相当
期末重难突破练(测试时间:10分钟)
1.(24-25高一下·广东佛山·期末)(多选)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
2.(24-25高一下·湖北武汉·期末)某高校体检随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165],[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求和频率分布直方图中身高在175cm及以下的学生人数;
(2)估计该校100名学生身高的下四分位数(结果保留到个位数).
(3)已知落在区间[170,175)的样本平均数是173,方差是8,落在区间[175,180)的样本平均数是178,方差是6,求两组样本成绩合并后的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:记总的样本平均数为,样本方差为,则.
3.(24-25高一下·湖北黄石·期末)为调查某校学生的校志愿者活动情况,现抽取一个容量为100的样本,统计了这些学生一周内的校志愿者活动时长,并绘制了如下图所示的频率分布直方图,记数据分布在,,,,,,的频率分别为,,…,.已知,.
(1)求,的值;
(2)请根据样本数据估计,全校学生一周内的校志愿者活动平均时长为多少?
(3)学校现在准备对志愿者活动时长排在前10%的学生授予“志愿活动模范之星”的荣誉称号,根据样本数据估计,志愿者活动时长最少为多少分钟才可能被评为“志愿活动模范之星”?
期末综合拓展练(测试时间:15分钟)
1.(2025·全国二卷·高考真题)样本数据2,8,14,16,20的平均数为( )
A.8 B.9 C.12 D.18
2.(2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
3.(2023·新课标Ⅰ卷·高考真题)(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
4.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
1 / 4
学科网(北京)股份有限公司
$
专题05 统计(期末复习讲义)
内 容 导 航
明·期末考情 把握命题趋势,明确备考路径
记·必备知识 梳理核心脉络,扫除知识盲区
破·重难题型 题型分类突破,方法技巧精讲
题型01样本与总体的概念辨析 题型02简单随机抽样的概率问题
题型03随机数表法的应用 题型04分层随机抽样的计算
题型05频率分布直方图及其计算 题型06条形图、扇形图与折线图的应用
题型07百分位数的计算 题型08计算几个数的平均数、中位数、众数
题型09计算几个数的标准差与方差 题型10用方差、标准差说明数据的波动程度
题型11统计的综合应用
过·分层验收 阶梯实战演练,验收复习成效
核心考点
复习目标
考情规律
简单随机抽样
1、掌握简单随机抽样的特征,能准确判定抽样类型;
2、熟悉抽签法、随机数法的操作步骤;
3、能利用抽样特征解决简单判定、样本估计问题
基础必考点,小题为主,难度低;
命题趋势:依托课本基础情境考查抽样判定;
易错点:忽略“等概率、不放回”核心条件,混淆有放回与不放回抽样
分层随机抽样
1、掌握分层抽样的特点,区分与简单随机抽样的差异;
2、会按比例计算各层样本数量,掌握分层均值计算方法;
3、能解决实际情境中的抽样计算与总体估计问题
高频考点,小题、解答题均会考查;
命题趋势:结合实际统计情境综合命题,是抽样核心考点;
易错点:分层比例计算出错,分层均值未加权计算,混淆抽样类型
频率分布表与频率分布直方图
1、掌握频率分布表、直方图的绘制规则,明晰频数、频率、频率/组距的区别;
2、能熟练计算各类直方图核心参数;
3、能利用图表数据分析、估计总体分布规律
期末核心必考考点,小题、大题高频考查;命题趋势:常结合百分位数、统计量综合出题,为大题核心载体;
易错点:混淆频率与频率/组距,边界数据处理失误,计算频数频率出错
总体百分位数的估计
1、理解百分位数的定义与统计意义,熟记计算步骤;
2、能根据原始数据、频率直方图求解百分位数;
3、能用百分位数分析数据分布特征
高频易错考点,小题为主,难度中等;
命题趋势:结合频率直方图考查计算与定位
易错点:计算步骤不规范,直方图中百分位数定位错误,混淆百分位数与百分比
总体集中趋势的估计
1、理解众数、中位数、平均数的定义与区别;
2、能对原始数据、直方图数据求解三类统计量;
3、能结合实际情境选用统计量、解释数据特征
高频核心考点,大小题均有考查,综合性强;命题趋势:常与直方图、百分位数结合综合命题;
易错点:中位数计算未排序,直方图统计量求解出错,忽略极端值对平均数的影响
总体离散程度的估计
1、理解方差、标准差的定义与统计意义;2、能准确计算方差、标准差,判断数据离散与稳定性;
3、能结合实际情境分析数据波动情况
高频必考考点,小题直接计算,大题常综合考查;
命题趋势:搭配平均数、直方图命题,考查数据分析能力;
易错点:方差公式运用错误,混淆总体与样本方差,不会结合实际分析数据稳定性
说明:相当于“知识工具箱”,梳理本章节基础知识,提炼本单元核心概念、公式、法则、以及解题技巧方法等,注意添加示例或易错点以理解透彻该知识点。
知识点01 全面调查与抽样调查
1、全面调查
(1)定义:对每一个调查对象都进行调查的方法,成为全面调查,又称普查.在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体本.
(2)优点和缺点:优点是所有资料较为全面可靠;缺点是调查花费的人力、物力、财力较多,且调查时间较长,全面调查只在样本少的情况下适合采用本.
2、抽样调查
(1)定义:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查本.
(2)相关的概念:
①总体:所要考察对象的全体叫做总体
②样本:从总体中抽取出的若干个个体组成的集合叫作总体的一个样本
③个体:总体中的每一个考察对象叫作个体
④样本容量:样本中个体的数目叫作样本容量
⑤样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据本.
(3)优点和缺点:优点是迅速及时;节约人力、物力和财力;
缺点是调查结果不如全面调查全面、系统本.
知识点02 简单随机抽样
1、定义:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
2、两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.适用于总体个数较少的情况。
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.适用于总体个数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
3、简单随机抽样的特征(只有四个特点都满足的抽样才是简单随机抽样)
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
知识点03 分层随机抽样
1、定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
2、分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”
【注意】分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).
知识点04 用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于.
(2)频率分布直方图中数字特征的计算
①最高的小长方形底边中点的横坐标即是众数.
②中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
2、百分位数
(1)定义:一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
(3)四分位数:我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
3、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
(2)标准差和方差
①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
【注意】标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
③平均数、方差的性质:如果数据的平均数为,方差为,那么
一组新数据的平均数为,方差是.
一新数据的平均数为,方差是.
一组新数据的平均数为,方差是.
题型一 样本与总体的概念辨析
解|题|技|巧
1、概念辨析关键点:总体、样本均是研究对象的某项数量指标,而非对象本身.
2、混淆样本和样本容量:误将抽取的个体当作样本容量,或给样本容量添加单位.
【典例1】(24-25高一下·河北沧州·期末)某校高中有42个班,每个班有50名学生,现从该校高中每班随机选派3名学生参加交通安全知识竞赛并统计参赛人员的成绩,则其样本量是( )
A.42 B.50 C.126 D.150
【答案】C
【解析】由题意可知样本量是.故选:C
【变式1-1】(25-26高一上·陕西渭南·期末)为了解某校七年级学生的近视情况,从中随机抽取40名学生进行调查,其中40是该调查的( )
A.总体 B.样本容量 C.个体 D.样本
【答案】B
【解析】为了了解某校七年级学生的近视情况,从中随机抽取40名学生,并对他们的近视进行分析,
样本是总体中所抽取的一部分个体,样本容量则是指样本中个体的数目,
则在该调查中,40是样本容量.故选:B.
【变式1-2】(24-25高一下·甘肃兰州·阶段检测)某校为了解高三年级学生体重情况,从该年级1000名学生中抽取125名学生测量他们的体重进行分析.在这项调查中,抽取的125名学生的体重是( )
A.总体 B.样本 C.总体容量 D.样本容量
【答案】B
【解析】抽取的125名学生的体重是样本,故选:B
【变式1-3】(2026高一上·山东东营·专题练习)某高中为了了解高一年级1200名学生的视力情况,抽查了其中200名学生的视力,并进行统计分析.下列叙述正确的是( )
A.上述调查属于普查 B.每名学生是总体的一个个体
C.200名学生的视力是总体的一个样本 D.1200名学生是总体
【答案】C
【解析】对于A,因为抽取一部分对象的调查方式是抽查,对全体对象进行研究的调查方式是普查,
所以此调查为抽样调查,所以A错误;
对于B,每名学生的视力是总体的一个个体,所以B错误;
对于C,200名学生的视力是总体的一个样本,所以C正确;
对于D,1200名学生的视力是总体,所以D错误.故选:C
题型二 简单随机抽样的概率问题
解|题|技|巧
1、简单随机抽样核心性质:总体中每个个体被抽到的概率均等,与抽样先后、抽取顺序无关.
2、概率通用公式:单个个体被抽取概率:P=样本容量/总体容量.
3、核心前提:满足等概率、不放回、随机性三大条件,方可套用公式计算.
【典例2】(25-26高一上·河南·期末)采用简单随机抽样的方法,从含有25个个体的总体中抽取1个容量为10的样本,则某个个体被抽到的概率为( )
A. B. C. D.
【答案】B
【解析】由于每个个体被抽到的概率相等,
所以每个个体被抽到的概率是.故选:B
【变式2-1】(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【答案】D
【解析】总体有个个体,每个个体被抽到的概率相同,均为,故选:D.
【变式2-2】(25-26高二上·广东中山·阶段检测)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( )
A. B. C. D.
【答案】B
【解析】从第二次开始抽取时,余下的每个个体被抽到的概率为,
则,解得,
故在整个抽样过程中,每个个体被抽到的可能性为.故选:B.
【变式2-3】(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = , B.a = , C.a = , D.a = ,
【答案】B
【解析】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以李华第一次被抽到的可能性为,
第五次被抽到的可能性为.
即李华同学在每次抽样中被抽到的可能性都是,所以,.故选:B.
题型三 随机数表法的应用
解|题|技|巧
应用随机数表法的两个关键点
1、确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;
2、读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
【典例3】(25-26高一上·辽宁大连·期末)现从编号为的50支水笔中抽取10支水笔进行书写长度检测,若从以下随机数表第9个数字开始由左向右读取,则抽取的第3支水笔的编号为__________.
【答案】32
【解析】先从随机数表第 9 个数字开始读取:
随机数表:39832776 39918535 32591131 40469235 04982212 20671263
第 9 个数字是 3(来自第二组 39918535),
从左向右依次读取两位数字,并筛选出在 01~50 范围内且不重复的编号:
第 1 个:39 → 有效,对应编号 39
第 2 个:91 → 无效(>50),跳过
第 3 个:85 → 无效(>50),跳过
第 4 个:35 → 有效,对应编号 35
第 5 个:32 → 有效,对应编号 32
所以,抽取的第 3 支水笔的编号为 32.
【变式3-1】(24-25高一下·福建福州·期末)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
【答案】B
【解析】由题知,选取的同学编号分别是442,175,572,175,455,608,331,047,
剔除重复数据,超过500的数据,符合条件的是442,175,455,331,047,第五个是047.故选:B.
【变式3-2】(25-26高一上·江西景德镇·期末)从某班55位学生中利用下面的随机数表抽取10位同学参加一项活动,将这55位学生按01、02、…、55进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,则选出来的第5个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
A.51 B.25 C.32 D.12
【答案】D
【解析】从随机数表第1行第2个数字开始由左向右依次选取两个数字,去掉超过55和重复的号码,
选取的号码依次为: 31,32,43,25,12,51,26, 04, 01,11,
所以选出来的第5个号码所对应的学生编号为12.故选:D.
【变式3-3】(25-26高一上·山东潍坊·期末)某学校举行了“我向航天员提问”的趣味活动,现从同学们提出的问题中初选个不同类型问题进行连续编号(每个编号都由两个数字组成):利用随机数表法从中抽取个问题回答.若从下列随机数表第行第个数字开始,每次从左向右选取两个数字,则选出的第个问题编号为( )
A. B. C. D.
【答案】B
【解析】由题可知依次选取符合条件的5个数字为:.
所以选出的第个问题编号为11.故选B
题型四 分层随机抽样的计算
解|题|技|巧
解决分层抽样的常用公式
先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.
(1)抽样比==;
(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.
【典例4】(24-25高一下·河北唐山·期末)某公司生产,,三种不同型号的电子产品,产量分别为100,400,300件,为检验不同产品的质量,现用分层抽样的方法从以上产品中抽取40件进行检验,则应从种型号的产品中抽取的件数为( )
A.5 B.10 C.15 D.20
【答案】C
【解析】依题意,分层抽样的抽样比为,
所以从种型号的产品中抽取的件数为.故选:C
【变式4-1】(24-25高一下·山东青岛·期末)某学校有男生2000名和女生1000名,为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法从该校学生中抽取一个容量为的样本,已知从男生中抽取100名学生,则为( )
A.150 B.200 C.250 D.300
【答案】A
【解析】由题知,,解得.故选:A
【变式4-2】(24-25高一下·河南商丘·期末)某羽毛球俱乐部有队和队,其中队有名学员,队有名学员,为了解俱乐部学员的羽毛球水平,用比例分配的分层随机抽样的方法从该俱乐部中抽取一个容量为的样本,已知从队中抽取了名学员,则的值为( )
A. B. C. D.
【答案】D
【解析】根据分层抽样可得,解得.故选:D.
【变式4-3】(24-25高一下·河北衡水·期末)某林区有针叶林、阔叶林、混交林三类树种区域,面积占比为,每个区域树种种植密度均相同.现采用分层随机抽样调查各类树种生长情况,若从针叶林区域抽取了120株样树,则在该林区总共抽取的树种数量为_______.
【答案】
【解析】由题意,设该林区总共抽取的树种数量为,
因为针叶林、阔叶林、混交林三类树种区域的面积占比为,
所以针叶林区域占比为,
又因为从针叶林区域抽取了株样树,
所以,解得,
故该林区总共抽取的树种数量为.
题型五 频率分布直方图及其计算
解|题|技|巧
由频率分布直方图进行相关计算需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
【典例5】(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
【答案】A
【解析】由图可得,得,
所以估计这100名学生中身高低于170cm的人数为.故选:A
【变式5-1】(24-25高一下·北京平谷·期末)已知某校高一年级1000人,为普及航天知识,开展了航天知识竞赛.将成绩(单位:分)分成6组,绘制成频率分布直方图,如图所示:则成绩在分的有______人.
【答案】
【解析】因为成绩在分的频率为,
所以成绩在分的有人.
【变式5-2】(24-25高一下·河南许昌·期末)(多选)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级组织开展数学文化知识竞赛.从参赛的2000名考生成绩中随机抽取100个成绩进行统计,得到如图所示的频率分布直方图,其中90分以上视为优秀,则频率/组距( )
A.a的值为0.030
B.抽取的考生成绩的极差介于40分至60分之间
C.2000名考生中约有10名成绩优秀
D.估计有一半以上的考生的成绩介于70分至90分之间
【答案】ABD
【解析】依题意,,解得,A选项正确.
根据频率分布直方图,,
所以极差介于40分至60分之间,B选项正确.
90分以上频率为,对应有人,C选项错误.
成绩介于70分至90分之间的频率为,
所以估计有一半以上的考生的成绩介于70分至90分之间,D选项正确.故选:ABD
【变式5-3】(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
【答案】(1)表格见解析;(2)作图见解析;(3)504
【解析】(1)由频率分布表,可知样本容量为50,
故成绩在[60,70)的频数为,
成绩在[70,80)的频率为,
成绩在[90,100]的频数为,
频率为,
故频率分布表为:
分组
频数
频率
[50,60)
4
0.08
[60,70)
8
0.16
[70,80)
10
0.20
[80,90)
16
0.32
[90,100]
12
0.24
合计
50
1
(2)频率分布直方图如图所示:
(3)样本中成绩在[80,100]的频率为0.32 + 0.24 = 0.56,
所以估计该校获得环保纪念勋章的学生人数为900×0.56 = 504.
题型六 条形图、扇形图与折线图的应用
解|题|技|巧
1、条形图:直读数值,快速计算数据最值、差值、总和、差值;
2、扇形图:依托整体占比100%计算,核心公式:部分量=总体量×占比、总体量=部分量÷占比、圆心角=360°×占比;
3、折线图:读取拐点数值,精准判断数据上升、下降、平稳的变化趋势.
【典例6】(24-25高一下·广东河源·期末)(多选)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
【答案】ABC
【解析】对于A,根据条形图,2024年,我国数字阅读用户规模为6.7亿,网民规模为11.1亿,
数字阅读用户规模约占网民规模的,故A正确;
对于B,近五年,我国数字阅读用户规模的增长量为亿,
网民规模的增长量为亿,
数字阅读用户规模的增长量大于网民规模的增长量,故B正确;
对于C,根据条形图,可以看出,从2020年至2024年,
我国数字阅读用户规模在逐年递增,故C正确;
对于D,根据条形图,从2020年至2021年,我国网民规模的增长率为,
从2023年至2024年,我国网民规模的增长率为,增长率减小了,故D错误.
故选:ABC.
【变式6-1】(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【答案】A
【解析】结合图1和图2,计算可得2020至2024年第一产业增加值依次为
3167.578,3362.034,3505.425,3520.571,3543.75,成递增趋势,故A错误;
结合图1和图2,计算可得2020至2024年第二产业增加值依次为
15297.084,16939.479,17709.225,18712.076,19591.875,成递增趋势,故B正确;
由图2可知,2020至2024年第三产业增加值占地区生产总值比重逐年升高,故C正确;
由图1可知,2020至2024年全省地区生产总值逐年增长,故D正确.故选:A.
【变式6-2】(24-25高一下·新疆喀什·期末)(多选)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总数为
B.该校高一学生中选考物化政组合的人数为
C.该校高一学生中选考物理的人数比选考历史的人数多
D.用比例分配的分层随机抽样方法从该校高一学生抽取人,则生史地组合抽取人
【答案】ACD
【解析】由扇形图和条形图可知,选政史地的人数为人,占比,
所以该校高一学生总数为人,A说法正确;
由扇形图可知选择物化生的人数为人,
所以选择物化地和物化政的人数为人,
又因为选考物化地和物化政组合的人数相等,
所以选考物化地和物化政组合的人数均为人,B说法错误;
该校高一学生中选考物理的人数有人,选考历史的人数有人,
选考物理的人数比选考历史的人数多,C说法正确;
因为选考生史地的学生人数占比为,
所以用比例分配的分层随机抽样方法从该校高一学生抽取人,
则生史地组合抽取人,D说法正确;
故选:ACD
【变式6-3】(24-25高一上·河南南阳·期末)(多选)下图是2003年4月21日至5月15日上午10时,北京市非典型肺炎疫情新增数据走势图.
则下列说法正确的有( )
A.新增疑似的人数最多的是4月29日,新增确诊的人数最多的是4月27日
B.新增疑似的人数最多的是4月27日,新增确诊的人数最多的是4月29日
C.新增治愈的人数最多的是5月13日,新增死亡的人数最少的是5月15日
D.从图中可以看出,本次疫情得到了有效控制
【答案】BCD
【解析】新增疑似的人数最多的是4月27日162例,
新增确诊的人数最多的是4月29日157例,故A错误,B正确;
新增治愈的人数最多的是5月13日35例,新增死亡的人数最少的是5月15日1例,故C正确;
由图,预测这次北京市非典型性肺炎疫情的发展趋势为:
疫情初期确诊病例和疑似病例数量快速上升,然后确诊病例和疑似病例数量逐渐下降,
本次疫情得到了有效控制,故D正确.
故选:BCD.
题型七 百分位数的计算
解|题|技|巧
百分位数的计算步骤
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
【典例7】(24-25高一下·湖南邵阳·期末)数据13,15,18,20,21,26,27,29,31,35的第70百分位数是( )
A.27 B.28 C.29 D.30
【答案】B
【解析】因为,
所以这组数据的第70百分位数是第7个与第8个数据的平均数,即.故选:B
【变式7-1】(24-25高一下·黑龙江·期末)2024年巴黎奥运会奖牌榜前8名的金牌数依次为40,40,20,18,16,15,14,13,则这组数据的上四分位数为( )
A.40 B.30 C.15 D.14.5
【答案】B
【解析】由题设,数据从小到大为,且,
所以数据的上四分位数为.故选:B
【变式7-2】(25-26高一上·江苏南通·期末)现有从小到大排列的数据2,3,4,,5,6,7,8,9,,10,11的25百分位数为( )
A.4 B. C.a D.
【答案】B
【解析】该组数据共有12个数,
因为,
所以该组数据的25百分位数为第3,第4个数的平均数,为.故选:B
【变式7-3】(24-25高一下·安徽合肥·期末)一组数据按从小到大排列为:1,2,4,6,7,10,.这组数据的第60百分位数等于他们的平均数,则为( )
A.12 B.15 C.17 D.19
【答案】D
【解析】位置,根据百分位数的计算规则,第60百分位数是第5个数据,即7,
因为这组数据的第60百分位数等于他们的平均数,
所以,解得.故选:D
题型八 计算几个数的平均数、中位数、众数
易|错|提|醒
1、求中位数忘记排序,直接取原始数据中间值,导致结果错误;
2、误以为一组数据只有唯一一个众数,忽略多个众数的情况;
3、忽略极端值对平均数的影响,错误用平均数代表整体水平;
4、偶数个数据求中位数时,直接取中间两数之一,未计算平均值.
【典例8】(24-25高一下·浙江台州·期末)已知数据,,,的平均数为5,数据,,,的平均数为6,则数据,,…,,,,…,的平均数为( )
A. B.5 C.6 D.
【答案】D
【解析】因为数据,,,的平均数为5,数据,,,的平均数为6,
所以数据,,…,,,,…,的平均数为.故选:D.
【变式8-1】(24-25高一上·江西宜春·期末)数据的平均数是5,则数据的平均数是( )
A.9 B.5 C.10 D.4
【答案】A
【解析】由题意可得,
所以,
所以的平均数.故选:A.
【变式8-2】(24-25高一下·安徽·期末)某项比赛共有7个评委评分,若去掉一个最高分与一个最低分,则与原始数据相比,一定不变的是( )
A.极差 B.45%分位数 C.平均数 D.众数
【答案】B
【解析】不妨设原始数据为:,
原始数据的极差为:,平均数为,众数为,
去掉一个最高分与一个最低分后剩下数据为:,
剩下数据的极差为:,平均数为,众数为和3,
由此可知,与原始数据相比,剩下数据的极差,平均数,众数可能发生改变,故A,C,D错误,
对于B项,假设这7个数据从小到大为,
去掉一个最高分与一个最低分后剩下数据为:,
因为,,
所以原始数据的分位数为第四个数,即,剩下的数据的分位数为第3个数,即
所以与原始数据相比,剩下数据的分位数不变,故B正确;
故选:B.
【变式8-3】(24-25高一下·河北邯郸·期末)已知高一三班的某次数学测试中,某学习小组的成绩如下:70,75,94,85,85,90,86,90,85,100,则该小组成绩的平均数、众数、中位数的大小关系是( )
A.众数=中位数<平均数 B.众数<中位数<平均数
C.众数<平均数<中位数 D.众数=平均数<中位数
【答案】B
【解析】学习小组的成绩从小到大排列如下:70,75,85,85,85,86,90,90,94,100,
众数为85;中位数为,
平均数为,
故众数<中位数<平均数,故选:B
题型九 计算几个数的标准差与方差
易|错|提|醒
1、忘记先求平均数,直接代入计算,整体公式完全错误;
2、偏差未平方直接求和,混淆方差计算公式;
3、算出方差后漏开根号,误将方差当作标准差;
4、不会运用数据平移、缩放规律,计算量大、容易算错.
【典例9】(25-26高一上·江西上饶·期末)一组数据的平均数为7,则其方差为( )
A. B. C. D.
【答案】B
【解析】由题意知,,解得.
故方差为:.
故选:B.
【变式9-1】(24-25高一下·内蒙古包头·期末)在某次测验中,有6位同学的平均成绩为75分,且前5位同学的成绩分别是70,76,72,70,72.则这6位同学成绩的标准差________.
【答案】7
【解析】前5位同学的成绩分别是70,76,72,70,72,6位同学的平均成绩为75分,
设第6位学生分数为,
所以,所以,
所以方差为,
所以标准差为.
【变式9-2】(25-26高一上·辽宁沈阳·阶段检测)若样本数据的标准差为6,则数据的方差为______
【答案】144
【解析】由样本数据的标准差为6,即方差为36,
则数据的方差为.
【变式9-3】(24-25高一下·湖南衡阳·期末)衡阳市一中高一某班45名学生成立了A、B两个数学兴趣小组,A组25人,B组20人,经过一个月的强化培训后进行了一次测试,在该次测试中,A组的平均成绩为82分,方差为8,B组的平均成绩为86.5分,方差为2,则在这次测试中全班学生成绩的方差为________.
【答案】
【解析】设,,,,,,
则全班学生成绩的平均数为,
全班学生成绩的方差为
.
题型十 用方差、标准差说明数据的波动程度
解|题|技|巧
利用样本的数字特征解决优化决策问题的依据
(1)标准差、方差越大,数据的离散程度越大,越不稳定;
标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【典例10】(24-25高一下·吉林·期末)下列叙述中,错误的是( )
A.样本数据的中位数可能不受少数几个极端值的影响
B.数据的标准差比较小时,数据比较分散
C.数据的极差反映了数据的集中程度
D.任何一个样本数据的改变都会引起平均数的改变
【答案】B
【解析】对于A,样本数据的中位数可能不受少数几个极端值的影响,故A正确;
对于B,数据的标准差比较小时,数据比较集中,故B错误;
对于C,数据的极差反映了数据的集中程度,故C正确;
对于D,任何一个样本数据的改变都会引起平均数的改变,故D正确。故选:B.
【变式10-1】(24-25高一下·广东汕头·期末)(多选)在某年的中国足球超级联赛上,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;乙队每场比赛平均失球数是2.1,全年失球个数的标准差是0.4.下列说法中正确的是( )
A.平均说来甲队比乙队防守技术好 B.甲队比乙队技术水平更稳定
C.甲队有时表现很差,有时表现又非常好 D.乙队很少不失球
【答案】ACD
【解析】对于A,由甲队每场比赛平均失球数是1.5,乙队每场比赛平均失球数是2.1,
说明甲队每场比赛平均失球数比乙队每场比赛平均失球数少,
所以平均说来甲队比乙队防守技术好,故A正确;
对于B、C,甲队全年比赛失球个数的标准差为1.1,
乙队全年失球个数的标准差是0.4,
说明甲队全年比赛失球个数的标准差较大,
所以甲队的表现时好时坏,起伏较大,故B错误,C正确;
对于D,乙队的平均失球数多,全年失球个数的标准差很小,
说明乙队的表现较稳定,经常失球,故D正确.
故选:ACD
【变式10-2】(24-25高一下·海南海口·期末)(多选)在一次对甲、乙两个工厂生产的相同数量的零件质量(单位:克)统计中,得到如下表:
工厂
平均质量
中位数
众数
方差
甲厂
63
63
61
乙厂
63
62
61
其中,根据统计数据,下列结论中正确的是( )
A.甲厂生产的零件质量稳定性优于乙厂
B.甲厂生产零件质量的极差可能小于乙厂
C.甲、乙两厂生产的零件中61克出现的次数相同
D.甲厂生产的零件中质量大于63克的数量多于乙厂
【答案】AB
【解析】根据表格有,所以甲厂生产的零件质量稳定性优于乙厂,故A正确;
根据平均数,中位数和众数不能判断极差,而,
所以甲厂生产零件质量的极差可能小于乙厂,故B正确;
根据众数的定义可知,众数是出现次数最多的,
不能判断甲、乙两厂生产的零件中61克出现的次数相同,故C错误;
由于甲乙两厂的平均质量为63克,
不能判断甲厂生产的零件中质量大于63克的数量多于乙厂,故D错误.
故选:AB.
【变式10-3】(24-25高一下·山东德州·期末)(多选)为加强青少年科学健身普及和健康干预,让年轻一代在运动中强意志、健身心,某校举办一场篮球赛,其中每队上场5人,每人得分情况如下表(单位:分),则下列结论正确的是( )
甲队
乙队
5
10
23
12
8
8
8
15
7
6
A.运动员得分极差甲队大于乙队 B.运动员得分均值甲队小于乙队
C.甲队运动员得分的75%分位数为8 D.相较于甲队,乙队运动员实力更均衡
【答案】AD
【解析】对于A,甲队的极差为,乙队的极差为,,故A正确;
对于B,甲队得分平均数,
乙队得分平均数,,故B错误;
对于C,将甲队的数据由小到大排列:,
因为,所以甲队运动员得分的75%分位数为12,故C错误;
对于D,由表中数据观察,乙队的得分更加集中,
即相较于甲队,乙队运动员实力更均衡,故D正确.
故选:AD.
题型十一 统计的综合应用
解|题|技|巧
利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
【典例11】(24-25高一下·北京丰台·期末)为了解某校学生日均运动时长,某研究小组在该校随机抽取了200名学生,统计了他们日均运动时长,并将所得数据分组整理,得到右侧的频率分布直方图,给出下列四个结论:
①;
②这200名学生日均运动时长的平均数小于中位数;
③估计该校学生日均运动时长的第85百分位数约为2;
④从该校随机抽取一名学生,估计该学生日均运动时长不低于1小时的概率为.
其中所有正确结论的序号是( )
A.①② B.③④ C.①③④ D.①②③④
【答案】C
【解析】由题可知:①,正确;
②平均数为,
日均运动时长在的频率为:,日均运动时长在的频率为:,
可知中位数一定落在,设中位数为,则,
所以平均数大于中位数,错误;
③日均运动时长在的频率为:,可知第85百分位数落在,
设该数为,则,正确;
④从该校随机抽取一名学生,
估计该学生日均运动时长不低于1小时的概率为,正确.
故选:C
【变式11-1】(24-25高一下·湖南邵阳·期末)某校组织学生参加交通安全知识培训,培训后进行测试(满分:100分).现从该校参加培训测试的学生中随机抽取100名学生并统计他们的测试分数,按,,,,分成五组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计该校学生这次测试成绩的平均分(同一组中的数据以该组区间的中点值作代表);
(3)已知该校参加培训测试的学生有3500人,记测试成绩不低于90分的学生为优秀学员,估计该校这次测试的优秀学员的人数.
【答案】(1);(2)78;(3)525
【解析】(1)由图可得,解得;
(2)估计该校学生这次测试成绩的平均分为:
分;
(3)由图可得测试成绩不低于90分的频率为0.15,
则该校这次测试的优秀学员的人数约为.
【变式11-2】(24-25高一下·内蒙古呼伦贝尔·期末)某零食超市某天接待了1250名顾客,老年375人,中青年625人,少年250人,景点为了提升服务质量,采用分层抽样从当天游客中抽取100人,以评分方式进行满意度回访.将统计结果按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,制成频率分布直方图如图:
(1)求抽取的样本中老年、中青年、少年的人数;
(2)求的值并估计当天游客满意度分值的平均数.(同一组中的数据以这组数据所在区间中点的值作代表);
(3)求样本数据的第85百分位数.
【答案】(1)中老年、中青年、少年的人数分别为30人、50人、20人;(2),平均数为;(3)
【解析】(1)由题可知:老年抽取:人,
中青年抽取:人,
少年抽取人.
(2)由图可知:,
平均数为:
(3)的频率为:;的频率为;
的频率为;的频率为;
所以可知第85百分位数落在,
所以第85百分位数为
【变式11-3】(24-25高一下·天津·期末)2025年秋天将在天津举办上合组织峰会,为了加深师生对上合峰会的了解,天津某校举办了“上合组织峰会”知识竞赛,并将100名师生的竞赛成绩(满分100分,成绩取整数)分成六段后得到如下频率分布直方图.观察图形信息,回答下列问题:
(1)求a的值,并估计本次竞赛成绩的平均分(同一组中的数据用该组区间的中点值作代表);
(2)估计这组数据的第75百分位数;
(3)用分层抽样的方法在分数落在内的师生中随机抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人的分数在内的概率.
【答案】(1),71;(2)82分;(3)
【解析】(1)根据频率分布直方图可知:,即;
估计本次竞赛成绩的平均分为
.
(2)由图中前四组面积之和为:,
图中前五组面积之和为:,
故这组数据的第75百分位数在第五组数据中,
设这组数据的第75百分位数为m,
则有,
故,即估计这组数据的第75百分位数为82分;
(3)用分层抽样的方法在分数在内的师生中抽取一个容量为6的样本,
其中分数在的人数为2,分别记为a、b,分数在的人数为4,
分别记为A,B,C,D从6人中任取2人,所有的基本事件有:
ab、aA、aB、aC、aD、bA、bB、bC、bD、AB、AC、AD、BC、BD、CD,共15种,
其中,事件“从6人中任取2人,至多有1人的分数在内”所包含的基本事件有:
ab、aA、aB、aC、aD、bA、bB、bC、bD,共9种,
故所求概率为.
期末基础通关练(测试时间:10分钟)
1.(24-25高一下·黑龙江绥化·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
【答案】C
【解析】设这批米内夹谷约为石,根据样本的性质可得,求得,
即这批米内夹谷约为230石,故选:C.
2.(23-24高一下·四川达州·期末)根据统计,2024年五一假期,网红城市C和H接待的旅客数分别为1亿和8千万,在这两城市用分层随机抽样的方法抽取360名旅客,则应在H城市抽取的人数为( )
A.80 B.100 C.200 D.160
【答案】D
【解析】根据题意,网红城市C和H接待的旅客数比例为,
所以应在H城市抽取的人数为.故选:D.
3.(24-25高一下·河南濮阳·期末)2025年5月14日,长征二号丁运载火箭一次性将12颗太空计算卫星成功送入预定轨道.若各卫星从星箭分离至入轨所需时间(单位:秒)按升序排列为82,85,87,89,91,93,95,97,99,101,103,105,则这组数据的中位数为( )
A.94 B.93 C.92 D.91
【答案】A
【解析】由题意可得这12个数据的中位数为第6位和第7位数的平均数,故A正确;故选:A.
4.(24-25高一下·湖北黄石·期末)用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为______.
【答案】0.1
【解析】由题意可得用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,
则个体m被抽到的概率为.
5.(24-25高一下·安徽芜湖·期末)(多选)某学生一日时间分配饼形图,如图,下列说法正确的有( )
A.该饼形图为某一位中学生的一日时间分配情况
B.该饼形图为中学生这个群体的平均一日时间分配情况
C.该图表明中学生一日睡眠时间约为7小时
D.该图表明中学生一天花费在课外活动的时间与自由活动、通勤时间总和相当
【答案】BCD
【解析】根据题意,上图为中学生一日时间分配饼形图,
不能确定是某一位中学生的具体一日时间分配,故A错误;
该饼形图为中学生这个群体的平均一日时间分配情况,B正确;
该图表明中学生一日睡眠时间约为小时,
从而估计中学生一日睡眠时间约为7小时,C正确;
该图表明中学生一天花费在课外活动的时间为小时,
自由活动、通勤时间总和为小时,
故中学生一天花费在课外活动的时间与自由活动、通勤时间总和相当,D正确.
故选:BCD
期末重难突破练(测试时间:10分钟)
1.(24-25高一下·广东佛山·期末)(多选)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
【答案】ABD
【解析】因为2025年高明线的参与人数是2016年的2倍,则2016年的高明线的参与人数是万人,
对于A:根据扇形图得出万,
所以2016年佛山50公里徒步总的参与人数是20万,A选项正确;
2016年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:
万,万,万,万,万,
2025年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:
万,万,万,万,万,
对于B:因为,
2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和,B选项正确;
对于C:五条线的参与人数2025年与2016年相比增加人数最少的是高明线,C选项错误;
对于D:南海线的参与人数2025年与2016年相比增长率,
顺德线的参与人数2025年与2016年相比增长率,
禅城线的参与人数2025年与2016年相比增长率,
三水线的参与人数2025年与2016年相比增长率,
高明线的参与人数2025年与2016年相比增长率,
所以五条线的参与人数2025年与2016年相比增长率最高的是南海线,D选项正确;
故选:ABD.
2.(24-25高一下·湖北武汉·期末)某高校体检随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165],[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求和频率分布直方图中身高在175cm及以下的学生人数;
(2)估计该校100名学生身高的下四分位数(结果保留到个位数).
(3)已知落在区间[170,175)的样本平均数是173,方差是8,落在区间[175,180)的样本平均数是178,方差是6,求两组样本成绩合并后的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:记总的样本平均数为,样本方差为,则.
【答案】(1);人;(2);(3);
【解析】(1)由频率分布直方图可知,解得,
身高在175cm及以下的学生人数(人).
(2)的人数占比为,的人数占比为,
所以该校100名学生身高的下四分位数即分位数落在,
设该校100名学生身高的分位数为,
则,解得,
故该校100名生学身高的下四分位数约为168.
(3)由频率分布直方图知,
这100名学生的身高在的有,
身高在的有人,
所以,
,
所以两组样本成绩合并后的平均数为,方差为.
3.(24-25高一下·湖北黄石·期末)为调查某校学生的校志愿者活动情况,现抽取一个容量为100的样本,统计了这些学生一周内的校志愿者活动时长,并绘制了如下图所示的频率分布直方图,记数据分布在,,,,,,的频率分别为,,…,.已知,.
(1)求,的值;
(2)请根据样本数据估计,全校学生一周内的校志愿者活动平均时长为多少?
(3)学校现在准备对志愿者活动时长排在前10%的学生授予“志愿活动模范之星”的荣誉称号,根据样本数据估计,志愿者活动时长最少为多少分钟才可能被评为“志愿活动模范之星”?
【答案】(1),;(2);(3)325分钟
【解析】(1)由图知:,,
,
,,,
由于,则;
(2)平均时长为
分钟;
(3)由题目可知即求样本数据的第90百分位数,由(1)可知
,,
故第90百分位数落在第六组,由,
可算出第六组小长方形的高为,
假设第90百分位数为x,则有,
解得,故最少需要325分钟.
期末综合拓展练(测试时间:15分钟)
1.(2025·全国二卷·高考真题)样本数据2,8,14,16,20的平均数为( )
A.8 B.9 C.12 D.18
【答案】C
【解析】样本数据的平均数为.故选:C.
2.(2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【答案】C
【解析】对于 A, 根据频数分布表可知, ,
所以亩产量的中位数不小于 , 故 A 错误;
对于B,亩产量不低于的频数为,
所以低于的稻田占比为,故B错误;
对于C,稻田亩产量的极差最大为,最小为,故C正确;
对于D,由频数分布表可得,平均值为
,故D错误.故选;C.
3.(2023·新课标Ⅰ卷·高考真题)(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【答案】BD
【解析】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:举反例说明,例如:,则平均数,
标准差,
,则平均数,
标准差,显然,即,
所以的标准差不小于的标准差,这一论断不成立,故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
4.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【答案】(1),;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【解析】(1),
,
,
的值分别为: ,
故
(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
1 / 4
学科网(北京)股份有限公司
$