摘要:
**基本信息**
以10大题型为载体,融合知识清单与思维导图,构建“抽样方法-数据处理-特征分析-综合应用”的统计方法体系,强化数据观念与模型意识。
**专项设计**
|模块|题量/典例|方法提炼|知识逻辑|
|----|-----------|----------|----------|
|抽样方法|20题|简单随机抽样(抽签法/随机数法)、分层抽样的比例计算与方法选取|从总体到样本的抽样原理→两种抽样方法的适用场景与操作步骤|
|数据整理与分析|10题|频率分布直方图制作与参数估计、统计图信息提取|数据获取→图表化呈现→数据分布规律分析|
|数字特征|15题|百分位数计算、平均数/方差的统计意义与公式应用|集中趋势(众数/中位数/平均数)→离散程度(方差/标准差)→数据特征的综合描述|
|统计案例|5题|实际问题的数据分析报告撰写|统计方法→案例应用→结论推断与建议|
内容正文:
专题06 统计(10大重点题型+思维导图+知识清单)(期末专项训练)
【人教A版】
题型归纳
【知识清单1 简单随机抽样】
1.抽样调查的必要性
(1)相关概念
名称
定义
全面调查(普查)
对每一个调查对象都进行调查的方法.
抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体
调查对象的全体.
个体
从总体中抽取的那部分个体.
样本
从总体中抽取的那部分个体.
样本量
样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法
优点
缺点
适用范围
抽签法
简单易行.
总体量较大时,操作起来比较麻烦.
适用于总体中个体数不多的情形.
随机数法
简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题.
总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便.
总体量较大,样本量较小的情形.
4.总体平均数与样本平均数
(1)概念
名称
定义
总体均值(总体平均数)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式.
样本均值(样本平均数)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数;
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
(2)求和符号∑的性质
①;
②,其中k为常数.
【知识清单2 分层随机抽样】
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即:
①;
②.
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层、第2层的总体平均数分别为,第1层、第2层的样本平均数分别为,总体平均数为,样本平均数为,则.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
又,所以.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【知识清单3 获取数据的途径】
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【知识清单4 总体取值规律的估计】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【知识清单5 总体百分位数的估计】
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【知识清单6 总体集中趋势的估计】
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平均数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中位数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【注意】1.若x1,x2,…,xn的平均数为,那么的平均数为.
【知识清单7 总体离散程度的估计】
1.总体离散程度的估计
(1)方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为.
总体标准差:.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的样本,其中的数据都相等.
【注意】
1.数据x1,x2,…,xn与数据的方差相等,即数据经过平移后方差不变.
2.若x1,x2,…,xn的方差为s2,那么的方差为a2s2.
【知识清单8 统计案例】
1.课中探究
为了解某公司员工的身体肥胖情况,我们该如何根据数据表写一份该公司员工身体肥胖情况的统计分析报告?该如何分析公司员工胖瘦程度的整体情况并提出控制体重的建议?
(1)教学目标
①通过一个完整案例,经历统计学解决问题的过程,在此过程中,进一步学习数据收集和处理的方法、数据直观图表的表示方法和数据统计特征的刻画方法.
②通过实际操作、计算机模拟等活动,积累数据分析的经验,培养数据分析的素养.
(2)教学内容
教学重点:①了解统计报告的组成部分,培养学生数据分析的素养;②体会统计方法的必要性与合理性,正确了解样本和总体的关系.
教学难点:体会统计方法的必要性与合理性,正确了解样本和总体的关系.
2.背景与数据
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(Body Mass Index,缩写BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是
中国成人的BMI数值标准为:BMI<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤BMI<27.9为偏胖;BMI≥28为肥胖.
3.任务与要求
根据上面的数据,写一份该公司员工肥胖情况的统计分析报告.要求:
(1)选择合适的图表展示数据;
(2)比较男、女员工在肥胖状况上的差异;
(3)分析公司员工胖瘦程度的整体情况;
(4)提出控制体重的建议.
4.统计报告的主要组成部分
(1)标题
(2)前言
简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.
(3)主题
展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图标描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体.
(4)结尾
对主题部分的内容进行概括,结合控制体重的一般方法,提出控制公司员工体重的建议.
题型1
简单随机抽样
1.(24-25高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( )
A. B. C. D.
2.(24-25高一下·全国·课后作业)下列抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万枚为一个开奖组,号码的后四位是2709的为三等奖
B.某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.从8台电脑中逐个不放回地随机抽取2台,进行质量检验,假设8台电脑已编好号,对编号随机抽取
D.仓库中有1万支奥运火炬,从中一次性就近抽取100支火炬进行质量检查
3.(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = , B.a = , C.a = , D.a = ,
4.(24-25高一下·湖北黄石·期末)用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为__________.
5.(24-25高一下·全国·课堂例题)下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
(3)某学校,从1000名高一学生中,挑选出20名最优秀的学生参加县级数学竞赛;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.
题型2
随机数表法
6.(24-25高一下·福建福州·期末)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
7.(24-25高一下·贵州黔南·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,,50,从中抽取6个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第6列开始向右依次读取数据,则得到的第6个样本编号是( )
A.57 B.50 C.40 D.10
8.(24-25高一下·新疆乌鲁木齐·期末)某班有56名学生,从中选出5名同学.把56名同学进行编号,分别为.现利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第7列和第8列数字开始由左向右依次选取两个数字(作为个体的编号),如果选取的两个数字不在总体内,则将它去掉,继续向右选取两个数字,则选出来的第4个个体的编号为( )
32
45
66
67
14
64
05
71
95
86
11
05
65
09
68
76
83
20
37
90
57
16
00
11
66
14
90
84
45
11
75
73
88
05
90
52
27
41
14
86
A.09 B.20 C.37 D.05
9.(24-25高一上·贵州遵义·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 15 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第5列开始向右依次读取数据,则得到的第4个样本编号是__________.
10.(24-25高一下·全国·课堂例题)选择合适的抽样方法进行抽样,并写出抽样过程.
(1)从甲厂生产的30个篮球(其中一箱20个,另一箱10个)中抽取3个;
(2)从乙厂生产的300个篮球中,抽取10个.
(注:下表为随机数表的第10行到第13行)
48306
32560
19098
13843
70490
19383
21278
90912
40402
60831
15596
95509
23567
78961
46509
33267
82724
32555
52400
15020
12760
47439
67841
10546
题型3
抽样方法的选取
11.(24-25高二上·上海长宁·期末)①植物根据植株的高度及分枝部位等可以分为乔木、灌木和草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1000箱牛奶抽取10箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
12.(24-25高一下·山东枣庄·期末)某中学有青年教师95人,中年教师65人,老年教师20人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.随机数法
C.分层随机抽样 D.简单随机抽样
13.(24-25高一下·云南丽江·阶段检测)下列两项调查适宜采用的抽样方法依次是( )
①一项对“中兴事件”(2018年4月16日,美国对中兴通讯施行惩罚措施,引起国内关于国产芯片的讨论)影响的调查中有10000人认为这是美国贸易保护主义,对世界经济会产生比较负面的影响:有9000人认为这只是一个孤立事件,对世界经济大格局不会产生太大影响:有1000人没有发表自己的看法.现要从这20000人中随机抽取200人做进一步调查.
②从某中学高二年级的15名艺术特长生中选出3名调查学习负担情况.
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
14.(24-25高一·全国·课后作业)某集团有老年职工270人,中年职工540人,青年职工810人.为了更好地调查他们的健康情况,需从所有职工中抽取一个容量为36的样本,应采用的抽样方法是_________.(用“简单随机抽样”或“分层抽样”填空)
15.(24-25高一上·全国·课堂例题)有以下两个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量;
案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况.
(1)你认为这两个案例分别应采用怎样的抽样方式较为合适?
(2)在你使用的分层抽样案例中写出抽样过程.
题型4
分层抽样的计算
16.(24-25高一下·安徽合肥·期末)某校为了解同学们对“天宫课堂”这种授课模式的兴趣,决定利用分层抽样的方法从高一、高二、高三学生中选取90人进行调查,已知该校高一年级学生有400人,高二年级学生有500人,高三年级学生有600人,则抽取的学生中,高一年级有( )
A.40人 B.36人 C.30人 D.24人
17.(24-25高一下·吉林长春·期末)一个公司共有210名员工,要采用分层抽样方法从全体员工中抽取一个容量为35的样本.已知某部门有30名员工,那么从这一部门抽取的员工人数为( )
A.5 B.6 C.7 D.8
18.(24-25高一下·安徽安庆·期末)五一期间,各大商场为促进消费,通过发送小礼品的方式吸引顾客.已知某商场五一发放了300件小礼品,其中老年人、中年人、青年人分别有150人、50人、100人,若按年龄的分层抽样从这300名顾客中随机抽取12人收集他们的意见,则被抽取的老年人比青年人多( )
A.4人 B.3人 C.2人 D.1人
19.(24-25高一下·四川眉山·期末)某汽车4店欲通过分层随机抽样了解、、三个小区居民对新能源汽车的购买意愿.已知这三个小区的人口分别为1200人、800人、500人,若总样本量为100人,则应从小区抽取_________人.
20.(24-25高一下·四川巴中·期末)统计学家将战争中摧毁敌军的战机序列号作为样本,用样本估计总体的方法推断敌军每年生产的战机数量.假设敌军某年生产的战机数量为,摧毁某年生产的架战机编号从小到大为,,,…,,最大的编号为,摧毁敌军战机是随机的,摧毁战机的编号,,,…,,相当于从中随机抽取的个整数,这个数将区间分成个小区间(如下图),可以用前个区间的平均长度估计所有个区间的平均长度进而得到的估计值.
已知在某次战斗中摧毁敌军的战机编号为:2,5,7,13,15,17,21,据此回答下列问题.
(1)根据材料估计敌军生产的战机数量;
(2)已知敌军所有现役战机分为三个等级(四代战机,四代半战机,五代机),通过分层抽样调查三类战机的飞行高度,得到各个等级飞行高度的样本平均数为,,.
(ⅰ)根据上述信息是否可以估计敌军所有现役战机的平均飞行高度?若不能,还需要什么条件,请补充条件并写出估计式;
(ⅱ)若敌军现役战机是按照比例生产的,四代战机,四代半战机,五代机的战机数量分别为,,,样本量分别为,,,据此证明:
题型5
频率分布直方图的相关问题
21.(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按 分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
22.(24-25高一下·北京通州·期末)某市为了减少水资源浪费,为确定一个比较合理的标准,从该市随机调查了200户用户居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,则用水量小于1.5立方米的用户数为( )
A.20 B.30 C.50 D.60
23.(24-25高一下·广西河池·期末)某校举办了一次环境保护知识竞赛,为了解学生的环境保护知识掌握程度,学校采用简单随机抽样从全校名学生中抽取了一个容量为的样本,已知样本的成绩全部分布在区间内,根据调查结果绘制学生成绩的频率分布直方图如图所示,则频率分布直方图中( )
A. B. C. D.
24.(24-25高一下·北京平谷·期末)已知某校高一年级1000人,为普及航天知识,开展了航天知识竞赛.将成绩(单位:分)分成6组,绘制成频率分布直方图,如图所示:则成绩在分的有_________人.
25.(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
题型6
根据统计图解决实际问题
26.(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
27.(24-25高一上·江西宜春·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则估计该校参加舞蹈社团的学生人数为( )
A.300 B.225 C.150 D.40
28.(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
29.(24-25高一下·广西玉林·期中)某学校组建了演讲,舞蹈,航模,合唱,机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委将统计结果绘制成如下两个不完整的统计图,则合唱社团的人数占全体学生人数的百分比为_________.
30.(24-25高一下·甘肃武威·期末)为了丰富学生们的课余生活,学校准备开展第二课堂,有四类课程可供选择,分别是“A.书画类、B.文艺类、C.社会实践类、D.体育类”.现随机抽取了高二年级部分学生对报名意向进行调查,并根据调查结果绘制了两幅不完整的统计图,请你根据图表信息回答下列问题:
(1)本次被抽查的学生共有多少名?扇形统计图中“A.书画类”所占扇形的圆心角的度数?
(2)请你将条形统计图补全;
(3)本次调查中抽中了高二(1)班小王和小李两名学生,请用列表法或画树状图法求他们选择同一个项目的概率.
题型7
百分位数的求解
31.(24-25高一下·湖南岳阳·期末)八名学生的高考总分分别为,则这组数据的第75百分位数是( )
A.667 B.671 C.673 D.675
32.(24-25高一下·河南商丘·期末)某校为了加强食堂用餐质量,该校随机调查了名学生,得到这名学生对食堂用餐质量给出的评分数据(评分均在[50,100]内),将所得数据分成五组:,,,,,得到如图所示的频率分布直方图,估计学生对食堂用餐质量的评分的第百分位数为( )
A.82.5 B.81.5 C.87.5 D.85
33.(24-25高一下·山东烟台·期末)若数据,,,,,,,的分位数为,则的值为( )
A. B. C. D.
34.(24-25高一下·湖南岳阳·期末)某科技攻关青年团队共有8人,他们的年龄分别是29,35,40,36,38,34,32,41,则这8人年龄的25%分位数是__________.
35.(24-25高一下·河南平顶山·期末)某校组织了“人工智能知识”测试,现随机抽取了200名学生的测试成绩(单位:分),这200名学生的成绩分布在区间内,并分成6组:第1组为,频数10;第2组为,频数20;第3组为,频数30;第4组为,频数50;第6组为,频数30,绘制成如图所示的部分频率分布直方图.
(1)请将频率分布直方图补充完整;
(2)估计这200名学生成绩的70%分位数.
题型8
众数、中位数、平均数的求解及应用
36.(24-25高一下·浙江台州·期末)已知数据,,,的平均数为5,数据,,,的平均数为6,则数据,,…,,,,…,的平均数为( )
A. B.5 C.6 D.
37.(24-25高一下·陕西汉中·期末)某校举办“迎七一”红歌比赛,五位评委给某参赛班级的评分分别为87,87,89,m,90,若这组数据的平均数为88,则这组数据的中位数为( )
A.88 B.87 C.89 D.90
38.(24-25高一下·河南郑州·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在如图的分布形态中,分别对应这组数据的平均数、中位数和众数,则下列关系正确的是( )
A. B. C. D.
39.(24-25高一下·陕西西安·期末)某篮球兴趣小组有7名学生参加投篮比赛,每人投10个,投中的个数分别为:8、5、7、5、8、6、8,则这组数据的众数与中位数之和为___________.
40.(24-25高一下·黑龙江哈尔滨·期末)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图所示.
(1)估计此批棉花纤维长度的众数;
(2)估计此批棉花纤维长度的下四分位数和中位数;(保留整数)
(3)估计此批棉花纤维长度的平均数.(保留整数)
题型9
方差、标准差的求解及应用
41.(24-25高一下·浙江宁波·期末)已知样本数据,,,,的平均数是4,方差是1,则新样本数据,,,,,的( )
A.平均数是7 B.平均数是 C.方差是4 D.方差是
42.(24-25高一下·贵州铜仁·期末)甲、乙、丙、丁四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断一定没有出现点数6的是( )
A.甲:平均数为3,中位数为2 B.乙:极差为3,众数为3
C.丙:平均数为2,方差为2.4 D.丁:众数为2,方差为2.4
43.(24-25高一下·山东滨州·期末)设一组样本数据的平均数为3,方差为4,则数据,,,,的平均数和方差分别为( )
A.4,14 B.4,16 C.5,14 D.5,16
44.(24-25高一下·内蒙古包头·期末)在某次测验中,有6位同学的平均成绩为75分,且前5位同学的成绩分别是70,76,72,70,72.则这6位同学成绩的标准差__________.
45.(24-25高一下·青海海南·期末)某班20位女同学平均分为甲、乙两组,她们的美学鉴赏课考试成绩如下(单位:分):
甲组:65,90,85,75,65,70,75,90,95,80
乙组:85,95,75,70,85,80,85,65,90,85
(1)试分别计算两组数据的极差和方差;
(2)试根据(1)中的计算结果,判断哪一组的成绩较稳定?
题型10
统计综合
46.(24-25高一下·江苏南京·期末)为了解某年级同学的体能情况,抽取100位同学进行一分钟仰卧起坐次数测试,将所得数据整理后,得到如下频率分布直方图(一分钟仰卧起坐次数60次以上的称为体能优秀),则下列结论错误的是( )
A.
B.估计100位同学在一分钟仰卧起坐次数的平均数低于70次
C.从这100位同学中随机选取一位同学,则这位同学体能优秀的概率约为
D.按照“体能优秀”的学生与“体能不优秀”的学生进行分层抽样,从这100位同学中抽取12人,则在体能优秀的同学中应抽取9人
47.(24-25高一下·山东青岛·期末)气象意义上进入春季的标志为“一年中第一次出现连续5天的日平均气温均不低于10摄氏度”.现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数):
甲地:5个数据的中位数为12,极差为3; 乙地:5个数据的平均数为11,众数为12;
丙地:5个数据的平均数为12,中位数为12; 丁地:5个数据的平均数为11,方差小于1.
则根据上面数据,肯定符合气象意义上进入春季的地区是( )
A.甲地 B.乙地 C.丙地 D.丁地
48.(24-25高一下·湖南·期末)2025年春节期间,国产电影《哪吒之魔童闹海》凭借其震撼的特效、生动的情节与深刻的思想使票房一路攀升,于2025年2月6日登顶中国影史票房榜,根据网络平台数据,截至2025年5月5日,总票房(含港澳台和海外票房)已超158.24亿元,排名全球影史票房第五,是登顶全球动画电影票房榜的亚洲电影.某影院为了解观看该影片的观众的年龄结构,随机抽取了100名观众作为样本,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值与样本中年龄的第85百分位数.
(2)从样本中年龄为,,的三组观众中,按比例用分层随机抽样的方法抽取10人,则年龄在中的观众应抽取多少人?
(3)若样本中年龄在的观众年龄的平均数是6,方差是2,年龄在的观众年龄的平均数是57,方差是5,求这两组样本总的平均数和方差.
49.(24-25高一下·吉林长春·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行营销形式,某直播平台有1000个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图①所示,为了更好地服务买卖双方,该直播平台打算用分层抽样的方式抽取80个直播商家进行问询交流.
(1)应抽取小吃类商家多少家?
(2)在问询了解直播商家的利润状况时,工作人员对抽取的80个商家的平均日利润进行了统计(单位:元),所得频率直方图如图②所示.
①估计该直播平台商家平均日利润的第75百分位数;
②若将平均日利润超过480元的商家称为“优质商家”,估计该直播平台“优质商家”的个数.
50.(24-25高一下·湖北武汉·期末)某高校体检随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165],[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求和频率分布直方图中身高在175cm及以下的学生人数;
(2)估计该校100名学生身高的下四分位数(结果保留到个位数).
(3)已知落在区间[170,175)的样本平均数是173,方差是8,落在区间[175,180)的样本平均数是178,方差是6,求两组样本成绩合并后的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:记总的样本平均数为,样本方差为,则.
2 / 30
学科网(北京)股份有限公司
$
专题06 统计(10大重点题型+思维导图+知识清单)(期末专项训练)
【人教A版】
题型归纳
【知识清单1 简单随机抽样】
1.抽样调查的必要性
(1)相关概念
名称
定义
全面调查(普查)
对每一个调查对象都进行调查的方法.
抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体
调查对象的全体.
个体
从总体中抽取的那部分个体.
样本
从总体中抽取的那部分个体.
样本量
样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法
优点
缺点
适用范围
抽签法
简单易行.
总体量较大时,操作起来比较麻烦.
适用于总体中个体数不多的情形.
随机数法
简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题.
总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便.
总体量较大,样本量较小的情形.
4.总体平均数与样本平均数
(1)概念
名称
定义
总体均值(总体平均数)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式.
样本均值(样本平均数)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数;
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
(2)求和符号∑的性质
①;
②,其中k为常数.
【知识清单2 分层随机抽样】
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即:
①;
②.
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层、第2层的总体平均数分别为,第1层、第2层的样本平均数分别为,总体平均数为,样本平均数为,则.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
又,所以.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【知识清单3 获取数据的途径】
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【知识清单4 总体取值规律的估计】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【知识清单5 总体百分位数的估计】
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【知识清单6 总体集中趋势的估计】
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平均数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中位数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【注意】1.若x1,x2,…,xn的平均数为,那么的平均数为.
【知识清单7 总体离散程度的估计】
1.总体离散程度的估计
(1)方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为.
总体标准差:.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的样本,其中的数据都相等.
【注意】
1.数据x1,x2,…,xn与数据的方差相等,即数据经过平移后方差不变.
2.若x1,x2,…,xn的方差为s2,那么的方差为a2s2.
【知识清单8 统计案例】
1.课中探究
为了解某公司员工的身体肥胖情况,我们该如何根据数据表写一份该公司员工身体肥胖情况的统计分析报告?该如何分析公司员工胖瘦程度的整体情况并提出控制体重的建议?
(1)教学目标
①通过一个完整案例,经历统计学解决问题的过程,在此过程中,进一步学习数据收集和处理的方法、数据直观图表的表示方法和数据统计特征的刻画方法.
②通过实际操作、计算机模拟等活动,积累数据分析的经验,培养数据分析的素养.
(2)教学内容
教学重点:①了解统计报告的组成部分,培养学生数据分析的素养;②体会统计方法的必要性与合理性,正确了解样本和总体的关系.
教学难点:体会统计方法的必要性与合理性,正确了解样本和总体的关系.
2.背景与数据
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(Body Mass Index,缩写BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是
中国成人的BMI数值标准为:BMI<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤BMI<27.9为偏胖;BMI≥28为肥胖.
3.任务与要求
根据上面的数据,写一份该公司员工肥胖情况的统计分析报告.要求:
(1)选择合适的图表展示数据;
(2)比较男、女员工在肥胖状况上的差异;
(3)分析公司员工胖瘦程度的整体情况;
(4)提出控制体重的建议.
4.统计报告的主要组成部分
(1)标题
(2)前言
简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.
(3)主题
展示数据分析的全过程:首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图标描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体.
(4)结尾
对主题部分的内容进行概括,结合控制体重的一般方法,提出控制公司员工体重的建议.
题型1
简单随机抽样
1.(24-25高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( )
A. B. C. D.
【答案】B
【解题思路】根据已知条件,结合简单随机抽样的定义,即可求解.
【解答过程】解:从第二次开始抽取时,余下的每个个体被抽到的概率为,
则,
解得,
故在整个抽样过程中,每个个体被抽到的可能性为.
故选:B.
2.(24-25高一下·全国·课后作业)下列抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万枚为一个开奖组,号码的后四位是2709的为三等奖
B.某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.从8台电脑中逐个不放回地随机抽取2台,进行质量检验,假设8台电脑已编好号,对编号随机抽取
D.仓库中有1万支奥运火炬,从中一次性就近抽取100支火炬进行质量检查
【答案】C
【解题思路】利用简单随机抽样的定义,逐一分析各选项即可得解.
【解答过程】选项A:在明信片销售活动中规定特定号码为三等奖,不属于简单随机抽样,故A错误;
选项B:在自动包装传送带上每隔30分钟抽一包产品,
抽样间隔固定,属于系统抽样,不是简单随机抽样,故B错误;
选项C:从8台已编号的电脑中逐个不放回地随机抽取2台,
符合简单随机抽样中总体个数有限、逐个抽取、不放回抽样、等可能抽样的特点,
属于简单随机抽样,故C正确;
选项D:一次性就近抽取100支火炬,不具有等可能性,不属于简单随机抽样,故D错误;
故选:C.
3.(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = , B.a = , C.a = , D.a = ,
【答案】B
【解题思路】由题意结合简单随机抽样的特征即可确定实数,的值.
【解答过程】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以李华第一次被抽到的可能性为,
第五次被抽到的可能性为.
即李华同学在每次抽样中被抽到的可能性都是,所以,.
故选:B.
4.(24-25高一下·湖北黄石·期末)用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为__________.
【答案】0.1
【解题思路】由简单随机抽样中每个个体被抽到的概率相同可得.
【解答过程】由题意可得用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为.
故答案为:0.1.
5.(24-25高一下·全国·课堂例题)下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数个个体中抽取50个个体作为样本;
(2)仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
(3)某学校,从1000名高一学生中,挑选出20名最优秀的学生参加县级数学竞赛;
(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.
【答案】(1)不是,理由见解析
(2)是,理由见解析
(3)不是,理由见解析
(4)是,理由见解析
【解题思路】根据简单随机抽样的概念判断即可.
【解答过程】(1)不是简单随机抽样.因为简单随机抽样要求被抽取样本的总体中的个数是有限的.
(2)是简单随机抽样.“一次性抽取”和“逐个不放回的抽取”等价,符合简单随机抽样的要求.
(3)不是简单随机抽样.因为这20名学生是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样.
题型2
随机数表法
6.(24-25高一下·福建福州·期末)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
【答案】B
【解题思路】根据随机数表的读取规则,逐一选取即可.
【解答过程】由题知,选取的同学编号分别是442,175,572,175,455,608,331,047,
剔除重复数据,超过500的数据,符合条件的是442,175,455,331,047,第五个是047.
故选:B.
7.(24-25高一下·贵州黔南·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,,50,从中抽取6个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第6列开始向右依次读取数据,则得到的第6个样本编号是( )
A.57 B.50 C.40 D.10
【答案】B
【解题思路】结合随机数表法定义,按照题意依次读出前个数即可.
【解答过程】从随机数表第1行的第6列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,
符合条件的编号有03,46,40,11,10,50,所以选出来的第6个个体的编号为50.
故选:B.
8.(24-25高一下·新疆乌鲁木齐·期末)某班有56名学生,从中选出5名同学.把56名同学进行编号,分别为.现利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第7列和第8列数字开始由左向右依次选取两个数字(作为个体的编号),如果选取的两个数字不在总体内,则将它去掉,继续向右选取两个数字,则选出来的第4个个体的编号为( )
32
45
66
67
14
64
05
71
95
86
11
05
65
09
68
76
83
20
37
90
57
16
00
11
66
14
90
84
45
11
75
73
88
05
90
52
27
41
14
86
A.09 B.20 C.37 D.05
【答案】A
【解题思路】由随机数表抽样方式可得.
【解答过程】从随机数表第1行的第7列和第8列数字是67无效,后面依次为14,05,11,09,
所以第4个为09.
故选:A.
9.(24-25高一上·贵州遵义·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 15 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第5列开始向右依次读取数据,则得到的第4个样本编号是__________.
【答案】15
【解题思路】按照题意结合随机数表依次读出前4个数即可.
【解答过程】从随机数表第1行的第5列数字开始由左向右每次连续读取2个数字,
删除超出范围及重复的编号,符合条件的编号有40,37,14,15,
所以选出来的第4个个体的编号为15.
故答案为:15.
10.(24-25高一下·全国·课堂例题)选择合适的抽样方法进行抽样,并写出抽样过程.
(1)从甲厂生产的30个篮球(其中一箱20个,另一箱10个)中抽取3个;
(2)从乙厂生产的300个篮球中,抽取10个.
(注:下表为随机数表的第10行到第13行)
48306
32560
19098
13843
70490
19383
21278
90912
40402
60831
15596
95509
23567
78961
46509
33267
82724
32555
52400
15020
12760
47439
67841
10546
【答案】(1)抽签法,过程见解析
(2)随机数法,过程见解析
【解题思路】(1)总体容量小,宜用抽签法;
(2)总体容量较大,样本容量较小宜用随机数表法.
【解答过程】(1)总体较小,用抽签法.
第一步,将30个篮球随机编号,编号分别为01,02,⋯,30.
第二步,将以上30个编号分别写在大小和形状完全相同的小纸条上,揉成小球,制成号签.
第三步,把号签放到一个不透明的盒子中,充分搅拌.
第四步,从盒子中不放回地逐个抽取3个号签,并记录上面的号码.
第五步,找出与号码对应的篮球,即可得到样本.
(2)总体较大,样本量较小,宜用随机数法.
第一步,将300个篮球随机编号,编号分别为000,001,⋯,299.
第二步,用所给的随机数表,先随机确定一个数作为起始数字,如选第十行第十一列的数1为起始数字.
第三步,从选定的数开始向右读,每次读3位,凡是不在000~299(包括000和299)中的数都跳过去不读,遇到已经读过的数也跳过去不读,
便可依次得到190,193,127,026,083,115,092,093,240,015这10个号码,这就是所要抽取的10个样本个体的号码.
题型3
抽样方法的选取
11.(24-25高二上·上海长宁·期末)①植物根据植株的高度及分枝部位等可以分为乔木、灌木和草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1000箱牛奶抽取10箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【答案】C
【解题思路】根据简单随机抽样和分层随机抽样的特点进行判断即可.
【解答过程】①乔木、灌木、草木,分类明显,可以采用分层随机抽样;
②并未有明显分层特点,且样本容量较小,可以采用简单随机抽样;
故选:C.
12.(24-25高一下·山东枣庄·期末)某中学有青年教师95人,中年教师65人,老年教师20人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.随机数法
C.分层随机抽样 D.简单随机抽样
【答案】C
【解题思路】根据样本的年龄特性确定抽样方法.
【解答过程】由于样本中年龄分为三个层次:老年,中年,青年,因此采取分层抽样方法.
故选:C.
13.(24-25高一下·云南丽江·阶段检测)下列两项调查适宜采用的抽样方法依次是( )
①一项对“中兴事件”(2018年4月16日,美国对中兴通讯施行惩罚措施,引起国内关于国产芯片的讨论)影响的调查中有10000人认为这是美国贸易保护主义,对世界经济会产生比较负面的影响:有9000人认为这只是一个孤立事件,对世界经济大格局不会产生太大影响:有1000人没有发表自己的看法.现要从这20000人中随机抽取200人做进一步调查.
②从某中学高二年级的15名艺术特长生中选出3名调查学习负担情况.
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
【答案】B
【解题思路】由随机抽样的定义进行判断.
【解答过程】解:对于①,总体中明显存在差异,则用分层随机抽样;
对于②,总体个数较少,则用简单随机抽样,
故选:B.
14.(24-25高一·全国·课后作业)某集团有老年职工270人,中年职工540人,青年职工810人.为了更好地调查他们的健康情况,需从所有职工中抽取一个容量为36的样本,应采用的抽样方法是_________.(用“简单随机抽样”或“分层抽样”填空)
【答案】分层抽样
【解题思路】根据简单随机抽样和分层抽样的使用条件和特征即可作出判断.
【解答过程】由于所有职工由三类不同年龄段的人群构成,所以存在着较为明显的差异,故选择分层抽样.
故答案为:分层抽样.
15.(24-25高一上·全国·课堂例题)有以下两个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋分别检测三聚氰胺的含量;
案例二:某公司有员工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其他人员120人,从中抽取容量为40的样本,了解他们的收入情况.
(1)你认为这两个案例分别应采用怎样的抽样方式较为合适?
(2)在你使用的分层抽样案例中写出抽样过程.
【答案】(1)案例一用简单随机抽样,案例二用分层抽样
(2)答案见解析
【解题思路】(1)由分层抽样和简单随机抽样的定义即可得出答案;
(2)按照分层、确定抽样比、确定各层样本数、按简单随机抽样方式在各层确定相应的样本、汇总构成一个容量为40的样本的过程求解即可.
【解答过程】(1)案例一用简单随机抽样,案例二用分层抽样.
(2)①分层,将总体分为具有高级职称、中级职称、初级职称及其他人员四层;
②确定抽样比;
③按抽样比确定各层应分别抽取的人数为8,16,10,6;
④按简单随机抽样的方法在各层确定相应的样本;
⑤汇总构成一个容量为40的样本.
题型4
分层抽样的计算
16.(24-25高一下·安徽合肥·期末)某校为了解同学们对“天宫课堂”这种授课模式的兴趣,决定利用分层抽样的方法从高一、高二、高三学生中选取90人进行调查,已知该校高一年级学生有400人,高二年级学生有500人,高三年级学生有600人,则抽取的学生中,高一年级有( )
A.40人 B.36人 C.30人 D.24人
【答案】D
【解题思路】确定高一、高二、高三的人数比,由分层抽样特征即可求解;
【解答过程】由题意可知该校高一年级学生有400人,高二年级学生有500人,高三年级学生有600人,
则高一年级,高二年级与高三年级的学生人数比为,
根据分层抽样的特征可知,抽取的学生中,高一年级有人,
故选:D.
17.(24-25高一下·吉林长春·期末)一个公司共有210名员工,要采用分层抽样方法从全体员工中抽取一个容量为35的样本.已知某部门有30名员工,那么从这一部门抽取的员工人数为( )
A.5 B.6 C.7 D.8
【答案】A
【解题思路】根据分层抽样的概念求解.
【解答过程】设从这一部门抽取的员工人数为,则,解得.
故选:A.
18.(24-25高一下·安徽安庆·期末)五一期间,各大商场为促进消费,通过发送小礼品的方式吸引顾客.已知某商场五一发放了300件小礼品,其中老年人、中年人、青年人分别有150人、50人、100人,若按年龄的分层抽样从这300名顾客中随机抽取12人收集他们的意见,则被抽取的老年人比青年人多( )
A.4人 B.3人 C.2人 D.1人
【答案】C
【解题思路】根据题意,利用分层抽样的方法,分别求得抽取的老年人和青年人的人数,即可求解.
【解答过程】由题意知,老年人、中年人、青年人分别有150人、50人、100人,
可得老年人、中年人、青年人的比例分别为,
故抽取的12人中老年人抽取了人,
青年人抽取了人,则老年人比青年人多2人.
故选:C.
19.(24-25高一下·四川眉山·期末)某汽车4店欲通过分层随机抽样了解、、三个小区居民对新能源汽车的购买意愿.已知这三个小区的人口分别为1200人、800人、500人,若总样本量为100人,则应从小区抽取_________人.
【答案】20
【解题思路】根据分层抽样计算求解.
【解答过程】4店欲通过分层随机抽样了解、、三个小区居民对新能源汽车的购买意愿.
这三个小区的人口分别为1200人、800人、500人,
若总样本量为100人,则应从小区抽取人.
故答案为:.
20.(24-25高一下·四川巴中·期末)统计学家将战争中摧毁敌军的战机序列号作为样本,用样本估计总体的方法推断敌军每年生产的战机数量.假设敌军某年生产的战机数量为,摧毁某年生产的架战机编号从小到大为,,,…,,最大的编号为,摧毁敌军战机是随机的,摧毁战机的编号,,,…,,相当于从中随机抽取的个整数,这个数将区间分成个小区间(如下图),可以用前个区间的平均长度估计所有个区间的平均长度进而得到的估计值.
已知在某次战斗中摧毁敌军的战机编号为:2,5,7,13,15,17,21,据此回答下列问题.
(1)根据材料估计敌军生产的战机数量;
(2)已知敌军所有现役战机分为三个等级(四代战机,四代半战机,五代机),通过分层抽样调查三类战机的飞行高度,得到各个等级飞行高度的样本平均数为,,.
(ⅰ)根据上述信息是否可以估计敌军所有现役战机的平均飞行高度?若不能,还需要什么条件,请补充条件并写出估计式;
(ⅱ)若敌军现役战机是按照比例生产的,四代战机,四代半战机,五代机的战机数量分别为,,,样本量分别为,,,据此证明:
【答案】(1)24架;
(2)(ⅰ)不能,需要知道这三个等级战机具体的个体数量,,,或者抽取样本的数量,,,估计式见解析;(ⅱ)证明见解析.
【解题思路】(1)由题设得求参数,即可得;
(2)(i)根据题意需要知道这三个等级战机具体的个体数量,,,或者抽取样本的数量,,,进而写出公式;(ii)按比例在各层抽取的且各层抽取的样本量分别为、、,得,应用分层等比例性质即可证.
【解答过程】(1)因为可用估计,所以,得,故敌军每年生产战机24架.
(2)(ⅰ)不能估计敌军所有现役战机的平均飞行高度,
需要知道这三个等级战机具体的个体数量,,,或者抽取样本的数量,,,
估计式为或
(ⅱ)因为样本是按比例在各层抽取的且各层抽取的样本量分别为、、,
所以,则,
所以,,,
又因为样本平均数为,
所以.
题型5
频率分布直方图的相关问题
21.(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按 分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
【答案】A
【解题思路】利用频率和为1求参数,再估计身高低于170cm的人数.
【解答过程】由图可得,得,
所以估计这100名学生中身高低于170cm的人数为.
故选:A.
22.(24-25高一下·北京通州·期末)某市为了减少水资源浪费,为确定一个比较合理的标准,从该市随机调查了200户用户居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,则用水量小于1.5立方米的用户数为( )
A.20 B.30 C.50 D.60
【答案】C
【解题思路】根据频数、频率及样本容量的关系即可求得答案.
【解答过程】根据直方图可得用水量小于1.5立方米的用户数为.
故选:C.
23.(24-25高一下·广西河池·期末)某校举办了一次环境保护知识竞赛,为了解学生的环境保护知识掌握程度,学校采用简单随机抽样从全校名学生中抽取了一个容量为的样本,已知样本的成绩全部分布在区间内,根据调查结果绘制学生成绩的频率分布直方图如图所示,则频率分布直方图中( )
A. B. C. D.
【答案】B
【解题思路】根据所有直方图面积之和为可求得实数的值.
【解答过程】在频率分布直方图可知,所有直方图面积之和为,
所以,解得.
故选:B.
24.(24-25高一下·北京平谷·期末)已知某校高一年级1000人,为普及航天知识,开展了航天知识竞赛.将成绩(单位:分)分成6组,绘制成频率分布直方图,如图所示:则成绩在分的有_________人.
【答案】
【解题思路】先求出成绩在分的频率,再求出人数即可.
【解答过程】因为成绩在分的频率为,
所以成绩在分的有人.
故答案为:.
25.(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
【答案】(1)表格见解析
(2)作图见解析
(3)504
【解题思路】(1)利用频率、频数和样本容量的关系即可完成此表格;
(2)利用表中数据计算出这个分数段对应的矩形高度即可完成频率分布直方图.
(3)先找出成绩分及以上对应的分数段的频率,再用该频率乘以总人数即可得到.
【解答过程】(1)由频率分布表,可知样本容量为50,
故成绩在[60,70)的频数为,
成绩在[70,80)的频率为,
成绩在[90,100]的频数为,
频率为,
故频率分布表为:
分组
频数
频率
[50,60)
4
0.08
[60,70)
8
0.16
[70,80)
10
0.20
[80,90)
16
0.32
[90,100]
12
0.24
合计
50
1
(2)频率分布直方图如图所示:
(3)样本中成绩在[80,100]的频率为0.32 + 0.24 = 0.56,
所以估计该校获得环保纪念勋章的学生人数为900×0.56 = 504.
题型6
根据统计图解决实际问题
26.(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【答案】A
【解题思路】根据图1和图2,逐项分析判断即可.
【解答过程】结合图1和图2,计算可得2020至2024年第一产业增加值依次为
3167.578,3362.034,3505.425,3520.571,3543.75,成递增趋势,故A错误;
结合图1和图2,计算可得2020至2024年第二产业增加值依次为
15297.084,16939.479,17709.225,18712.076,19591.875,成递增趋势,故B正确;
由图2可知,2020至2024年第三产业增加值占地区生产总值比重逐年升高,故C正确;
由图1可知,2020至2024年全省地区生产总值逐年增长,故D正确.
故选:A.
27.(24-25高一上·江西宜春·期末)某校高一组建了演讲,舞蹈,合唱,绘画,英语协会五个社团,高一1500名学生每人都参加且只参加其中一个社团,学校从这1500名学生中随机选取部分学生进行调查,并将调查结果绘制成如图不完整的两个统计图:
则估计该校参加舞蹈社团的学生人数为( )
A.300 B.225 C.150 D.40
【答案】A
【解题思路】结合两个统计图直接求解即可;
【解答过程】由条形图得合唱人数为70,演讲人数为30,由饼状图得合唱人数占比,
因此演讲人数占比为,舞蹈人数占比为,
用样本估计总体,估计该校参加舞蹈社团的人数为.
故选:A.
28.(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
【答案】D
【解题思路】根据折线图分别判断信息及计算平均数进而判断各个选项即可.
【解答过程】对于A,由游客人数折线图可知,甲景点7,8,9月份的总游客人数为,乙景点的7,8,9月份的总游客人数为,,A正确;
对于B,根据乙景点的游客人数折线图可知,乙景点每月的游客人数逐月增多,所以总体呈上升趋势,故B正确;
对于C,甲景点游客人数的平均值为,,C正确;
对于D,由游客人数折线图可知,甲景点4月到9月中游客量的最高峰期在8月,乙景点4月到9月中游客量的最高峰期在9月,D错误.
故选:D.
29.(24-25高一下·广西玉林·期中)某学校组建了演讲,舞蹈,航模,合唱,机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委将统计结果绘制成如下两个不完整的统计图,则合唱社团的人数占全体学生人数的百分比为_________.
【答案】
【解题思路】根据直方图和饼图中数据求总人数,再由合唱社团人数求其百分比即可.
【解答过程】由统计图知,演讲社团共有50人,占比,则总人数为人,
又合唱社团共有200人,占比为.
故答案为:.
30.(24-25高一下·甘肃武威·期末)为了丰富学生们的课余生活,学校准备开展第二课堂,有四类课程可供选择,分别是“A.书画类、B.文艺类、C.社会实践类、D.体育类”.现随机抽取了高二年级部分学生对报名意向进行调查,并根据调查结果绘制了两幅不完整的统计图,请你根据图表信息回答下列问题:
(1)本次被抽查的学生共有多少名?扇形统计图中“A.书画类”所占扇形的圆心角的度数?
(2)请你将条形统计图补全;
(3)本次调查中抽中了高二(1)班小王和小李两名学生,请用列表法或画树状图法求他们选择同一个项目的概率.
【答案】(1)50;
(2)条形统计图见详解
(3)
【解题思路】(1)两个统计图数据分析得到本次被抽查的学生总数,进而得到“A.书画类”所占扇形的圆心角的度数;
(2)计算出B类人数,补全条形统计图;
(3)利用表格列举出小王和小李两名学生的选择情况,从而求出他们选择同一个项目的概率.
【解答过程】(1)由扇形统计图中可知:D体育类占比为,条形统计图中可知,D体育类有20人,
故本次被抽查的学生共有:名,
扇形统计图中“A.书画类”所占扇形的圆心角的度数为;
(2)B类人数是:名,补全条形统计图如图所示:
(3)所有可能的情况如下表所示:
由表格可得:共有16种等可能的结果,其中小王和小李两名学生选择同一个项目的结果有4种,
所以小王和小李两名学生选择同一个项目的概率.
题型7
百分位数的求解
31.(24-25高一下·湖南岳阳·期末)八名学生的高考总分分别为,则这组数据的第75百分位数是( )
A.667 B.671 C.673 D.675
【答案】C
【解题思路】由百分位数的计算公式计算可得答案.
【解答过程】将这组数据由小到大排列为:,
因为,所以选取第6个和第7个数的平均数作为结果,
所以这组数据的第75百分位数是.
故选:C.
32.(24-25高一下·河南商丘·期末)某校为了加强食堂用餐质量,该校随机调查了名学生,得到这名学生对食堂用餐质量给出的评分数据(评分均在[50,100]内),将所得数据分成五组:,,,,,得到如图所示的频率分布直方图,估计学生对食堂用餐质量的评分的第百分位数为( )
A.82.5 B.81.5 C.87.5 D.85
【答案】D
【解题思路】先判断第百分位数所在组,然后根据频率直方图面积之和等于确定取值.
【解答过程】因为,,
所以第60百分位数位于,设为,
则,
解得,即估计学生对食堂用餐质量的评分的第百分位数为.
故选:D.
33.(24-25高一下·山东烟台·期末)若数据,,,,,,,的分位数为,则的值为( )
A. B. C. D.
【答案】A
【解题思路】根据百分位数的概念直接得解.
【解答过程】由,
则数据的分位数为,
解得,
故选:A.
34.(24-25高一下·湖南岳阳·期末)某科技攻关青年团队共有8人,他们的年龄分别是29,35,40,36,38,34,32,41,则这8人年龄的25%分位数是__________.
【答案】33
【解题思路】将他们的年龄从小到大排序,根据百分位数的定义即可求得.
【解答过程】将他们的年龄从小到大排序为:29,32,34,35,36,38,40,41.
因,故这8人年龄的25%分位数是.
故答案为:33.
35.(24-25高一下·河南平顶山·期末)某校组织了“人工智能知识”测试,现随机抽取了200名学生的测试成绩(单位:分),这200名学生的成绩分布在区间内,并分成6组:第1组为,频数10;第2组为,频数20;第3组为,频数30;第4组为,频数50;第6组为,频数30,绘制成如图所示的部分频率分布直方图.
(1)请将频率分布直方图补充完整;
(2)估计这200名学生成绩的70%分位数.
【答案】(1)频率分布直方图见解析;
(2)85
【解题思路】(1)求出第五组的频率和即可作图得解;
(2)先求出这200名学生成绩的70%分位数所在区间范围,再列出方程即可求解.
【解答过程】(1)由题可得第五组为,频数为,
所以第五组的频率为,,
所以频率分布直方图如图所示:
(2)设这200名学生成绩的70%分位数为,
因为前4组频率之和为,
前5组频率之和为,
所以这200名学生成绩的70%分位数落在第5组内,
所以,所以这200名学生成绩的70%分位数为85.
题型8
众数、中位数、平均数的求解及应用
36.(24-25高一下·浙江台州·期末)已知数据,,,的平均数为5,数据,,,的平均数为6,则数据,,…,,,,…,的平均数为( )
A. B.5 C.6 D.
【答案】D
【解题思路】根据平均数的计算公式可得答案.
【解答过程】因为数据,,,的平均数为5,数据,,,的平均数为6,
所以数据,,…,,,,…,的平均数为.
故选:D.
37.(24-25高一下·陕西汉中·期末)某校举办“迎七一”红歌比赛,五位评委给某参赛班级的评分分别为87,87,89,m,90,若这组数据的平均数为88,则这组数据的中位数为( )
A.88 B.87 C.89 D.90
【答案】B
【解题思路】根据给定的平均数求出m,再利用中位数的定义计算作答.
【解答过程】依题意,,解得,
参赛班级所得分从小到大依次为:87,87,87,89,90,
所以这组数据的中位数为87.
故选:B.
38.(24-25高一下·河南郑州·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在如图的分布形态中,分别对应这组数据的平均数、中位数和众数,则下列关系正确的是( )
A. B. C. D.
【答案】D
【解题思路】由频率分布直方图估计中位数、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【解答过程】根据直方图矩形高低以及数据的分布趋势判断,可得出结论:
由数据分布图知,众数是最高矩形下底边的中点横坐标,因此众数为左起第二个矩形下底边的中点值,
直线左右两边矩形面积相等,而直线右边矩形面积大于左边矩形面积,则,
又数据分布图右拖尾,则平均数大于中位数,即,
因此有.
故选:D.
39.(24-25高一下·陕西西安·期末)某篮球兴趣小组有7名学生参加投篮比赛,每人投10个,投中的个数分别为:8、5、7、5、8、6、8,则这组数据的众数与中位数之和为___________.
【答案】15
【解题思路】将个数按照从小到大的顺序排列,找出中位数和众数即可.
【解答过程】将个数按照从小到大的顺序排列,5、5、6、7、8、8、8,
这组数据的众数是8,中位数是7,这组数据的众数与中位数之和为.
故答案为:15.
40.(24-25高一下·黑龙江哈尔滨·期末)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图所示.
(1)估计此批棉花纤维长度的众数;
(2)估计此批棉花纤维长度的下四分位数和中位数;(保留整数)
(3)估计此批棉花纤维长度的平均数.(保留整数)
【答案】(1)
(2)下四分位数约为,中位数约为
(3)
【解题思路】(1)由众数的定义即可求解;
(2)由百分位数、中位数的定义即可求解;
(3)由平均数的定义即可求解.
【解答过程】(1)由图可知,区间对应的矩形最高,所以估计此批棉花纤维长度的众数为;
(2)因为前两组的频率之和为,前三组的频率之和,
所以估计此批棉花纤维长度的下四分位数在区间,且为,
因为前三组的频率之和,前四组的频率之和,
所以估计此批棉花纤维长度的中位数在区间,且为;
(3)估计此批棉花纤维长度的平均数为
.
题型9
方差、标准差的求解及应用
41.(24-25高一下·浙江宁波·期末)已知样本数据,,,,的平均数是4,方差是1,则新样本数据,,,,,的( )
A.平均数是7 B.平均数是 C.方差是4 D.方差是
【答案】C
【解题思路】由平均数和方差的计算可得.
【解答过程】由题意可得,,
所以新样本的平均数为,故A、B错误;
设新样本为,
则
.
故选:C.
42.(24-25高一下·贵州铜仁·期末)甲、乙、丙、丁四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断一定没有出现点数6的是( )
A.甲:平均数为3,中位数为2 B.乙:极差为3,众数为3
C.丙:平均数为2,方差为2.4 D.丁:众数为2,方差为2.4
【答案】C
【解题思路】根据平均数、中位数、方差的定义,通过举例排除ABD,由假设推理判断C.
【解答过程】对于A,甲的5个点数分别是,平均数为3,中位数为2,A可出现;
对于B,乙的5个点数分别是,极差为3,众数为3,B可出现;
对于D,丁的5个点数分别是,众数为2,平均数为3,
其方差为,D可出现;
对于C,丙的平均数为2,又有点数6,则方差,不可能满足C,丙不会出现点数6.
故选:C.
43.(24-25高一下·山东滨州·期末)设一组样本数据的平均数为3,方差为4,则数据,,,,的平均数和方差分别为( )
A.4,14 B.4,16 C.5,14 D.5,16
【答案】C
【解题思路】由平均数公式可得,由方差公式可得,再利用平均数和方差公式可求得结果.
【解答过程】由样本数据的平均数为,方差为,得,,
则,,
因此数据,的平均数为
,
方差为
.
故选:C.
44.(24-25高一下·内蒙古包头·期末)在某次测验中,有6位同学的平均成绩为75分,且前5位同学的成绩分别是70,76,72,70,72.则这6位同学成绩的标准差__________.
【答案】7
【解题思路】先根据平均数计算第6位同学的成绩再根据方差公式计算求解即可.
【解答过程】前5位同学的成绩分别是70,76,72,70,72,6位同学的平均成绩为75分,设第6位学生分数为,
所以,所以,
所以方差为,
所以标准差为.
故答案为:7.
45.(24-25高一下·青海海南·期末)某班20位女同学平均分为甲、乙两组,她们的美学鉴赏课考试成绩如下(单位:分):
甲组:65,90,85,75,65,70,75,90,95,80
乙组:85,95,75,70,85,80,85,65,90,85
(1)试分别计算两组数据的极差和方差;
(2)试根据(1)中的计算结果,判断哪一组的成绩较稳定?
【答案】(1)甲组数据的极差为30(分),方差为104;乙组数据的极差为30(分),方差为75.25
(2)乙组的成绩较稳定.
【解题思路】(1)根据公式直接求极差、平均数、方差即可;
(2)根据(1)的结果可得答案.
【解答过程】(1)甲组最高分为95分,最低分为65分,极差为,
平均数为,
方差为
,
乙组最高分为95分,最低分为65分,极差为,
平均数为,
方差为
;
(2)由于甲乙两组极差相同,但乙组的方差小于甲组的方差,因此乙组的成绩较稳定.
题型10
统计综合
46.(24-25高一下·江苏南京·期末)为了解某年级同学的体能情况,抽取100位同学进行一分钟仰卧起坐次数测试,将所得数据整理后,得到如下频率分布直方图(一分钟仰卧起坐次数60次以上的称为体能优秀),则下列结论错误的是( )
A.
B.估计100位同学在一分钟仰卧起坐次数的平均数低于70次
C.从这100位同学中随机选取一位同学,则这位同学体能优秀的概率约为
D.按照“体能优秀”的学生与“体能不优秀”的学生进行分层抽样,从这100位同学中抽取12人,则在体能优秀的同学中应抽取9人
【答案】C
【解题思路】根据频率和为1求,再代入平均数公式,以及频率公式,即可判断选项.
【解答过程】A.根据频率和为1,得,得,故A正确;
B.由频率分布直方图得平均数为,故B正确;
C.体能不优秀的频率为,则体能优秀的频率为,
所以体能优秀的概率约为,故C错误;
D.体能不优秀和体能优秀的频率比为,所以12人中体能优秀的同学中应抽取人,故D正确.
故选:C.
47.(24-25高一下·山东青岛·期末)气象意义上进入春季的标志为“一年中第一次出现连续5天的日平均气温均不低于10摄氏度”.现有甲、乙、丙、丁四地连续5天的日平均温度的记录数据(记录数据都是正整数):
甲地:5个数据的中位数为12,极差为3; 乙地:5个数据的平均数为11,众数为12;
丙地:5个数据的平均数为12,中位数为12; 丁地:5个数据的平均数为11,方差小于1.
则根据上面数据,肯定符合气象意义上进入春季的地区是( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】D
【解题思路】根据平均数、众数、中位数、极差、方差理解,结合题意逐地分析即可.
【解答过程】设甲地5天的日平均气温从低到高为:,
因为极差为3,所以,
取
此时存在日平均气温均低于10摄氏度情况,
故甲地不一定符合进入春季的标志;
设乙地5天的日平均气温从低到高为:,
其中互不相等,由5个数据的平均数为11,
所以,
取,
此时存在日平均气温均低于10摄氏度情况,
故乙地不一定符合进入春季的标志;
设丙地5天的日平均气温从低到高为:,
由5个数据的平均数为12,
则,
取,
此时存在日平均气温均低于10摄氏度情况,
故丙地不一定符合进入春季的标志;
设丁地5天的日平均气温为:,
由5个数据的平均数为11,
所以,
所以若方差小于1则:
,
则,
由为正整数,
且,
所以,
设时,任何一个都不可能为,
所以当时,
不满足,
所以,
故丁地符合气象意义上进入春季,
故选:D.
48.(24-25高一下·湖南·期末)2025年春节期间,国产电影《哪吒之魔童闹海》凭借其震撼的特效、生动的情节与深刻的思想使票房一路攀升,于2025年2月6日登顶中国影史票房榜,根据网络平台数据,截至2025年5月5日,总票房(含港澳台和海外票房)已超158.24亿元,排名全球影史票房第五,是登顶全球动画电影票房榜的亚洲电影.某影院为了解观看该影片的观众的年龄结构,随机抽取了100名观众作为样本,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值与样本中年龄的第85百分位数.
(2)从样本中年龄为,,的三组观众中,按比例用分层随机抽样的方法抽取10人,则年龄在中的观众应抽取多少人?
(3)若样本中年龄在的观众年龄的平均数是6,方差是2,年龄在的观众年龄的平均数是57,方差是5,求这两组样本总的平均数和方差.
【答案】(1);
(2)4
(3)23;581
【解题思路】(1)利用所有小长方形的面积和为1计算可得,百分位数频率分布直方图求法计算可得第85百分位数;
(2)利用分层抽样的概念求解即可;
(3)由平均数和方差公式计算即可.
【解答过程】(1)由题意可得,解得,
由频率分布直方图可知的频率为,而的频率为,
所以第85百分位数在区间内,设第85百分位数为,
则,解得,
所以第85百分位数为;
(2)由频率分布直方图可知年龄为,,的三组观众频率之比为:,
所以按比例用分层随机抽样的方法抽取10人,则年龄在中的观众应抽取4人;
(3)由频率分布直方图可知的频率为,的频率为,
所以,
.
49.(24-25高一下·吉林长春·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行营销形式,某直播平台有1000个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图①所示,为了更好地服务买卖双方,该直播平台打算用分层抽样的方式抽取80个直播商家进行问询交流.
(1)应抽取小吃类商家多少家?
(2)在问询了解直播商家的利润状况时,工作人员对抽取的80个商家的平均日利润进行了统计(单位:元),所得频率直方图如图②所示.
①估计该直播平台商家平均日利润的第75百分位数;
②若将平均日利润超过480元的商家称为“优质商家”,估计该直播平台“优质商家”的个数.
【答案】(1)28家
(2)① 487.5元;②280
【解题思路】(1)根据分层抽样的定义结合图①求解即可;
(2)①先根据频率和为1求出,然后列方程求解第75百分位数,②根据频率分布直方图求出平均均日利润超过480元的频率,然后乘以1000可得答案.
【解答过程】(1)根据分层抽样知:应抽取小吃类家;
(2)①根据题意可得,解得,
设75百分位数为x,
因为,,
所以,解得,
所以该直播平台商家平均日利润的75百分位数为487.5元.
②,
所以估计该直播平台“优秀商家”的个数为280.
50.(24-25高一下·湖北武汉·期末)某高校体检随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165],[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求和频率分布直方图中身高在175cm及以下的学生人数;
(2)估计该校100名学生身高的下四分位数(结果保留到个位数).
(3)已知落在区间[170,175)的样本平均数是173,方差是8,落在区间[175,180)的样本平均数是178,方差是6,求两组样本成绩合并后的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:记总的样本平均数为,样本方差为,则.
【答案】(1);人
(2)
(3);
【解题思路】(1)利用频率分布直方图中长方形面积之和为1,易求出,进而利用频率分布直方图可求身高在175cm及以下的学生人数;
(2)根据下四分位数概念结合频率分布直方图计算即可;
(3)根据平均数公式计算可得,根据题中给的参考公式代入数据计算可得.
【解答过程】(1)由频率分布直方图可知,解得,
身高在175cm及以下的学生人数(人).
(2)的人数占比为,的人数占比为,
所以该校100名学生身高的下四分位数即分位数落在,
设该校100名学生身高的分位数为,
则,解得,
故该校100名生学身高的下四分位数约为168.
(3)由频率分布直方图知,
这100名学生的身高在的有,
身高在的有人,
所以,
,
所以两组样本成绩合并后的平均数为,方差为.
2 / 30
学科网(北京)股份有限公司
$