摘要:
**基本信息**
系统构建统计全流程方法体系,从抽样方法到数据特征分析,融合直观想象与数据分析素养,实现知识逻辑与解题技巧的统一。
**专项设计**
|模块|题量/典例|方法提炼|知识逻辑|
|----|-----------|----------|----------|
|抽样方法|12题|抽签法/随机数法步骤、分层抽样比例计算|从简单随机抽样到分层抽样,体现抽样方法适用性进阶|
|数据特征|17题|数字特征公式(均值/方差)、百分位数计算步骤|从集中趋势到离散程度,构建数据量化分析框架|
|图表应用|7题|频率分布直方图绘制与参数(均值/中位数)估计|通过图表实现数据可视化,培养数学建模能力|
内容正文:
第九章 统计(复习讲义)
1、在简单随机抽样的实施过程中,掌握抽签法和随机数法的抽样步骤;在分层随机抽样的实施过程中,掌握分层随机抽样的抽样步骤.
2、学习绘制频率分布直方图,通过应用频率分布直方图等统计图表估计总体的取值规律,培养直观想象、数据分析和数学建模的核心素养.
3、通过百分位数的应用过程中,要把实际问题转化为数学问题;通过平均数、中位数和众数的运算强化数学建模、数学运算和数据分析的核心素养.
4、通过标准差、方差和极差的学习,培养数学运算和数据分析的核心素养.
一、全面调查与抽样调查
1、全面调查
定义:对每一个调查对象都进行调查的方法,成为全面调查,又称普查.在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体。
2、抽样调查
(1)定义:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查。
(2)相关的概念:
①总体:所要考察对象的全体叫做总体
②样本:从总体中抽取出的若干个个体组成的集合叫作总体的一个样本
③个体:总体中的每一个考察对象叫作个体
④样本容量:样本中个体的数目叫作样本容量
⑤样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据。
二、简单随机抽样
1、放回简单随机抽样
一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
2、不放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
3、简单随机抽样的特点:
(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;
(2)逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;
(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算。
(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性。
4、常用的简单随机抽样有抽签法和随机数法
三、抽签法与随机数法
1、抽签法
(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本。
(2)抽签法的操作步骤:
第一步,编号:将个个体编号(号码可以从1到,也可以使用已有的号码)
第二步,写签:将个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取次,并记录其编号.
第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.
(3)抽签法的注意事项:
①对个体编号时,也可以利用已有的编号.
②制作号签时,所使用的工具(如纸条、小球等)的形状、大小要一样,以确保每个号签被抽到的可能性相等.
③抽取样本前总体要“均匀搅拌”,目的是让每个号签被抽到的机会相等.
2、随机数法
(1)定义:简单随机抽样中,另一个经常被采用的方法是随机数法,即利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数法步骤:
①把总体中的每个个体编号。
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
【注意】如果产生的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,知道产生的不同标号个数等于样本所需要的数量.
3、抽签法与随机数法的比较
相同点:(1)抽签法与随机数法都是简单随机抽样,并且要求被抽取样本的总体的个数有限;
(2)抽签法与随机数法都是从总体中逐个进行抽取,都是不放回抽样;
不同点:抽签法适用于总体个数较少的情况;随机数法适用于总体个数较多的情形。
四、简单随机抽样中的两类特征数
1、总体平均数
一般地,总体中有个个体,它们的变量值分别为,,…,,则称为总体均值,又称总体平均数
如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数,则总体均值还可以写成加权平均数的形式.
2、样本平均数
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,,则称为样本均值,又称样本平均数。在简单随机抽样中,我们常用样本平均数去估计总体平均数。
五、分层随机抽样
1、分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能出现比较“极端”的样本,从而使得估计出现较大的偏差,这时候我们可以考虑采用一种新的抽样方法——分层随机抽样。
2、分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
3、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配,即:
(1)
(2)
4、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层);
(2)求比:抽样比;
(3)定数:按抽样比确定每层抽取的个体数;
(4)抽样:每层分贝按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本。
六、分层随机抽样的平均数计算
1、总体平均数和样本平均数的计算
在分层随机抽样中,如果层数为2层,第1层和第2层包含的个体数分别为和,抽样的样本容量分别为和,第1层、第2层的总体平均数分别为和,第1层、第2层的样本平均数分别为和,总体平均数为,样本平均数为,则
(1)
(2)
2、用样本平均数估计总体平均数
由于第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
在比例分配的分层随机抽样中,,
所以
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数为.
七、频率分布直方图
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;
也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
八、总体百分位数的估计
1.第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
九、总体集中趋势的估计
1、相关概念
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
2、众数、中位数和平均数的比较
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受少数几个极端数据(即排序靠前或靠后的数据)的影响
对极端值不敏感
众数
体现了样本数据的最大集中点
众数只能传递数据中的信息的很少一部分,对极端值不敏感
3、平均数相关结论:
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
十、总体离散程度的估计
用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:=(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
十一、频率分布直方图中的统计参数
1、频率分布直方图中的“平均数”:因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
2、频率分布直方图中的“中位数”:根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也就有50%的个体大于或等于中位数。因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值。
3、频率分布直方图中的“众数”:根据众数的意义,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数。一般用中点近似值代替。
十二、分层随机抽样中方差的计算
题型一 简单随机抽样
1.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法错误的是( )
A.总体是该市参加升学考试的全体学生
B.个体是抽查的1 000名学生中的每一名学生
C.样本量是1 000
D.样本是全体学生的数学成绩
【答案】D
【分析】从总体,个体,样本和样本容量的定义进行判断
【详解】总体是该市参加升学考试的全体学生,A正确,
个体是该市参加升学考试的每一名学生,B正确,
样本是抽查的1 000名学生,样本量是1 000,C正确,D错误.
故选:D.
2.(25-26高一下·全国·课后作业)下面的抽样方法是简单随机抽样的是( )
A.某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
B.从20个零件中随机逐个抽取3个进行质量检验
C.一个儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿下一件,连续玩了5件
D.从无限多个个体中抽取50个个体作为样本
【答案】B
【分析】根据简单随机抽样的概念依次判断即可求解.
【详解】对于A,抽取个子最高的5名,不是随机抽取,不是简单随机抽样,故A不符合题意;
对于B,从有限总体中进行随机、不放回抽样,符合简单随机抽样的特征,故B符合题意;
对于C,是有放回抽样,不是简单随机抽样,故C不符合题意;
对于D,总体个数是无限的,不是简单随机抽样,故D不符合题意.
故选:B.
3.(24-25高一下·福建福州·期末)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
【答案】B
【分析】根据随机数表的读取规则,逐一选取即可.
【详解】由题知,选取的同学编号分别是442,175,572,175,455,608,331,047,
剔除重复数据,超过500的数据,符合条件的是442,175,455,331,047,第五个是047.
故选:B.
4.(24-25高一下·全国·课后作业)在简单随机抽样中,某一个个体被抽到的可能性( )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能抽取,但各次抽取的可能性不一定
【答案】B
【分析】根据简单随机抽样的性质即可求解.
【详解】在简单随机抽样中,某一个个体被抽到的可能性与第几次抽样无关,每次抽到的可能性都相等,
故选:B
5.(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = , B.a = , C.a = , D.a = ,
【答案】B
【分析】由题意结合简单随机抽样的特征即可确定实数,的值.
【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以李华第一次被抽到的可能性为,
第五次被抽到的可能性为.
即李华同学在每次抽样中被抽到的可能性都是,所以,.
故选:B.
6.(23-24高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( ).
A. B. C. D.
【答案】B
【分析】根据已知条件,结合简单随机抽样的定义,即可求解.
【详解】解:从第二次开始抽取时,余下的每个个体被抽到的概率为,
则,
解得,
故在整个抽样过程中,每个个体被抽到的可能性为.
故选:B.
题型二 分层随机抽样
1.某单位有职工750人,其中青年职工250人,中年职工350人,老年职工150人,为了了解该单位职工的心理健康情况,用按比例分层随机抽样的方法从中抽取样本,若样本中的中年职工为7人,则样本容量为( )
A.15 B.25 C.35 D.75
【答案】A
【分析】根据题意,设样本容量为,利用分层抽样的定义和运算方法,列出方程,即可求解.
【详解】由题意知,该单位中中年职工的人数为350人,且样本中中年职工为7人,
设样本容量为,可得,解得.
故选:A.
2.某中学有300名教师,其中初级教师60名,随机编号为1~60,中级教师150名,随机编号为61~210,高级教师90名,随机编号为211~300.从全校教师中抽取10人参加一个教学座谈会,对于下列两组样本:①7,34,61,88,115,142,169,223,250,288;②26,32,90,100,138,172,188,215,254,297,下列说法正确的是( )
A.①②都可能是按比例分层随机抽样 B.①②都不是按比例分层随机抽样
C.仅①可能是按比例分层随机抽样 D.仅②可能是按比例分层随机抽样
【答案】A
【分析】根据条件,利用分层抽样的定义,即可求解.
【详解】由题知,①和②均是抽取初级教师2人,中级教师5人,高级教师3人,
又初级教师、中级教师、高级教师的人数比为,
所以①和②均是按比例分层随机抽样,
故选:A.
3.(多选题)(25-26高一下·全国·单元测试)某高中学校从有120名学生的“航天”社团中随机抽取30名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取10人;若按性别比例分层随机抽样,则男生抽取18人.则下列结论正确的有
( )
A.样本量为30 B.120名社团成员中男生有72人
C.高二与高三年级的社团成员共有85人 D.高一年级的社团成员中女生最多有48人
【答案】AB
【分析】根据分层抽样的相关概念及等比例性质依次判断各项的正误.
【详解】A:从中随机抽取30名,则样本量为30,对;
B:设120名社团成员中男生有人,因为按性别比例分层随机抽样时男生抽取18人,
所以,解得,所以120名社团成员中男生有72人,对;
C:设高二与高三年级的社团成员共有人,
因为按社团中高一、高二、高三年级的成员人数比例分层随机抽样时高一年级抽取10人,
所以,解得,所以高二与高三年级的社团成员共有80人,错;
D:根据C知,高一年级的社团成员有(人),故高一年级的社团成员中女生最多有40人,错.
故选:AB
4.(25-26高一下·江西赣州·期中)某志愿者团队共有名男性志愿者和名女性志愿者,现按比例用分层随机抽样的方法选取名志愿者,则男性志愿者被选中的人数为______.
【答案】
【详解】由题可知,男性志愿者占比为:,
男性志愿者被选中的人数为.
5.(24-25高一下·福建宁德·期末)某校为了解学生的学习情况,采用比例分配的分层随机抽样的方法,从高一1000人、高二1200人、高三1400人中抽取若干人进行问卷调查,若高二被抽取30人,则高三被抽取_____人.
【答案】35
【分析】根据分层抽样的基本原则,计算各层人数即可.
【详解】设高三抽取人,则由分层抽样可知,解得,
故答案为:35.
6.(2025高一·全国·专题练习)为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中型血、型血、型血、型血的人数比为,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中型血的人数比型血的人数多,则_________.
【答案】
【分析】计算出样本中型血、型血的人数,结合题意可得出关于的等式,解之即可.
【详解】因为感染人群中型血、型血、型血、型血的人数比为,
所以,抽取样本量为的样本中,型血的人数为,
型血的人数为,
所以,,解得.
故答案为:.
题型三 平均数、众数、中位数
1.(25-26高一下·甘肃武威·月考)倡导中小学生学习践行“富强、民主、文明、和谐;自由、平等、公正、法治;爱国、敬业、诚信、友善”社会主义核心价值观这24个字,其中含有12组词,每组词的笔画数的和依次为,则这12个笔画数的众数是( )
A.17 B.16 C.1 D.24
【答案】A
【分析】根据一组数据中出现次数最多的数值来确定众数即可.
【详解】题目中的数据依次为:,
因为::各出现1次,
:出现2次,
:出现3次,
又因为出现的次数最多,所以这组数据的众数是.
2.(25-26高一下·全国·期末)某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用电量/度
120
140
160
180
200
户数
2
3
6
7
2
则这20户家庭该月用电量的众数和中位数分别是( )
A.180,170 B.160,180 C.160,170 D.180,160
【答案】D
【分析】根据表格中的数据,结合众数和中位数的定义与求法,即可求解.
【详解】由表格中的数据,可得用电量为180度的家庭最多,有7户,
所以这20户家庭该月用电量的众数是180;
将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,160,
所以这20户家庭该月用电量的中位数是160.
故选:D.
3.(25-26高一下·甘肃金昌·月考)已知,,…,的平均数为3,则,,…,的平均数为( )
A.5 B.7 C.17 D.25
【答案】C
【详解】,所以,,…,的平均数为
.
4.(2026高一·全国·专题练习)小华六年级第一学期的数学书面测验成绩如下:平时考试第一单元得分,第二单元得分,第三单元得分;期中考试得分,期末考试得分.如果按照平时、期中、期末的权重分别为计算,则小华该学期数学书面测验的总评成绩应为( )分.
A. B.
C. D.
【答案】C
【详解】小华平时考试平均成绩为(分),
该学期小华数学书面测验的总评成绩为(分).
5.已知数据,,的平均数为2,数据,,,,的平均数为10,则数据的平均数为( )
A.4 B.5 C.6 D.7
【答案】D
【分析】根据平均数的概念和公式进行求解即可.
【详解】数据,,的平均数为2,数据,,,,的平均数为10,
数据的平均数为.
故选:D.
6.(2026高一·全国·专题练习)某学校抽取100位老师的年龄,得到如下数据:
年龄(单位:岁)
32
34
38
40
42
43
45
46
48
频数
2
4
20
20
26
10
8
6
4
估计这个学校老师的平均年龄为_____岁.
【答案】
【详解】
即这个学校老师的平均年龄约为岁.
7.盒子中装有除编号(1到6)外完全相同的6个小球,从中有放回地摸球5次,记录摸到球的编号,若已知5个编号的中位数为3,唯一众数为2,则平均数最大可能为______.
【答案】3.6
【分析】依题意,5个数排序后中位数为3,唯一众数为2,可推得这5个数为,其中为大于3且不相等的两个数,其中,,且,即可求解.
【详解】由题可知摸到的号码为2,2,3,,,其中,,且,
为使平均数最大,
,,其平均数最大为.
题型四 总体百分位数
1.(25-26高一下·江苏南京·期中)某同学记录了当地4月最后8天每天的最低气温(单位:℃),分别为12,14,12,16,12,11,15,17,则该组数据的第70百分位数为( )
A.12 B.14 C.15 D.16
【答案】C
【详解】解:数据整理为11,12,12,12,14,15,16,17,
又,则该组数据的第70百分位数为第6个数15.
2.数据3,1,1,4,5,2的第三四分位数为( )
A. B. C. D.
【答案】D
【分析】由分位数的公式计算.
【详解】这组数据共6个数,从小到大排列是,由于,所以第三四分位数是第个数,即.
故选:D
3.(25-26高一下·重庆·期中)某校高二年级个班参加朗诵比赛的得分如下:
则这组数据的下四分位数为( )
A. B. C. D.
【答案】B
【详解】比赛的得分升序排列为:,
由,可知下四分位数为第4项和第5项的平均数,即.
4.某工厂抽检了100个零件,并统计了这些零件的直径(单位:)数据,得到如下表格:
直径/mm
46
47
48
49
50
51
52
53
54
频数
5
8
12
15
20
18
12
6
4
由表可知这100个零件的直径的第60百分位数为( )
A. B. C. D.
【答案】C
【分析】先确定共有个数小于等于,再结合百分位数定义求结论.
【详解】因为被抽检的零件中,直径小于或等于的零件共有个,
且,
所以这个零件的直径的第百分位数为.
5.一组从小到大排列的数据:,,,,,10,,20,,若它们的百分位数是中位数的两倍,则的值为( )
A. B. C. D.
【答案】C
【分析】根据百分位数和中位数的概念计算即可.
【详解】数据,,,,,10,,20,,已是由小到大的排列,数据共个,
中位数为第个与第个数据的平均值即中位数为,
由,
因此百分位数为第个与第个数据的平均值即,
得,
解得.
6.某校将学生分为5个队伍进行研学活动,这5个队伍的人数分别为:50,,55,45,.已知本次研学活动的总人数为250人,且各队人数的第40百分位数不小于48,则各队人数的第70百分位数的最大值是( )
A.51 B.52 C.53 D.54
【答案】D
【分析】结合题意得到,再对取值范围进行分类讨论,最后结合总体百分位数的估计求解最大值即可.
【详解】由题意得,解得,
不妨设,则,而当时,,
此时从小到大的排列顺序为,45,50,55,,而,
故第40百分位数,矛盾,
当时,,此时从小到大的排列顺序为45,,50,,55,
此时,得,于是,
此时,可知第70百分位数是,故D正确.
题型五 极差、方差、标准差
1.有一组按从小到大顺序排列的数据:3,5,,8,9,10,若其极差与平均数相等,则这组数据的中位数为( )
A.7 B.7.5 C.8 D.6.5
【答案】B
【分析】根据极差为最大值与最小值的差值,求出极值,从而求出平均数,进而得出,即可求出中位数.
【详解】依题意可得极差为,
平均数为,
所以,解得,
所以中位数为.
故选:B.
2.(24-25高一下·安徽·期末)在一组样本数据中,0,1,2,3出现的频数分别为,,,,则下面四种情形中,对应样本的标准差最小的一组是( )
A., B.,
C., D.,
【答案】C
【分析】分别计算出各个选项的标准差,判断大小即可得解.
【详解】A项,平均数为,
标准差为;
同理B项,平均数为1.5,标准差为;
C项,平均数为1.5,标准差为;
D项,平均数为1.5,标准差为.
故选:C.
3.(25-26高一下·安徽合肥·月考)某校在一次考试后,对两班的数学成绩进行分析.已知班有人,平均成绩为分,方差为;班有人,平均成绩为分,方差为.则两班全部名同学数学成绩的方差是( )
A. B. C. D.
【答案】C
【详解】两班全部名同学数学成绩的平均数为,
方差.
4.若个数据的平均值为,方差为,现加入数据和,则这个数据的方差为( )
A. B. C. D.
【答案】A
【分析】设这个数据为,依题意求出,加入两数据后再依次求其平均值与方差即可.
【详解】设这个数据为,依题意,,
则,
加入数据和后,这个数据的平均值为,
则方差为.
5.(多选题)已知一组大小不等的数据的平均数为,方差为,标准差为,极差为,若,则下列关于数据的结论正确的是( )
A.平均数为 B.方差为 C.标准差为 D.极差为
【答案】AB
【分析】根据平均数,方差,标准差,极差的定义及性质可得答案.
【详解】因为一组大小不等的数据的平均数为,而,所以数据的平均数为,所以A正确;
数据的方差为,由方差的性质可得数据的方差为,所以B正确;
标准差为方差的算术平方根,取非负数,所以数据的标准差为,所以C错误;
极差为最大值减最小值,所以原数据极差,新数据的极差应为,所以D错误.
6.(多选题)(25-26高一下·甘肃酒泉·期中)有一组样本数据,其平均数为5,方差为,中位数为.在这组数中,去掉一个最大的数10和一个最小的数1,余下8个数据的中位数为,方差为,极差为,则( )
A. B. C. D.
【答案】AD
【分析】根据平均数和方差的运算公式,结合中位数的定义、极差的运算公式逐一判断即可.
【详解】不妨设,则.
因为与的中位数都是,
所以,故A正确.
当时,,故B错误.
,故C错误.
由已知得.
因为,所以,
去掉一个最大的数10和一个最小的数1,余下8个数据的和为,
所以由
,
所以余下8个数据的方差
所以,故D正确.
题型六 分层随机抽样中平均数、方差的计算
1.(24-25高一下·安徽·期末)某校高一年级“物理方向”有“物化生、物化地、物化政”三种常见的选科组合,选物化生、物化地、物化政的学生期中考试数学成绩的平均数分别为,若按不同选科组合的人数比例采用分层随机抽样的方法抽取一个容量为180的样本,抽到选物化生、物化地、物化政的学生人数分别为,则估计该校高一年级“物理方向”的学生期中考试数学成绩的平均数为( )
A.83 B.82 C.81 D.80
【答案】B
【分析】利用分层抽样平均数公式计算得.
【详解】依题意,样本平均数为,
所以估计该校高一年级“物理方向”的学生期中考试数学成绩的平均数为82.
故选:B
2.(多选题)(24-25高一下·广东广州·期末)某校为了解高一年级学生的身高情况,采用样本量按比例分配的分层随机抽样,抽取了男生20人,其平均数和方差分别为172和12.抽取了女生30人,其平均数和方差分别为162和24.由这些数据,可计算出总样本平均数与总样本方差分别是( ).
A. B. C. D.
【答案】AD
【分析】根据分层抽样的总样本平均数和方差公式进行求解即可.
【详解】根据题意可得总样本平均数为
,
根据方差公式可得:
.
3.(2026高一·全国·专题练习)已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
【答案】9.5
【分析】由题干中的比例,根据平均数的计算公式建立方程,可得答案.
【详解】根据题意,不妨设抽取的样本容量分别为,,,
设三条流水线的样本平均数分别为,总体样本平均数为,
则
根据样本平均数公式可得,
解得,所以流水线1的样本平均数为9.5.
4.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,样本中有39名女员工,女员工的平均体重为50kg,标准差为6;有21名男员工,男员工的平均体重为70kg,标准差为4.则样本中所有员工的体重的方差为______.
【答案】
【分析】根据题意先求平均数,再结合分层抽样的方差公式计算样本的方差.
【详解】依题意样本中所有员工的体重的平均值为,
则样本中所有员工的体重的方差,
所以样本中所有员工的体重的方差为.
故答案为:
5.某校有高中学生1000人,其中男生400人,女生600人.A同学按男生、女生进行分层,采用分层随机抽样的方法调查该校全体高中学生的身高(单位:)情况,总样本量为100,计算得到男生身高样本的平均数为170,方差为16;女生身高样本的平均数为160,方差为18.
(1)如果已知男、女样本量按比例分配,求总样本的平均数和方差;
(2)如果已知男、女样本量分别为30和70,在这种情况下,总样本的平均数为,总样本的方差为,分别直接写出与与的大小关系;
(3)如果已知B同学采用了简单随机抽样的方法调查该校全体高中学生的身高情况,样本量为100,其样本平均数为,能否认为比更接近总体平均身高,说明理由.
【答案】(1),
(2)
(3)答案见解析
【分析】(1)根据按比例的分层抽样总样本的平均数和总样本的方差公式计算可得答案;
(2)根据按比例的分层抽样总样本的平均数和总样本的方差公式计算再比较大小可得答案;
(3)示例1:可以认为比更接近总体平均身高。理由:男、女生身高存在明显差异,采用按男、女比例分配的分层随机抽样的效果一般会好于简单随机抽样;示例2:不能认为比更接近总体平均身高,理由:由于样本的随机性,对于一次抽样而言,可能简单随机抽样的估计效果好于分层随机抽的估计效果;示例3:无法确定是否比更接近总体平均身高,理由:由于样本的随机性,对于一次抽样而言,并不能保证分层随机抽的估计效果一定好于简单随机抽样.
【详解】(1)由题意知,总样本的平均数为
总样本的方差为
(2)男、女样本量分别为30和70时,总样本的平均数为
,
总样本的方差为
所以.
(3)答案示例1:可以认为比更接近总体平均身高.
理由如下:
男、女生身高存在明显差异,采用按男、女比例分配的分层随机抽样的效
果一般会好于简单随机抽样,所以可以认为比更接近总体平均身高.
答案示例2:不能认为比更接近总体平均身高.
理由如下:
由于样本的随机性,对于一次抽样而言,可能简单随机抽样的估计效果好于
分层随机抽的估计效果,所以不能认为比更接近总体平均身高.
答案示例3:无法确定是否比更接近总体平均身高.
理由如下:
由于样本的随机性,对于一次抽样而言,并不能保证分层随机抽的估计效果
一定好于简单随机抽样,所以无法确定是否比更接近总体平均身高.
题型七 频率分布直方图及其数字特征的计算
1.(多选题)(23-24高一下·内蒙古通辽·月考)某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60)内的频率为0.03
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2000名学生,则估计有600人支出在[50,60)内
【答案】BCD
【分析】根据频率之和为1即可求解A,进而根据选项即可逐一求解.
【详解】样本中支出在[50,60)内的频率为,所以A错误;
样本容量为=200,支出在[40,50)内的人数为,
支出不少于40元的人数为,所以B,C正确;
若该校有2000名学生,则估计有人支出在[50,60)内,故D正确.
故选:BCD.
2.(多选题)如图所示,三个频率分布直方图显示了三种不同的分布形态,图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,则下列判断错误的是( )
A.图(1)中,平均数=中位数>众数 B.图(2)中,众数<中位数<平均数
C.图(2)中,平均数<众数<中位数 D.图(3)中,中位数<平均数<众数
【答案】ACD
【分析】频率分布直方图不同分布形态下众数、平均数、中位数之间的大小关系即可求解.
【详解】易知图(1)中,平均数中位数众数,故A错误;
图(2)中,最高峰偏左,众数最小,平均数易受极端值的影响,与中位数相比,
平均数总是在“长尾巴”那边,即平均数大于中位数,故B正确,C错误;
同理可知,图(3)中,众数最大,平均数小于中位数,故D错误.
故选:ACD.
3.(多选题)2024年手机迎来发展新机遇,国内两家传媒公司共同发起了中国手机消费行为调查,下表为根据调查得到的2024年1000名中国手机用户购买手机价格频数表,同一组中的数据用该区间的中点值代表,则( )
价格(千元)
频数
150
600
180
50
20
A.估计1000名用户购买手机价格的众数为7.5
B.估计1000名用户购买手机价格的平均数为8.45
C.估计1000名用户购买手机价格的中位数不超过6
D.估计1000名用户购买手机价格的分位数不超过12
【答案】AB
【分析】A选项,先确定众数落在区间上,中间值为7.5,A正确;B选项,根据平均数的定义进行计算;C选项,中位数落在中,利用中位数的定义计算出答案;D选项,先得到分位数落在中,利用百分位数定义得到答案.
【详解】A选项,1000名用户购买手机价格的众数落在区间上,中间值为7.5,A正确;
B选项,同一组中的数据用该区间的中点值代表,
故平均数为,B正确;
C选项,,,故中位数落在中,
中位数为,C错误;
D选项,,,
故分位数落在中,
1000名用户购买手机价格的分位数为,D错误.
故选:AB
4.(多选题)(24-25高一下·河南许昌·期末)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级组织开展数学文化知识竞赛.从参赛的2000名考生成绩中随机抽取100个成绩进行统计,得到如图所示的频率分布直方图,其中90分以上视为优秀,则频率/组距( )
A.a的值为0.030
B.抽取的考生成绩的极差介于40分至60分之间
C.2000名考生中约有10名成绩优秀
D.估计有一半以上的考生的成绩介于70分至90分之间
【答案】ABD
【分析】根据频率之和为、极差、优秀率、频率等知识对选项进行分析,从而确定正确答案.
【详解】依题意,,
解得,A选项正确.
根据频率分布直方图,,
所以极差介于40分至60分之间,B选项正确.
90分以上频率为,对应有人,C选项错误.
成绩介于70分至90分之间的频率为,
所以估计有一半以上的考生的成绩介于70分至90分之间,D选项正确.
故选:ABD
5.(23-24高一下·全国·课堂例题)从我校高二年级的名男生中随机抽取名测量身高,被测学生身高全部介于和之间,将测量结果按如下方式分成八组:第一组,第二组,…,第八组,下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为人.
(1)求第七组的频率;
(2)估计该校的名男生的身高的众数与平均数;
【答案】(1)
(2),
【详解】(1)第六组的频率为,
∴第七组的频率为.
(2)由直方图得,
身高在第一组的频率为,
身高在第二组的频率为,
身高在第三组的频率为,
身高在第四组的频率为,
身高在第五组的频率为,
身高在第六组的频率为,
身高在第七组的频率为,
身高在第八组的频率为,
因为身高在第五组的频率最高,人数最多,
所以众数为.
平均数为:
.
所以估计该校的500名男生的身高的众数为,平均数为.
6.(24-25高一下·吉林长春·月考)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
5
0.05
①
0.20
35
②
30
0.30
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在岁的人数;
(3)现用比例分配的分层随机抽样从、、的样本中共抽取n名志愿者,已知从中抽取了2人,求n的值.
【答案】(1)①应填,②应填;
(2)直方图见解析,人数为175;
(3)15
【分析】(1)结合抽取的总人数,结合表格中数据,计算出结果;
(2)计算出区间的频率/组距,绘制直方图,并利用年龄在岁的频率得到答案;
(3)计算出三个区间的比例,从而计算出从、中分别抽取的人数,得到答案.
【详解】(1)①应填,②应填;
(2)区间的频率为0.20,故频率/组距为,
故补全频率分布直方图,如下:
这500名志愿者中年龄在岁的人数为;
(3)、、的人数比例为,
从中抽取了2人,故从、中分别抽取了7人和6人,
故.
7.(25-26高一下·河南驻马店·期末)2023年以来,河南省文化和旅游厅制定出台推动文旅市场恢复振兴的系列措施,以丰富的旅游业态和高品质的文旅服务不断提升游客出游体验,促进文旅消费增长的同时,也使“这么近,那么美,周末到河南”成为休闲度假新时尚.现为进一步发展河南文旅,提升河南经济,对5月份来豫旅游的部分游客发起满意度调查,从饮食、住宿、交通、服务等方面调查旅客满意度,满意度采用百分制,统计的综合满意度绘制成如下频率分布直方图,图中.
(1)求图中的值并估计满意度得分的平均值(同一组中的数据用该组区间的中点值作代表);
(2)若有超过60%的人满意度在75分及以上,则认为该月文旅成绩合格.河南省5月份文旅成绩合格了吗?请说明你的理由;
(3)河南文旅6月份继续对来豫旅游的游客发起满意度调查,采用样本量比例分配的分层随机抽样,现知6月1日-6月15日调查的4万份数据中其满意度的平均值为80,方差为75;6月16日-6月30日调查的6万份数据中满意度的平均值为90,方差为70.由这些数据估算6月份的总样本的平均数与方差.
【答案】(1),79.5
(2)有超过60%的人满意度在75分及以上,河南省5月份文旅成绩合格了,理由见解析
(3)总样本平均值为86,总样本方差为96.
【分析】(1)由频率分布直方图的性质求参数,再计算平均值即可;
(2)超过60%的人满意度在75分及以上,即为40%分位数大于等于75,求出40%分位数即可;
(3)由总体平均数及总体方差公式进行求解.
【详解】(1)由题意知,解得.
估计满意度得分的平均值为.
(2)超过60%的人满意度在75分及以上,即为40%分位数大于等于75,
以为满意度在的频率为,满意度在的频率为,
可知40%分位数位于.
则,可以估计40%分位数为,
所以有超过60%的人满意度在75分及以上,河南省5月份文旅成绩合格了.
(3)把6月1日-6月15日的样本记为,,…,,其平均数记为,方差记为,
把6月16日-6月30日的样本记为,,…,,其平均数记为,方差记为,
则总样本平均数,
则总样本方差
,
所以总样本平均值为86,总样本方差为96.
题型八 其他统计图表
1.某校为了解学生的体育锻炼情况,随机调查了50名学生,得到他们在某一天各自体育锻炼所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的锻炼时间为( )
A.0.5h B.1h C.1.5h D.2h
【答案】B
【详解】平均每人的锻炼时间为.
2.国家能源集团研发的“擎源”大模型用于预测关键节点电价,研究人员利用模型对某节点连续8个小时的实际与预测电价数据进行记录,并利用上述数据绘制成实际值与预测值对比的折线图(两条折线):
观察图表与数据,下列结论不能直接从中得出的是( )
A.实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值
B.这8小时内,预测值与实际值的差异(两个值的差的绝对值)平均在10元/MWh左右
C.模型对所有“价格下跌时段”(如第5-6小时)的预测都出现了滞后性(即预测反应慢于实际变化)
D.模型的预测精度较高,趋势与实际基本一致,对电网调度有重要参考价值
【答案】C
【详解】由图可知:实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值,A正确;
对于B,差异平均值为,B正确;
由图可知两折线的趋势基本一致,且误差较小,故精确度高,D正确;
对于C,没有足够的理由说明预测变化慢于实际变化,C错误.
3.(25-26高二上·上海黄浦·期末)以下是“我国2019-2024年居民人均服务性消费支出(单位:元)统计图”.关于2020-2024年的数据,下列说法错误的是( ).
A.2021年是这五年中居民人均服务性消费支出增长率最高的年份
B.2020年和2022年居民人均服务性消费支出增长率为负,其余年份为正
C.2024年居民人均服务性消费支出的增长率高于2023年
D.居民人均服务性消费支出增长率有增有减
【答案】C
【分析】根据给定的柱状图,求出2020-2024各年居民人均服务性消费支出增长率,再逐项判断即得.
【详解】由柱状图得, 2020年居民人均服务性消费支出增长率,
2021年居民人均服务性消费支出增长率,
2022年居民人均服务性消费支出增长率,
2023年居民人均服务性消费支出增长率,
2024年居民人均服务性消费支出增长率,
对于A,2021年是这五年中居民人均服务性消费支出增长率最高的年份,A正确;
对于B,2020年和2022年居民人均服务性消费支出增长率为负,其余年份为正,B正确;
对于C,2024年居民人均服务性消费支出的增长率低于2023年,C错误;
对于D,居民人均服务性消费支出增长率有增有减,D正确.
故选:C
4.某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业从业者中,“90后”占比不超过
C.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数多
【答案】D
【分析】对于A,不知道“80后”从事技术岗位的人数的比例,故无法比较;由图1可判断B;求出芯片、软件行业中从事技术和设计岗位的“90后”人数占比即可判断C;求出“90后”从事市场岗位的人数占比可判断D.
【详解】对于A,芯片、软件行业从事技术岗位的人中,“90后”人数占比为,
芯片、软件行业从业者中“80后”占总人数的,但不知道从事技术岗位的人数的比例,故无法比较,故A不一定正确;
对于B,由图1知芯片、软件行业从业者中,“90后”占比为,超过,故B错误;
对于C,芯片、软件行业中从事技术和设计岗位的“90后”人数占从事这两个行业总人数的,
没有超过从事这两个行业总人数的,故C错误;
对于D,芯片、软件行业中,“90后”从事市场岗位的人数占比为,
因为,
所以芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事芯片、软件行业的总人数多,故D正确.
故选:D.
5.(多选题)(25-26高一下·浙江·开学考试)某学校对高二学生选科情况进行了统计,发现学生选科仅有政史地、物化生、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则下列说法正确的是( )
A.该校高二学生总数为800
B.该校高二学生中选考物化地组合的人数为70
C.用分层随机抽样的方法从该校高二学生抽取80人,则生史地组合抽取16人
D.该校高二学生随机抽取一学生,该学生选考物理的概率与选考地理的概率相等
【答案】ACD
【分析】根据扇形图和条形图,读取相应选考组合的人数与占比,依题意逐一判断各选项即可.
【详解】对于A,因政史地有200人,占比25%,故该校高二学生总数为,故A正确;
对于B,因选考物化地和物化政组合的人数相等,故物化地组合的人数为,故B错误;
对于C,由题意,分层随机抽样的抽样比为,则生史地组合应抽取的人数为,故C正确;
对于D,因选考物化生、物化地、物化政组合的学生占比分别为,则学生选考物理的概率为;
而选考政史地、物化地、生史地组合的学生占比分别为,则学生选考地理的概率为,故D正确.
6.(多选题)采购经理指数(PurchasingManagers'Index,简称PMI):是国际上通行的宏观经济监测指标体系之一,对国家经济活动的监测和预测具有重要作用.PMI涵盖着生产与流通、制造业与非制造业等领域,分为制造业PMI、服务业PMI.制造业PMI指数在以上,反映制造业总体扩张;低于,通常反映制造业衰退.下图为我国制造业采购经理指数(PMI)变化趋势图,则下列说法正确的是( )
A.根据上图可知有一半的月份我国的制造业总体在扩张
B.这13个月的PMI值的平均数不超过
C.这13个月的PMI值的中位数是
D.2025年1-4月的PMI的方差小于2025年5-8月的PMI的方差
【答案】BC
【分析】根据折线图及已知,结合各项的描述,依次分析正误即可.
【详解】由图,13个月中共有5个月超过,A错,
13个月从小到大为,
所以这13个月的PMI值的平均数为
,即这13个月的PMI值的平均数不超过,B对,
其中这13个月的PMI值的中位数为第7个数,是,C对,
由图知,2025年1-4月的PMI为,2025年5-8月的PMI为,显然5-8月的PMI的波动性较小,
所以2025年1-4月的PMI的方差大于2025年5-8月的PMI的方差,D错.
故选:BC
7.(多选题)如图是某公司2020年和2024年支出的比例分配图,其中这两年用于文体活动的支出费用相等,则( )
A.2024年总支出比2020年增长
B.用于宣发的支出2024年比2020年多
C.用于水电的支出2024年与2020年相等
D.用于工资的支出2024年比2020年增长
【答案】ACD
【分析】设年总支出为,年总支出为,依题意可得,即可判断A,再分别求出各年用于宣发、水电、工资的支出,即可判断B、C、D.
【详解】对于A:设年总支出为,年总支出为,
依题意可得,所以,
即年总支出比年增长,故A正确;
对于B:年用于宣发的支出为,
年用于宣发的支出为,
故用于宣发的支出年比年少,故B错误;
对于C:年用于水电的支出为,
年用于水电的支出为,
故用于水电的支出年与年相等,故C正确;
对于D:年用于工资的支出为,
年用于工资的支出为,
因为,
所以工资的支出年比年增长,故D正确;
故选:ACD
基础巩固通关测
1.(24-25高一下·河北沧州·期末)某校高中有42个班,每个班有50名学生,现从该校高中每班随机选派3名学生参加交通安全知识竞赛并统计参赛人员的成绩,则其样本量是( )
A.42 B.50 C.126 D.150
【答案】C
【分析】由样本量的定义可得答案.
【详解】由题意可知样本量是.
故选:C
2.(25-26高一下·广西梧州·期末)某班有48名学生,其中男生28人,女生20人.按性别进行分层,用分层随机抽样的方法,从该班学生中抽取12人参加跳绳比赛,如果样本按比例分配,则应抽取的男生人数为( )
A.5 B.6 C.7 D.8
【答案】C
【分析】根据题意结合分层抽样的性质运算求解即可.
【详解】样本按比例分配,男女比例为.
所以应抽取的男生人数为.
故选:C.
3.(24-25高一下·湖北武汉·期末)在高一下学期期中考试后,数学老师随机抽取了6名同学第19题的得分情况如下:3,9,5,8,4,1,则这组数据的平均数和极差分别为( )
A.5,8 B.6,8 C.5,7 D.6,7
【答案】A
【分析】分别计算数据的平均数和极差进行判断即可.
【详解】这6个数据的平均数为:;
这6个数中,最大值为9,最小值为1,所以这组数据的极差为:.
故选:A
4.某市连续8天的AQI(空气质量指数)分别为,则这组数据的上四分位数为( )
A.32 B.33 C.48 D.49
【答案】D
【分析】上四分位数即第75百分位数,将已知数据按从小到大的顺序排列后,根据百分位数的计算步骤先计算,再计算上四分位数即可.
【详解】将按从小到大的顺序排列为,
因为,6为整数,所以上四分位数即从小到大排列中的第6与第7个数据的平均数,即.
5.(25-26高一下·河南·月考)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…,500,假设从第1行第4列的数字开始,则第4个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.455 D.447
【答案】A
【分析】由随机数法概念即可求解.
【详解】由题意,依次读取的三个数字编号分别是442,175,572,175,455,608,331,047,
剔除一个重复数据175和超过500的数据572,608,
所以符合条件的前5个编号是442,175,455,331,047,
所以第4个是331.
故选:A
6.如图为2018-2021年中国货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是( )
A.从2018年开始,2021年的进出口总额增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,2020年的进出口总额增长率最小
【答案】C
【分析】根据已知条形统计图分别判断各个选项即可.
【详解】2021年相对于2020年进出口额增量增加特别明显,故最后一年的增长率最大,A正确;
统计图中的每一年条形图的高度逐年增加,故B正确;
2020年相对于2019年的进口总额是减少的,故C错误;
显然进出口总额2021年的增长率最大,而2020年相对于2019年的增量比2019年相对于2018年的增量小,
且计算增长率时前者的分母还大,故2020年的增长率一定最小,D正确.
故选:C.
7.(25-26高一下·河南南阳·月考)某年度河南省技术发明奖共个项目获奖,这个项目主要完成人的人数为,则这个项目主要完成人的人数的分位数是( )
A. B. C. D.
【答案】B
【分析】将数据由小到大进行排列,结合百分位数的定义求解即可.
【详解】将数据由小到大排列为:,
因为,因此,这个项目主要完成人的人数的分位数是.
故选:B.
8.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
【答案】C
【分析】根据抽样取米一把,数得255粒内夹谷29粒,可计算出夹谷的频率,从而得解.
【详解】设这批米内夹谷约为石,根据样本的性质可得,求得,
即这批米内夹谷约为230石,
故选:C.
9.某科技实验室采用分层抽样的方法,从AI训练、AI测试、AI运维三个小组抽取20名技术员,调查每月完成的项目数.其中训练组抽取6人,平均每月完成10个项目;测试组抽取8人,平均每月完成15个项目;运维组抽取6人,平均每月完成20个项目.则该样本的平均每月完成项目数是( )
A.15 B.16 C.18 D.20
【答案】A
【详解】该样本的平均每月完成项目数是:
.
10.某中学四位同学利用假期到一贫困村参加社会实践活动,感受年该村精准扶贫及新农村建设的变化.经过实地调查显示,该村年的经济收入增加了一倍.实现翻番,精准扶贫取得惊人成果.为更好地了解该村的经济收入变化情况,为后期精准扶贫方向提供决策参考,四位同学统计了该地区新农村建设前后农村的经济收入构成比例.得到饼图:
四位同学依据上述饼图,分别得出以下四个结论,其中结论中错误的是( )
A.精准扶贫及新农村建设后,种植收入减少
B.精准扶贫及新农村建设后,其他收入增加了一倍以上
C.精准扶贫及新农村建设后,养殖收入增加了一倍
D.精准扶贫及新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】A
【分析】设精准扶贫及新农村建设前和后的经济收入分别为和,根据饼状图依次验证各项收入是否满足选项中的要求,由此可得结论.
【详解】设精准扶贫及新农村建设前,经济收入为,则精准扶贫及新农村建设后,经济收入为;
对于A,精准扶贫及新农村建设前,种植收入为;
精准扶贫及新农村建设后,种植收入为;
,精准扶贫及新农村建设后,种植收入增加,A错误;
对于B,精准扶贫及新农村建设前,其他收入为;
精准扶贫及新农村建设后,其他收入为;
,精准扶贫及新农村建设后,其他收入增加了一倍以上,B正确;
对于C,精准扶贫及新农村建设前,养殖收入为;
精准扶贫及新农村建设后,养殖收入为;
,精准扶贫及新农村建设后,养殖收入增加了一倍,C正确;
对于D,精准扶贫及新农村建设后,养殖收入与第三产业收入之和的占比为,超过了总收入的一半,D正确.
故选:A.
11.从101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中采用随机数表法抽取10个人,那么下列说法正确的是( )
A.这是一种科学的抽样方法
B.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【答案】A
【分析】先说明采用抽签法每个人被剔除概率都相等,都是,不被剔除的概率也相等,都是,即可判断B;然后采用随机数表法,在没被剔除的100人中被抽到概率都是,即可判断C,综合B,C,即可判断D;综和B,C,D即可判断A.
【详解】由于先采用抽签法,从101个人中剔除1个人,
对101个人中的每个人来说被抽到(即被剔除)概率都相等,都是,
不被剔除的概率也相等,都是,故B错误;
然后采用随机数表法,在剩余的100个人中抽取10个人,
如果被抽到,概率为,也是相等的,故C错误;
所以由B,C可知,每个人被剔除的概率都是相等的,都是;
没被剔除,然后被抽到的概率也是相等的,都是,故D错误;
所以综上可知这是一种科学的抽样方法,故A正确.
故选:A
12.(24-25高一下·甘肃金昌·阶段检测)某学校有男生850人,女生650人,为调查学生在食堂的平均花费,将男女按比例进行同比例分层抽样.通过同比例分层抽样得到样本中男生一天花费在20元左右,女生在15元左右,则该校学生一个月(按30天)在食堂的平均花费约为( )
A.600元 B.450元 C.535元 D.480元
【答案】C
【分析】按分层比确定学生一天的平均花费,进而可求解.
【详解】因为同比例分层抽样是按比例分配,
所以根据公式得该校学生一天在食堂的平均花费为(元).
所以该校学生一个月在食堂的平均花费约为(元).
故选:C
13.已知样本,,,,的平均数为12,样本,,,的平均数为16,则样本,,,,,,,,的平均数为( )
A.13.5 B.14 C.14.5 D.15
【答案】D
【分析】由平均数的计算公式求解即可.
【详解】由题知:样本,,,,的平均数为12,
故++++;
样本,,,的平均数为16,
故+++;
所以样本,,,,,,,,的平均数为:
++++++++,
故选:D.
14.(24-25高一下·湖南·期末)已知一组样本数据()的平均数为,方差为,则( )
A.,,…,的平均数为
B.,,…,的方差为
C.,,…,的25%分位数为
D.,,…,的极差为
【答案】C
【分析】设方差为,则,,即可判断AB,根据百分位数的定义即可判断C,利用极差的定义即可判断D.
【详解】对于A:,,…,的平均数为,故A错误;
对于B:,,…,的方差为,故B错误;
对于C:由,所以,,…,的25%分位数为,故C正确;
对于D:,,…,的极差为,故D错误.
故选:C.
15.(24-25高一下·河南信阳·期末)数据的平均数为,方差,现在增加两个数据和,则这组新数据的标准差为( )
A. B. C. D.
【答案】B
【分析】根据平均数的计算公式求出新数据的平均数,再根据方差的计算公式求出新数据的方差,最后根据标准差与方差的关系求出新数据的标准差.
【详解】数据的平均数为,方差
即,
则数据,,的平均数为
方差
标准差为.
故选B.
16.(多选题)(25-26高一下·贵州遵义·阶段检测)某校高二年级第一次月考后,为分析该年级1200名学生的物理学习情况,通过分层抽样的方法对该年级200名学生的物理成绩进行统计,整理得到如图所示的频率分布直方图.则( )
A.
B.估计该年级学生物理成绩在70分及以上的学生人数为600人
C.估计该年级学生物理成绩的众数为75
D.估计该年级学生物理成绩的中位数为72.6
【答案】AC
【详解】对于A:因为在频率分布直方图中,所有矩形面积之和为1,
所以,解得,故A正确;
对于B:估计该年级学生物理成绩在70分及以上的学生人数为,故B错误;
对于C:频率分布直方图中,众数是最高矩形所对应的区间中点,最高矩形是,所以中点为75,故C正确;
对于D:设中位数为,前两组的频率为,前三组的频率为,
因此中位数位于区间内,即,解得,故D错误.
17.(多选题)(25-26高一下·江西上饶·期末)上饶市某学校从高一的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和之间,将测量结果按如下方式分成八组:第一组,第二组,⋯,第八组.下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.以下说法正确的是( )
A.第二组的频率为0.016
B.第七组的频率为0.06
C.估计该校高一800名男生的身高的中位数约为
D.估计该校高一800名男生的身高的平均数约为
【答案】BCD
【分析】对于AB,由频率分布直方图矩形面积为1即可求得各组的频率,对于C,先确定中位数所在组,再用中位数计算方法即可求解,对于D,将各组中点值乘以频率后相加即可得到平均数.
【详解】对于A,第二组的频率为,故A错误;
对于B,由题意得第六组人数为4人,则有第六组的频率为,纵坐标为0.016,
所以第七组的满足,故B正确;
对于C,由直方图得,身高在第一组的频率为,
身高在第二组的频率为,
身高在第三组的频率为,
身高在第四组的频率为,
由于,,
设这所学校高一800名男生的身高中位数为,则,
则有,解得,故C正确;
对于D,设这所学校高一800名男生的身高平均数为,
身高在第五组的频率为,
身高在第六组的频率为,
身高在第七组的频率为,
身高在第八组的频率为,
则有,
故D正确.
故选:BCD.
18.(多选题)某农业研究部门在面积相等的100块稻田上种植同一种新型水稻,得到各块稻田的亩产量与田块数的关系(单位:),并整理下表
亩产量
田块数
6
12
18
30
24
10
据表中数据,下列结论正确的是( )
A.100块稻田亩产量的中位数小于
B.100块稻田中亩产量低于的稻田所占比例低于
C.100块稻田亩产量的极差介于至之间
D.100块稻田亩产量的平均值介于至之间
【答案】BC
【分析】对于A,计算出前三段频数即可判断;对于B,计算出低于1100kg的频数,再计算比例即可判断;对于C,根据极差计算方法即可判断;对于D,根据平均值计算公式即可判断.
【详解】对于A,根据频数分布表可知,,所以亩产量的中位数不小于1050kg,故A错误;
对于B,亩产量不低于1100kg的频数为,所以低于1100kg的稻田占比为,故B正确;
对于C,稻田亩产量的最大在区间内,最小在区间内,故极差在范围内,故C正确;
对于D,由频数分布表可得,平均值为,故D错误。
故选:BC.
19.(多选题)某超市统计了2025年前10个月该超市的营业额(单位:万元),得到了如图所示的折线图,则下列说法正确的是( )
A.从二月份开始,每月与上个月相比,营业额下降最多的是五月份
B.这10个月营业额的平均数为32.5万元
C.前5个月营业额的方差大于后5个月营业额的方差
D.这10个月营业额数据的第70百分位数为43
【答案】AC
【分析】对A ,计算相邻月份营业额的变化量,找出下降幅度最大的区间判断;对 B ,将 10 个月的营业额数据求和,再除以 10 得到平均数,与 32.5 万元对比;对 C ,分别计算前 5 个月和后 5 个月营业额的方差,比较两者大小;对 D ,将数据排序后,根据百分位数公式计算第 70 百分位数进行判断.
【详解】对于A:由图可知二月份比一月份增加6万元,三月份比二月份增加24万元,四月份比三月份减少13万元,五月份比四月份减少24万元,
六月份比五月份增加6万元,七月份比六月份增加12万元,八月份比七月份增加2万元,九月份比八月份减少18万元,
十月份比九月份减少4万元,故与上个月相比营业额下降最多的是五月份,A正确;
对于B:由,即这10个月的营业额的平均数为万元,B错误;
对于C:前5个月的平均数,
方差;
后5个月的平均数,
方差
因为,所以前5个月的营业额的方差确实大于后5个月,C正确;
对于D:将10个数据从小到大排序:
因为,所以第百分位数取第7项和第8项的平均数,D错误.
故选:AC.
20.(25-26高一下·全国·课后作业)一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均数为____________.
【答案】
【分析】根据平均数的定义即可计算.
【详解】.
故答案为:.
21.(25-26高一下·贵州遵义·阶段检测)若一组数据的,,,的平均数为4,则,,,的平均数为________.
【答案】
【分析】若一组数据的,,,的平均数为,则,,,的平均数为,利用此公式求解.
【详解】设一组数据的,,,的平均数为,则,
则,,,的平均数为.
22.(24-25高一下·安徽淮北·开学考试)小明的爸爸是个“健步走”运动爱好者,他用手机软件记录了某个月(30天)每天健步走的步数,并将记录结果整理成了如下的统计表:
步数/万步
1.1
1.2
1.3
1.4
1.5
天数
3
7
5
12
3
在每天所走的步数这组数据中,众数和中位数分别是__________.
【答案】、
【分析】根据众数、中位数的定义及表格数据求众数和中位数.
【详解】由众数的定义,根据表格知走万步共有12天,即众数为,
由中位数的定义,根据表格知第15、16个数据分别为、,即中位数为.
故答案为:、
23.(24-25高一下·河北邯郸·期末)某工厂的三个车间生产同一种产品,产量占比分别为.现在用分层随机抽样方法按比例分配从这三个车间生产的该产品中,共抽取70件做使用寿命的测试,则车间应抽取___________件;若三个车间产品的平均使用寿命分别为200,220,210小时,方差分别为30,20,40,则该样本的方差为____________.
附:,其中为每层占比,为每层平均数,为每层标准差,为总体平均数.
【答案】
【分析】空:根据分层抽样按比例抽取即可得到车间应抽取的件数;空:由分层抽样的方差公式即可求解.
【详解】空:由分层抽样方法可得:抽取车间应抽取的件数为:;
空:样本的总体平均数为:,
样本的总体方差为:.
故答案为:;.
24.一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:kg),结果如下:
83,107,91,94,80,80,100,75,102,89,
74,94,84,101,93,85,97,84,85,104
(1)请计算该水果店过去20天苹果日销售量的中位数和极差;
(2)请完成苹果日销售量的频率分布表,并画出频率分布直方图.
分组
频数
频率
合计
【答案】(1)中位数为90;极差为33.
(2)答案见解析
【分析】(1)由中位数和极差的计算方法计算即可;
(2)由绘制频率分布表和频率分布直方图的步骤进行绘制即可.
【详解】(1)将样本数据由小到大排序,结果如下:
74,75,80,80,83,84,84,85,85,89,91,93,94,94,97,100,101,102,104,107.
由样本容量为20可知,数据由小到大排序的中间项应为第10个、第11个数据,分别为89,91,故水果店过去30天苹果日销售量的中位数为.
由上可知,样本数据的最小值为74,最大值为107,故极差为.
(2)由(1)中对数据排序可得频率分布表如下:
分组
频数
频率
2
0.1
13
0.65
5
0.25
合计
20
1
由分组可知组距为20,将各组的频率除以组距可得数据如下:
分组
故频率分布直方图如图所示:
25.(2025高一下·全国·专题练习)某校高二共有5000名学生,其中男生2600人,女生2400人.为分析某次数学成绩(总分150分),应用等可能的抽样方法随抽取100名学生,计算得到男生的平均分为108分,方差为6;女生的平均分为83分,方差为9.
(1)若已知男、女样本量按比例分配,求所抽取的样本总平均分和总方差;
(2)若男、女样本量分别为,,所抽取的样本总平均分为分,总方差为,求,.
【答案】(1)(分),;
(2)
【分析】(1)按照分层抽样得到抽取的男女人数,求出总平均分,代入公式求出总方差;
(2)根据整体方差公式得到方程组,求出答案.
【详解】(1)由已知,按分层抽样,抽取男生:(人),女生:(人),
故该样本的总平均分为:(分),
总方差为:.
(2)由已知,,
解这个方程组,得.
能力提升进阶练
1.(24-25高一下·湖北十堰·自主招生)有甲、乙、丙三个班,甲班有个人,乙班有个人,丙班有人(以上所有参数均为正整数),在一次考试中甲班平均分是分,乙班平均分是分,丙班平均分是分.则甲、乙、丙三个班在这次考试中的总平均分是( )
A. B.
C. D.
【答案】D
【分析】先求出甲乙丙三班的总分,再运用求平均数的计算公式进行计算即可.
【详解】甲班有个人,乙班有个人,丙班有人,甲班平均分是分,乙班平均分是分,丙班平均分是分,
甲乙丙三班在这次考试中的总分为:分,
甲乙丙三班在这次考试中的总平均分是分.
故选:D.
2.为深入学习贯彻习近平新时代中国特色社会主义思想,某校于2026年1月组织高一、高二、高三三个年级共400名学生参加“青春心向党·奋进新征程”党史知识竞赛.如图,结合参赛学生的年级分布饼图与高一学生的排名分布频率条形图,下列命题中错误的是()
A.这400名学生中,高一人数比高二人数多40
B.成绩前200名的高一学生有90人
C.成绩前100名的学生中,高三学生人数不超过64
D.成绩第101名到第200名的学生中,高二人数比高一人数多
【答案】D
【分析】根据饼状图和条形图提供的数据逐一分析判断选项.
【详解】由饼图可知,高一人数比高二人数多选项正确;
由条形图可知,成绩前200名中高一人数为人,B选项正确;
成绩前100名的学生中,高一人数为人,
故高三人数不超过人,C选项正确;
成绩第101名到第名的学生中,高一人数为人,
故高二最多有人,因此高二人数比高一少,D选项错误,
故选:D
3.已知一组数据为,则“”是“这组数据的中位数为4”的( )
A.必要不充分条件 B.充分不必要条件
C.充要条件 D.既不充分又不必要条件
【答案】B
【分析】依次分析充分性和必要性即可得解.
【详解】“”,则题中数据从小到大排列为或,
中位数均为4,充分性成立,
“这组数据的中位数为4”,若,仍满足这组数据的中位数为4,必要性不成立,
所以“”是“这组数据的中位数为4”的充分不必要条件.
故选:B.
4.(25-26高一下·甘肃酒泉·期中)已知一组数据:中的最小数据为9,且第75百分位数是14,则的不同取值可能有( )
A.8个 B.6个 C.4个 D.1个
【答案】B
【分析】根据数据中最小数据为,得到,再由百分位数的计算方法,求得,进而得到的可能取值的个数,即可求解.
【详解】因为数据中最小数据为,可得且,
将7个数据从小到大排序,
因为,则该组数据的第75百分位数为第6个数据,可得,
所以,则的可能取值有,共6个.
5.标志重捕法是指的是在一定范围内,对活动能力强、活动范围较大的动物种群进行粗略估算的一种生物统计方法,是根据自由活动的生物在一定区域内被调查与自然个体数的比例关系对自然个体总数进行数学推断.在被调查种群的生存环境中,捕获一部分个体,将这些个体进行标志后再放回原来的环境,经过一段时间后进行重捕,根据重捕中标志个体占总捕获数的比例来估计该种群的数量.标志重捕法估算种群密度是基于以下几种假设:①标记个体与未标记个体在重捕时被捕获的概率相等;②在调查期内标记的个体没有死亡,没有迁出,标记物没有脱落;③标记个体在种群中均匀分布.若应用标志重捕法调查鱼的种群密度,则下列捕鱼过程会导致估算结果与实际情况误差较大的是( ).
A.第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼
B.第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
C.第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼
D.第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
【答案】D
【分析】先计算出理论数量,分别分析四个选项,结合公式,得到ABC选项,采用标志重捕法估算出的种群数量与实际种群数量大致相等;D选项,采用标志重捕法估算出的种群数量越等于种群中大鱼数量,与实际种群数量相比小.
【详解】理论计算公式为,其中为估算的种群数值,为第一次捕获并标记的个体,
为一段时间后,在原来的捕获点再次捕获的个体数,为二次捕获的个体中有标记的数量,
转换后得,
假设池塘中的鱼分为大鱼和小鱼,大鱼是指用大网和小网均能捕获的鱼,小鱼指仅能用小网能捕获的鱼,
A选项,第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼,
第一次用小网眼的渔网捕鱼,,其中为捕获并标记的大鱼,为捕获并标记的小鱼,
设为池塘中实际的大鱼数,为池塘中实际的小鱼数,为池塘中实际的鱼条数,
则,
标记后全部放回池塘后,池塘中被标记的大鱼占全部大鱼比例为,被标记的小鱼占全部小鱼比例为,
假设每条鱼被捕获的概率相等,故,
第二次捕获的大鱼条中,理论上含标记的大鱼有,
第二次捕获的小鱼条中,理论中含标记的小鱼有,
故,
故总的标记条数为,
所以,又,故,
结论:若两次捕鱼都用小网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
B选项,第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
第一次用小网眼的渔网捕鱼,,其中为捕获并标记的大鱼,为捕获并标记的小鱼,
设为池塘中实际的大鱼数,为池塘中实际的小鱼数,
标记后全部放回池塘后,池塘中被标记的大鱼占全部大鱼比例为,被标记的小鱼占全部小鱼比例为,
假设每条鱼被捕获的概率相等,故,其中为池塘中实际的鱼条数,
第二次用大网眼渔网捕鱼,捕获的全部是大鱼,即,
理论上,,故,又,故,
结论:第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
C选项,第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼,
第一次用大网眼的渔网捕鱼,,标记后将鱼全部放回到池塘后,
池塘中被标记的大鱼占全部大鱼比例为,
第二次用小网眼渔网捕鱼,捕获的鱼中既有大鱼也有小鱼,,
由于第一次用大网眼渔网捕鱼,标记的均为大鱼,故第二次捕获的鱼中,只有大鱼也有可能被标记,
理论上,,
其中,
因为每条鱼捕获的概率相等,所以第二次用小网眼渔网捕获的鱼中,
大鱼和小鱼的比例与池塘中的大鱼和小鱼的比例相等,即,
所以,
结论:第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
D选项,第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
第一次用大网眼的渔网捕鱼,,标记后将鱼全部放回到池塘后,
池塘中被标记的大鱼占全部大鱼比例为,
第二次用大网眼渔网捕鱼,捕获的全部是大鱼,即,
理论上,,故,又,故,
结论:第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量约等于种群中大鱼数量,与实际种群数量相比小,误差大;
故选:D
6.已知四个正整数满足,且 的平均数和中位数都为5,则可能的取值情况总数是( )
A.7 B.9 C.10 D.12
【答案】C
【分析】由平均数和中位数的定义可得,再列举情况即可求解.
【详解】由题意,,
则,且,
则可能的取值情况为:;;;;;
;;;;,共10种情况.
故选:C
7.已知4个互不相等的正整数的平均数为3,极差为4,则这四个数的方差为( )
A. B. C.3 D.2
【答案】A
【分析】根据题意可求得四个数据,利用方差公式可求得结果.
【详解】设4个互不相等的正整数为:,满足:
平均数为3,则总和为;
极差为4,则;
且所有数为互不相等的正整数.
根据题意可得:,且,均为整数.
令,则,,且满足,即,且互不相等,和为6.所以,.
所以四个互不相等的正整数为1,2,4,5.
方差为:.
故选:A.
8.三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标、其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等;第三产业则包括服务业、金融业、信息技术等.如图为我国2020-2024年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2020-2024年第一产业增加值占国内生产总值比重逐年递增
B.2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%
C.2020-2024年第三产业增加值占国内生产总值比重的平均数为55.1%
D.2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第二产业
【答案】B
【分析】选项A,依据表中数据求出2020-2024年第一产业增加值占国内生产总值比重,通过数据判断选项A错误;选项B,利用中位数的定义得到结论;选项C,求出平均数得解;选项D,分别求出每个产业的极差,从而得解.
【详解】选项A,年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
从数据上看,2020-2021年第一产业增加值占国内生产总值比重递减,2021-2022年第一产业增加值占国内生产总值比重持平,2022-2024年第一产业增加值占国内生产总值比重递减,
故选项A错误;
选项B,2020-2024年第二产业增加值占国内生产总值比重依次为,
将这个数从小到大排列为,则这个数的中位数为,
故2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%,故答案B正确;
选项C,2020-2024年第三产业增加值占国内生产总值比重依次为,
则这个数的平均数为,
2020-2024年第三产业增加值占国内生产总值比重的平均数为,故答案C错误;
选项D,2020-2024年第一产业增加值占国内生产总值比重依次为,
这个数中的最小值为,最大值为,故极差为,
2020-2024年第二产业增加值占国内生产总值比重依次为,
这个数中的最小值为,最大值为,故极差为,
2020-2024年第三产业增加值占国内生产总值比重依次为,这个数中的最小值为,最大值为,故极差为,
故2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第三产业,
故选项D不正确.
故选:B.
9.(多选题)(25-26高一下·全国·课堂例题)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
方法一:采用简单随机抽样的方法,将零件编号为00,01,…,99,用抽签法抽取20个;
方法二:采用分层抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下列说法中正确的有( )
A.不论采用哪种抽样方法,这100个零件中每个零件被抽到的概率都是
B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同
C.在上述两种抽样方法中,方法一抽到的样本比方法二抽到的样本更能反映总体的特征
D.在上述两种抽样方法中,方法二抽到的样本比方法一抽到的样本更能反映总体的特征
【答案】AD
【分析】根据抽样的定义及分类判断各个选项即可.
【详解】根据两种抽样的特点可得,无论哪种抽样,总体中每个个体入样的可能性相等,
都为,故A正确,B错误,
因为总体中有差异比较明显的三个层(一级品,二级品,三级品),
所以方法二抽到的样本更有代表性,故C错误,D正确.
故选:AD.
10.(多选题)(24-25高一下·陕西商洛·期末)某学校调查学生对学校食堂意见情况,该学校分高一,高二,高三三个年级,统计可得这三个年级的人数比例为.现用分层随机抽样的方法从这些学生中抽取n名学生进行调研,若高一年级抽到80人,则( ).
A.高二年级抽到60人 B.高三年级抽到90人
C. D.抽取的高二与高三人数之和比高一多40人
【答案】ACD
【分析】根据分层抽样的抽样比及人数进行求解即可.
【详解】根据题意,已知高一、高二、高三人数比例为,
设抽取的高一、高二、高三人数分别为、、.
因为高一抽到80人,即,解得.
所以高二抽到人数为人,故A正确;
高三抽到人数为人,故B错误;
所以,故C正确;
高二与高三人数之和为人,比高一多人,故D正确.
故选:ACD.
11.(多选题)(25-26高一·全国·假期作业)一组数据,,,,的平均值为5,方差为2,极差为7,中位数为6,记 ,,,,的平均值为,方差为,极差为,中位数为,则( )
A. B. C. D.
【答案】ACD
【分析】根据平均值,方差,极差,中位数的定义及性质求解即可.
【详解】由题意可得,,,.
故选:ACD.
12.(多选题)某地区2025年2月至10月地方一般公共预算收入累计的统计图表如下(条形图为月累计值,折线图为与上年同月累计值的环比增长率):
月份
2月
3月
4月
5月
6月
7月
8月
9月
10月
累计收入(亿元)
43.88
66.57
83.96
96.87
134.69
150.09
161.05
191.67
213.39
同比增长率(%)
2
2.1
2.1
3
1
4.2
4.8
根据图表,下列说法正确的是( )
A.该地区2025年每月的地方一般公共预算收入一直递增
B.2025年8月该地区的地方一般公共预算收入超过22亿元
C.2025年9月该地区的地方一般公共预算收入比2024年9月高
D.2024年前9个月,该地区地方一般公共预算收入平均数高于20亿元
【答案】CD
【详解】对于A,由图表可知,3月的地方一般公共预算收入为(亿元),
4月的地方一般公共预算收入为(亿元),故A错误;
对于B,8月该地区的地方一般公共预算收入为(亿元),故B错误;
对于C,由图表可知,2025年9月该地区的地方一般公共预算收入为(亿元),
而2025年9月该地区的地方一般公共预算收入累计同比增长,
所以2024年9月该地区的地方一般公共预算收入累计为(亿元),
2025年8月该地区的地方一般公共预算收入累计同比增长,
所以2024年8月该地区的地方一般公共预算收入累计为(亿元),
所以2024年9月该地区的地方一般公共预算收入为(亿元),比2025年9月少,故C正确;
对于D,由C选项可知,2024年9月该地区的地方一般公共预算收入累计为(亿元),
所以2024年前9个月,该地区地方一般公共预算收入平均数为(亿元),故D正确.
13.(多选题)(25-26高一下·全国·单元测试)已知一组数据:12,31,24,33,22,35,45,25,16,若去掉12和45,则剩下的数据与原数据相比,下列结论正确的是( )
A.中位数不变 B.平均数不变
C.标准差不变 D.四分位数不变
【答案】AD
【分析】根据中位数、平均数、标准差及分位数的定义,对应原数据和去掉12和45后的数据做分析对比,即可得.
【详解】将原数据按从小到大的顺序排列为12,16,22,24,25,31,33,35,45,其中位数为25,
平均数是,
方差是,
由,得原数据的25%分位数是第3个数22,
由,得原数据的75%分位数是第7个数33.
将原数据去掉12和45,得16,22,24,25,31,33,35,其中位数为25,
平均数是,
方差是,
由,得新数据的25%分位数是第2个数22,
由,得新数据的75%分位数是第6个数33,
故中位数和25%,75%分位数不变,
又四分位数为25%,50%,75%分位数,50%分位数为中位数,故四分位数不变,
平均数与方差改变,即平均数与标准差改变.
故选:AD
14.(多选题)一组互不相等的数据从小到大排列为…,去掉后,则( )
A.极差变大 B.平均数变大 C.中位数变小 D.分位数变大
【答案】BD
【详解】设数据为,去掉后数据为.
A:原极差为,新极差为,由于,所以新极差变小,故A错误.
B:原平均数为,新平均数为,
差值为,所以新平均数变大,故B正确.
C:原中位数为,新中位数为,差值为,新中位数变大,故C错误.
D:原分位数,,向上取整,所以为,新分位数则为,差值为,新分位数变大,故D正确.
15.(多选题)(25-26高一下·江苏南京·期中)若是样本数据:,,,的平均数(,,,不全相等),则( )
A.,,,的极差等于,,,,的极差
B.,,,的平均数等于,,,,的平均数
C.,,,的中位数等于,,,,的中位数
D.,,,的标准差大于,,,,的标准差
【答案】ABD
【分析】由统计中的数学特征进行计算即可.
【详解】不妨设,此时,A中极差均为,故A对;
,所以,故B对;
C中前者中位数为,后者中位数为或或,故C错;
D中前者标准差为,
后者标准差为,故D对.
16.(多选题)(25-26高一下·全国·单元测试)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下,一定符合该标志的是( )
甲地:中位数为2,极差为5;乙地:总体平均数为2,众数为2;
丙地:总体平均数为1,总体方差大于0;丁地:总体平均数为2,总体方差为3.
A.甲地 B.乙地 C.丙地 D.丁地
【答案】AD
【分析】逐个选项分析是否一定满足每天新增疑似病例不超过7人即可.
【详解】对于A,设10天的数据从小到大排序为,
由中位数为2可知 ,即 ,
因为 且数据为非负整数,所以必有,
又因为极差为5,所以 ,
由于,可得 ,
因此,最大值不超过7,即每天新增疑似病例不超过7人,故A正确;
对于B,若乙地过去10日分别为,
则满足总体平均数为2,众数为2,但不满足每天新增疑似病例不超过7人,故B错误;
对于C,若丙地过去10日分别为,
则满足总体平均数为1,总体方差大于0, 但不满足每天新增疑似病例不超过7人,故C错误;
对于D,利用反证法,若至少有一天疑似病例超过7人,则方差大于,
与题设矛盾,故连续10天,每天新增疑似病例不超过7人,故D正确.
故选:AD
17.(24-25高一下·山东烟台·月考)现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数和第25百分位数;
(2)在这100名候选者用分层随机抽样的方法从第四组和第五组面试者内抽取10人,再从这10名面试者中随机抽取两名,求两名面试者成绩都在第五组的概率.
(3)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组所有面试者的面试成绩的方差.
【答案】(1)平均数为69.5,第25百分位数为63
(2)
(3)
【分析】(1)根据题意和频率分布直方图可列出关于的方程组,求出的值,然后根据平均数和百分位数的概念和公式求出其值即可.
(2)先确定分层抽样比和人数,然后根据古典概型求取概率即可.
(3)根据平均数和方差的概念和计算公式进行计算即可.
【详解】(1)由题意,根据频率分布直方图可知:,解得,
可知每组的频率依次为:0.05,0.25,0.45,0.2,0.05,
所以这100名候选者面试成绩的平均数为,
因为,设第25百分位数为,则,
那么,解得,故第25百分位数为63.
(2)抽取的10人中,第四组为8人,第五组为2人,记第四组的人的编号为1到8,第五组的人的编号为9和10,
则样本空间
共45个样本点,
记两名面试者成绩都在第五组为事件A,则事件,故;
(3)设第二组、第四组面试者的面试成绩的平均数与方差分别为,且两组频率之比为,
则第二组和第四组所有面试者的面试成绩的平均数,
第二组和第四组所有面试者的面试成绩的方差为:
,
故估计第二组和第四组所有面试者的面试成绩的方差是.
18.(25-26高一下·河南南阳·月考)为了解学生对A,B两家餐厅的满意度情况,现从在A,B两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中B餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较A,B两家餐厅满意指数的平均数的大小;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若B餐厅满意指数频率分布直方图中第三组满意指数的方差为2,第四组满意指数的方差为1,估计在B餐厅用过餐的第三组与第四组所有学生的满意指数的方差.(计算平均数时同一组中的数据用该组区间的中点值作代表)
附:若数据的平均数为,方差为,数据的平均数为,方差为,将这两组数据混合在一起得到一组新数据,设新数据的平均数为,则新数据的方差.
【答案】(1),;
(2)餐厅满意指数的平均数大于餐厅满意指数的平均数
(3)
【分析】(1)根据频率分布直方图的频率和为1的性质,结合已知参数值求解;
(2)利用组中点值与对应频率的乘积和计算两个餐厅满意指数的平均数,并比较大小;
(3)先确定两组数据的人数,再根据混合数据的平均数和方差公式分步计算.
【详解】(1)B餐厅样本容量为50,区间频数为15,对应频率为.
频率分布直方图组距为2,故
所有区间频率和为,即,解得.
(2)餐厅满意指数平均数.
餐厅满意指数平均数.
故.
(3)B餐厅第三组频率为,人数为,平均数7,方差2;
第四组人数为,平均数9,方差1.
混合数据平均数.
方差.
19.(24-25高一下·广东广州·期末)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当时,求与;
(2)设函数,当时,求的解析式,并求在区间上的最小值.
【答案】(1),;
(2),0.02.
【分析】(1)根据题意,由第一个图求出的矩形面积,再根据第二个图求出的矩形面积即可解出.
(2)根据题意,确定分段点100,即可得出的解析式,再根据分段函数的最值求法即可解出.
【详解】(1)
依题意得:
,
.
(2)当时,
,
当时,;
当时,
,
当时,,此时,
所以,在区间上的最小值为0.02.
1 / 3
学科网(北京)股份有限公司
$
第九章 统计(复习讲义)
1、在简单随机抽样的实施过程中,掌握抽签法和随机数法的抽样步骤;在分层随机抽样的实施过程中,掌握分层随机抽样的抽样步骤.
2、学习绘制频率分布直方图,通过应用频率分布直方图等统计图表估计总体的取值规律,培养直观想象、数据分析和数学建模的核心素养.
3、通过百分位数的应用过程中,要把实际问题转化为数学问题;通过平均数、中位数和众数的运算强化数学建模、数学运算和数据分析的核心素养.
4、通过标准差、方差和极差的学习,培养数学运算和数据分析的核心素养.
一、全面调查与抽样调查
1、全面调查
定义:对每一个调查对象都进行调查的方法,成为全面调查,又称普查.在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体。
2、抽样调查
(1)定义:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查。
(2)相关的概念:
①总体:所要考察对象的全体叫做总体
②样本:从总体中抽取出的若干个个体组成的集合叫作总体的一个样本
③个体:总体中的每一个考察对象叫作个体
④样本容量:样本中个体的数目叫作样本容量
⑤样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据。
二、简单随机抽样
1、放回简单随机抽样
一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
2、不放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
3、简单随机抽样的特点:
(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;
(2)逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;
(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算。
(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性。
4、常用的简单随机抽样有抽签法和随机数法
三、抽签法与随机数法
1、抽签法
(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本。
(2)抽签法的操作步骤:
第一步,编号:将个个体编号(号码可以从1到,也可以使用已有的号码)
第二步,写签:将个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取次,并记录其编号.
第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.
(3)抽签法的注意事项:
①对个体编号时,也可以利用已有的编号.
②制作号签时,所使用的工具(如纸条、小球等)的形状、大小要一样,以确保每个号签被抽到的可能性相等.
③抽取样本前总体要“均匀搅拌”,目的是让每个号签被抽到的机会相等.
2、随机数法
(1)定义:简单随机抽样中,另一个经常被采用的方法是随机数法,即利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数法步骤:
①把总体中的每个个体编号。
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
【注意】如果产生的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,知道产生的不同标号个数等于样本所需要的数量.
3、抽签法与随机数法的比较
相同点:(1)抽签法与随机数法都是简单随机抽样,并且要求被抽取样本的总体的个数有限;
(2)抽签法与随机数法都是从总体中逐个进行抽取,都是不放回抽样;
不同点:抽签法适用于总体个数较少的情况;随机数法适用于总体个数较多的情形。
四、简单随机抽样中的两类特征数
1、总体平均数
一般地,总体中有个个体,它们的变量值分别为,,…,,则称为总体均值,又称总体平均数
如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数,则总体均值还可以写成加权平均数的形式.
2、样本平均数
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,,则称为样本均值,又称样本平均数。在简单随机抽样中,我们常用样本平均数去估计总体平均数。
五、分层随机抽样
1、分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能出现比较“极端”的样本,从而使得估计出现较大的偏差,这时候我们可以考虑采用一种新的抽样方法——分层随机抽样。
2、分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
3、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配,即:
(1)
(2)
4、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层);
(2)求比:抽样比;
(3)定数:按抽样比确定每层抽取的个体数;
(4)抽样:每层分贝按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本。
六、分层随机抽样的平均数计算
1、总体平均数和样本平均数的计算
在分层随机抽样中,如果层数为2层,第1层和第2层包含的个体数分别为和,抽样的样本容量分别为和,第1层、第2层的总体平均数分别为和,第1层、第2层的样本平均数分别为和,总体平均数为,样本平均数为,则
(1)
(2)
2、用样本平均数估计总体平均数
由于第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
在比例分配的分层随机抽样中,,
所以
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数为.
七、频率分布直方图
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;
也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
八、总体百分位数的估计
1.第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
九、总体集中趋势的估计
1、相关概念
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
2、众数、中位数和平均数的比较
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受少数几个极端数据(即排序靠前或靠后的数据)的影响
对极端值不敏感
众数
体现了样本数据的最大集中点
众数只能传递数据中的信息的很少一部分,对极端值不敏感
3、平均数相关结论:
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
十、总体离散程度的估计
用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:=(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
十一、频率分布直方图中的统计参数
1、频率分布直方图中的“平均数”:因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
2、频率分布直方图中的“中位数”:根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也就有50%的个体大于或等于中位数。因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值。
3、频率分布直方图中的“众数”:根据众数的意义,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数。一般用中点近似值代替。
十二、分层随机抽样中方差的计算
题型一 简单随机抽样
1.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法错误的是( )
A.总体是该市参加升学考试的全体学生
B.个体是抽查的1 000名学生中的每一名学生
C.样本量是1 000
D.样本是全体学生的数学成绩
2.(25-26高一下·全国·课后作业)下面的抽样方法是简单随机抽样的是( )
A.某班45名同学,指定个子最高的5名同学参加学校组织的某项活动
B.从20个零件中随机逐个抽取3个进行质量检验
C.一个儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿下一件,连续玩了5件
D.从无限多个个体中抽取50个个体作为样本
3.(24-25高一下·福建福州·期末)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
4.(24-25高一下·全国·课后作业)在简单随机抽样中,某一个个体被抽到的可能性( )
A.与第几次抽样有关,第一次抽到的可能性大一些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽到的可能性要大些
D.与第几次抽样无关,每次都是等可能抽取,但各次抽取的可能性不一定
5.(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = , B.a = , C.a = , D.a = ,
6.(23-24高一下·天津南开·期末)利用简单随机抽样的方法,从n个个体()中抽取13个个体,若从第二次抽取开始时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为( ).
A. B. C. D.
题型二 分层随机抽样
1.某单位有职工750人,其中青年职工250人,中年职工350人,老年职工150人,为了了解该单位职工的心理健康情况,用按比例分层随机抽样的方法从中抽取样本,若样本中的中年职工为7人,则样本容量为( )
A.15 B.25 C.35 D.75
2.某中学有300名教师,其中初级教师60名,随机编号为1~60,中级教师150名,随机编号为61~210,高级教师90名,随机编号为211~300.从全校教师中抽取10人参加一个教学座谈会,对于下列两组样本:①7,34,61,88,115,142,169,223,250,288;②26,32,90,100,138,172,188,215,254,297,下列说法正确的是( )
A.①②都可能是按比例分层随机抽样 B.①②都不是按比例分层随机抽样
C.仅①可能是按比例分层随机抽样 D.仅②可能是按比例分层随机抽样
3.(多选题)(25-26高一下·全国·单元测试)某高中学校从有120名学生的“航天”社团中随机抽取30名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取10人;若按性别比例分层随机抽样,则男生抽取18人.则下列结论正确的有
( )
A.样本量为30 B.120名社团成员中男生有72人
C.高二与高三年级的社团成员共有85人 D.高一年级的社团成员中女生最多有48人
4.(25-26高一下·江西赣州·期中)某志愿者团队共有名男性志愿者和名女性志愿者,现按比例用分层随机抽样的方法选取名志愿者,则男性志愿者被选中的人数为______.
5.(24-25高一下·福建宁德·期末)某校为了解学生的学习情况,采用比例分配的分层随机抽样的方法,从高一1000人、高二1200人、高三1400人中抽取若干人进行问卷调查,若高二被抽取30人,则高三被抽取_____人.
6.(2025高一·全国·专题练习)为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中型血、型血、型血、型血的人数比为,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中型血的人数比型血的人数多,则_________.
题型三 平均数、众数、中位数
1.(25-26高一下·甘肃武威·月考)倡导中小学生学习践行“富强、民主、文明、和谐;自由、平等、公正、法治;爱国、敬业、诚信、友善”社会主义核心价值观这24个字,其中含有12组词,每组词的笔画数的和依次为,则这12个笔画数的众数是( )
A.17 B.16 C.1 D.24
2.(25-26高一下·全国·期末)某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用电量/度
120
140
160
180
200
户数
2
3
6
7
2
则这20户家庭该月用电量的众数和中位数分别是( )
A.180,170 B.160,180 C.160,170 D.180,160
3.(25-26高一下·甘肃金昌·月考)已知,,…,的平均数为3,则,,…,的平均数为( )
A.5 B.7 C.17 D.25
4.(2026高一·全国·专题练习)小华六年级第一学期的数学书面测验成绩如下:平时考试第一单元得分,第二单元得分,第三单元得分;期中考试得分,期末考试得分.如果按照平时、期中、期末的权重分别为计算,则小华该学期数学书面测验的总评成绩应为( )分.
A. B.
C. D.
5.已知数据,,的平均数为2,数据,,,,的平均数为10,则数据的平均数为( )
A.4 B.5 C.6 D.7
6.(2026高一·全国·专题练习)某学校抽取100位老师的年龄,得到如下数据:
年龄(单位:岁)
32
34
38
40
42
43
45
46
48
频数
2
4
20
20
26
10
8
6
4
估计这个学校老师的平均年龄为_____岁.
7.盒子中装有除编号(1到6)外完全相同的6个小球,从中有放回地摸球5次,记录摸到球的编号,若已知5个编号的中位数为3,唯一众数为2,则平均数最大可能为______.
题型四 总体百分位数
1.(25-26高一下·江苏南京·期中)某同学记录了当地4月最后8天每天的最低气温(单位:℃),分别为12,14,12,16,12,11,15,17,则该组数据的第70百分位数为( )
A.12 B.14 C.15 D.16
2.数据3,1,1,4,5,2的第三四分位数为( )
A. B. C. D.
3.(25-26高一下·重庆·期中)某校高二年级个班参加朗诵比赛的得分如下:
则这组数据的下四分位数为( )
A. B. C. D.
4.某工厂抽检了100个零件,并统计了这些零件的直径(单位:)数据,得到如下表格:
直径/mm
46
47
48
49
50
51
52
53
54
频数
5
8
12
15
20
18
12
6
4
由表可知这100个零件的直径的第60百分位数为( )
A. B. C. D.
5.一组从小到大排列的数据:,,,,,10,,20,,若它们的百分位数是中位数的两倍,则的值为( )
A. B. C. D.
6.某校将学生分为5个队伍进行研学活动,这5个队伍的人数分别为:50,,55,45,.已知本次研学活动的总人数为250人,且各队人数的第40百分位数不小于48,则各队人数的第70百分位数的最大值是( )
A.51 B.52 C.53 D.54
题型五 极差、方差、标准差
1.有一组按从小到大顺序排列的数据:3,5,,8,9,10,若其极差与平均数相等,则这组数据的中位数为( )
A.7 B.7.5 C.8 D.6.5
2.(24-25高一下·安徽·期末)在一组样本数据中,0,1,2,3出现的频数分别为,,,,则下面四种情形中,对应样本的标准差最小的一组是( )
A., B.,
C., D.,
3.(25-26高一下·安徽合肥·月考)某校在一次考试后,对两班的数学成绩进行分析.已知班有人,平均成绩为分,方差为;班有人,平均成绩为分,方差为.则两班全部名同学数学成绩的方差是( )
A. B. C. D.
4.若个数据的平均值为,方差为,现加入数据和,则这个数据的方差为( )
A. B. C. D.
5.(多选题)已知一组大小不等的数据的平均数为,方差为,标准差为,极差为,若,则下列关于数据的结论正确的是( )
A.平均数为 B.方差为 C.标准差为 D.极差为
6.(多选题)(25-26高一下·甘肃酒泉·期中)有一组样本数据,其平均数为5,方差为,中位数为.在这组数中,去掉一个最大的数10和一个最小的数1,余下8个数据的中位数为,方差为,极差为,则( )
A. B. C. D.
题型六 分层随机抽样中平均数、方差的计算
1.(24-25高一下·安徽·期末)某校高一年级“物理方向”有“物化生、物化地、物化政”三种常见的选科组合,选物化生、物化地、物化政的学生期中考试数学成绩的平均数分别为,若按不同选科组合的人数比例采用分层随机抽样的方法抽取一个容量为180的样本,抽到选物化生、物化地、物化政的学生人数分别为,则估计该校高一年级“物理方向”的学生期中考试数学成绩的平均数为( )
A.83 B.82 C.81 D.80
2.(多选题)(24-25高一下·广东广州·期末)某校为了解高一年级学生的身高情况,采用样本量按比例分配的分层随机抽样,抽取了男生20人,其平均数和方差分别为172和12.抽取了女生30人,其平均数和方差分别为162和24.由这些数据,可计算出总样本平均数与总样本方差分别是( ).
A. B. C. D.
3.(2026高一·全国·专题练习)已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
4.某公司为了调查员工的健康状况,由于女员工所占比重大,按性别分层,用按比例分配的分层随机抽样的方法抽取样本,样本中有39名女员工,女员工的平均体重为50kg,标准差为6;有21名男员工,男员工的平均体重为70kg,标准差为4.则样本中所有员工的体重的方差为______.
5.某校有高中学生1000人,其中男生400人,女生600人.A同学按男生、女生进行分层,采用分层随机抽样的方法调查该校全体高中学生的身高(单位:)情况,总样本量为100,计算得到男生身高样本的平均数为170,方差为16;女生身高样本的平均数为160,方差为18.
(1)如果已知男、女样本量按比例分配,求总样本的平均数和方差;
(2)如果已知男、女样本量分别为30和70,在这种情况下,总样本的平均数为,总样本的方差为,分别直接写出与与的大小关系;
(3)如果已知B同学采用了简单随机抽样的方法调查该校全体高中学生的身高情况,样本量为100,其样本平均数为,能否认为比更接近总体平均身高,说明理由.
题型七 频率分布直方图及其数字特征的计算
1.(多选题)(23-24高一下·内蒙古通辽·月考)某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60)内的频率为0.03
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2000名学生,则估计有600人支出在[50,60)内
2.(多选题)如图所示,三个频率分布直方图显示了三种不同的分布形态,图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,则下列判断错误的是( )
A.图(1)中,平均数=中位数>众数 B.图(2)中,众数<中位数<平均数
C.图(2)中,平均数<众数<中位数 D.图(3)中,中位数<平均数<众数
3.(多选题)2024年手机迎来发展新机遇,国内两家传媒公司共同发起了中国手机消费行为调查,下表为根据调查得到的2024年1000名中国手机用户购买手机价格频数表,同一组中的数据用该区间的中点值代表,则( )
价格(千元)
频数
150
600
180
50
20
A.估计1000名用户购买手机价格的众数为7.5
B.估计1000名用户购买手机价格的平均数为8.45
C.估计1000名用户购买手机价格的中位数不超过6
D.估计1000名用户购买手机价格的分位数不超过12
4.(多选题)(24-25高一下·河南许昌·期末)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级组织开展数学文化知识竞赛.从参赛的2000名考生成绩中随机抽取100个成绩进行统计,得到如图所示的频率分布直方图,其中90分以上视为优秀,则频率/组距( )
A.a的值为0.030
B.抽取的考生成绩的极差介于40分至60分之间
C.2000名考生中约有10名成绩优秀
D.估计有一半以上的考生的成绩介于70分至90分之间
5.(23-24高一下·全国·课堂例题)从我校高二年级的名男生中随机抽取名测量身高,被测学生身高全部介于和之间,将测量结果按如下方式分成八组:第一组,第二组,…,第八组,下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为人.
(1)求第七组的频率;
(2)估计该校的名男生的身高的众数与平均数;
6.(24-25高一下·吉林长春·月考)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
5
0.05
①
0.20
35
②
30
0.30
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在岁的人数;
(3)现用比例分配的分层随机抽样从、、的样本中共抽取n名志愿者,已知从中抽取了2人,求n的值.
7.(25-26高一下·河南驻马店·期末)2023年以来,河南省文化和旅游厅制定出台推动文旅市场恢复振兴的系列措施,以丰富的旅游业态和高品质的文旅服务不断提升游客出游体验,促进文旅消费增长的同时,也使“这么近,那么美,周末到河南”成为休闲度假新时尚.现为进一步发展河南文旅,提升河南经济,对5月份来豫旅游的部分游客发起满意度调查,从饮食、住宿、交通、服务等方面调查旅客满意度,满意度采用百分制,统计的综合满意度绘制成如下频率分布直方图,图中.
(1)求图中的值并估计满意度得分的平均值(同一组中的数据用该组区间的中点值作代表);
(2)若有超过60%的人满意度在75分及以上,则认为该月文旅成绩合格.河南省5月份文旅成绩合格了吗?请说明你的理由;
(3)河南文旅6月份继续对来豫旅游的游客发起满意度调查,采用样本量比例分配的分层随机抽样,现知6月1日-6月15日调查的4万份数据中其满意度的平均值为80,方差为75;6月16日-6月30日调查的6万份数据中满意度的平均值为90,方差为70.由这些数据估算6月份的总样本的平均数与方差.
题型八 其他统计图表
1.某校为了解学生的体育锻炼情况,随机调查了50名学生,得到他们在某一天各自体育锻炼所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的锻炼时间为( )
A.0.5h B.1h C.1.5h D.2h
2.国家能源集团研发的“擎源”大模型用于预测关键节点电价,研究人员利用模型对某节点连续8个小时的实际与预测电价数据进行记录,并利用上述数据绘制成实际值与预测值对比的折线图(两条折线):
观察图表与数据,下列结论不能直接从中得出的是( )
A.实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值
B.这8小时内,预测值与实际值的差异(两个值的差的绝对值)平均在10元/MWh左右
C.模型对所有“价格下跌时段”(如第5-6小时)的预测都出现了滞后性(即预测反应慢于实际变化)
D.模型的预测精度较高,趋势与实际基本一致,对电网调度有重要参考价值
3.(25-26高二上·上海黄浦·期末)以下是“我国2019-2024年居民人均服务性消费支出(单位:元)统计图”.关于2020-2024年的数据,下列说法错误的是( ).
A.2021年是这五年中居民人均服务性消费支出增长率最高的年份
B.2020年和2022年居民人均服务性消费支出增长率为负,其余年份为正
C.2024年居民人均服务性消费支出的增长率高于2023年
D.居民人均服务性消费支出增长率有增有减
4.某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业从业者中,“90后”占比不超过
C.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数多
5.(多选题)(25-26高一下·浙江·开学考试)某学校对高二学生选科情况进行了统计,发现学生选科仅有政史地、物化生、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则下列说法正确的是( )
A.该校高二学生总数为800
B.该校高二学生中选考物化地组合的人数为70
C.用分层随机抽样的方法从该校高二学生抽取80人,则生史地组合抽取16人
D.该校高二学生随机抽取一学生,该学生选考物理的概率与选考地理的概率相等
6.(多选题)采购经理指数(PurchasingManagers'Index,简称PMI):是国际上通行的宏观经济监测指标体系之一,对国家经济活动的监测和预测具有重要作用.PMI涵盖着生产与流通、制造业与非制造业等领域,分为制造业PMI、服务业PMI.制造业PMI指数在以上,反映制造业总体扩张;低于,通常反映制造业衰退.下图为我国制造业采购经理指数(PMI)变化趋势图,则下列说法正确的是( )
A.根据上图可知有一半的月份我国的制造业总体在扩张
B.这13个月的PMI值的平均数不超过
C.这13个月的PMI值的中位数是
D.2025年1-4月的PMI的方差小于2025年5-8月的PMI的方差
7.(多选题)如图是某公司2020年和2024年支出的比例分配图,其中这两年用于文体活动的支出费用相等,则( )
A.2024年总支出比2020年增长
B.用于宣发的支出2024年比2020年多
C.用于水电的支出2024年与2020年相等
D.用于工资的支出2024年比2020年增长
基础巩固通关测
1.(24-25高一下·河北沧州·期末)某校高中有42个班,每个班有50名学生,现从该校高中每班随机选派3名学生参加交通安全知识竞赛并统计参赛人员的成绩,则其样本量是( )
A.42 B.50 C.126 D.150
2.(25-26高一下·广西梧州·期末)某班有48名学生,其中男生28人,女生20人.按性别进行分层,用分层随机抽样的方法,从该班学生中抽取12人参加跳绳比赛,如果样本按比例分配,则应抽取的男生人数为( )
A.5 B.6 C.7 D.8
3.(24-25高一下·湖北武汉·期末)在高一下学期期中考试后,数学老师随机抽取了6名同学第19题的得分情况如下:3,9,5,8,4,1,则这组数据的平均数和极差分别为( )
A.5,8 B.6,8 C.5,7 D.6,7
4.某市连续8天的AQI(空气质量指数)分别为,则这组数据的上四分位数为( )
A.32 B.33 C.48 D.49
5.(25-26高一下·河南·月考)某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…,500,假设从第1行第4列的数字开始,则第4个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.455 D.447
6.如图为2018-2021年中国货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是( )
A.从2018年开始,2021年的进出口总额增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,2020年的进出口总额增长率最小
7.(25-26高一下·河南南阳·月考)某年度河南省技术发明奖共个项目获奖,这个项目主要完成人的人数为,则这个项目主要完成人的人数的分位数是( )
A. B. C. D.
8.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
9.某科技实验室采用分层抽样的方法,从AI训练、AI测试、AI运维三个小组抽取20名技术员,调查每月完成的项目数.其中训练组抽取6人,平均每月完成10个项目;测试组抽取8人,平均每月完成15个项目;运维组抽取6人,平均每月完成20个项目.则该样本的平均每月完成项目数是( )
A.15 B.16 C.18 D.20
10.某中学四位同学利用假期到一贫困村参加社会实践活动,感受年该村精准扶贫及新农村建设的变化.经过实地调查显示,该村年的经济收入增加了一倍.实现翻番,精准扶贫取得惊人成果.为更好地了解该村的经济收入变化情况,为后期精准扶贫方向提供决策参考,四位同学统计了该地区新农村建设前后农村的经济收入构成比例.得到饼图:
四位同学依据上述饼图,分别得出以下四个结论,其中结论中错误的是( )
A.精准扶贫及新农村建设后,种植收入减少
B.精准扶贫及新农村建设后,其他收入增加了一倍以上
C.精准扶贫及新农村建设后,养殖收入增加了一倍
D.精准扶贫及新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
11.从101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中采用随机数表法抽取10个人,那么下列说法正确的是( )
A.这是一种科学的抽样方法
B.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
12.(24-25高一下·甘肃金昌·阶段检测)某学校有男生850人,女生650人,为调查学生在食堂的平均花费,将男女按比例进行同比例分层抽样.通过同比例分层抽样得到样本中男生一天花费在20元左右,女生在15元左右,则该校学生一个月(按30天)在食堂的平均花费约为( )
A.600元 B.450元 C.535元 D.480元
13.已知样本,,,,的平均数为12,样本,,,的平均数为16,则样本,,,,,,,,的平均数为( )
A.13.5 B.14 C.14.5 D.15
14.(24-25高一下·湖南·期末)已知一组样本数据()的平均数为,方差为,则( )
A.,,…,的平均数为
B.,,…,的方差为
C.,,…,的25%分位数为
D.,,…,的极差为
15.(24-25高一下·河南信阳·期末)数据的平均数为,方差,现在增加两个数据和,则这组新数据的标准差为( )
A. B. C. D.
16.(多选题)(25-26高一下·贵州遵义·阶段检测)某校高二年级第一次月考后,为分析该年级1200名学生的物理学习情况,通过分层抽样的方法对该年级200名学生的物理成绩进行统计,整理得到如图所示的频率分布直方图.则( )
A.
B.估计该年级学生物理成绩在70分及以上的学生人数为600人
C.估计该年级学生物理成绩的众数为75
D.估计该年级学生物理成绩的中位数为72.6
17.(多选题)(25-26高一下·江西上饶·期末)上饶市某学校从高一的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和之间,将测量结果按如下方式分成八组:第一组,第二组,⋯,第八组.下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.以下说法正确的是( )
A.第二组的频率为0.016
B.第七组的频率为0.06
C.估计该校高一800名男生的身高的中位数约为
D.估计该校高一800名男生的身高的平均数约为
18.(多选题)某农业研究部门在面积相等的100块稻田上种植同一种新型水稻,得到各块稻田的亩产量与田块数的关系(单位:),并整理下表
亩产量
田块数
6
12
18
30
24
10
据表中数据,下列结论正确的是( )
A.100块稻田亩产量的中位数小于
B.100块稻田中亩产量低于的稻田所占比例低于
C.100块稻田亩产量的极差介于至之间
D.100块稻田亩产量的平均值介于至之间
19.(多选题)某超市统计了2025年前10个月该超市的营业额(单位:万元),得到了如图所示的折线图,则下列说法正确的是( )
A.从二月份开始,每月与上个月相比,营业额下降最多的是五月份
B.这10个月营业额的平均数为32.5万元
C.前5个月营业额的方差大于后5个月营业额的方差
D.这10个月营业额数据的第70百分位数为43
20.(25-26高一下·全国·课后作业)一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均数为____________.
21.(25-26高一下·贵州遵义·阶段检测)若一组数据的,,,的平均数为4,则,,,的平均数为________.
22.(24-25高一下·安徽淮北·开学考试)小明的爸爸是个“健步走”运动爱好者,他用手机软件记录了某个月(30天)每天健步走的步数,并将记录结果整理成了如下的统计表:
步数/万步
1.1
1.2
1.3
1.4
1.5
天数
3
7
5
12
3
在每天所走的步数这组数据中,众数和中位数分别是__________.
23.(24-25高一下·河北邯郸·期末)某工厂的三个车间生产同一种产品,产量占比分别为.现在用分层随机抽样方法按比例分配从这三个车间生产的该产品中,共抽取70件做使用寿命的测试,则车间应抽取___________件;若三个车间产品的平均使用寿命分别为200,220,210小时,方差分别为30,20,40,则该样本的方差为____________.
附:,其中为每层占比,为每层平均数,为每层标准差,为总体平均数.
24.一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:kg),结果如下:
83,107,91,94,80,80,100,75,102,89,
74,94,84,101,93,85,97,84,85,104
(1)请计算该水果店过去20天苹果日销售量的中位数和极差;
(2)请完成苹果日销售量的频率分布表,并画出频率分布直方图.
分组
频数
频率
合计
25.(2025高一下·全国·专题练习)某校高二共有5000名学生,其中男生2600人,女生2400人.为分析某次数学成绩(总分150分),应用等可能的抽样方法随抽取100名学生,计算得到男生的平均分为108分,方差为6;女生的平均分为83分,方差为9.
(1)若已知男、女样本量按比例分配,求所抽取的样本总平均分和总方差;
(2)若男、女样本量分别为,,所抽取的样本总平均分为分,总方差为,求,.
能力提升进阶练
1.(24-25高一下·湖北十堰·自主招生)有甲、乙、丙三个班,甲班有个人,乙班有个人,丙班有人(以上所有参数均为正整数),在一次考试中甲班平均分是分,乙班平均分是分,丙班平均分是分.则甲、乙、丙三个班在这次考试中的总平均分是( )
A. B.
C. D.
2.为深入学习贯彻习近平新时代中国特色社会主义思想,某校于2026年1月组织高一、高二、高三三个年级共400名学生参加“青春心向党·奋进新征程”党史知识竞赛.如图,结合参赛学生的年级分布饼图与高一学生的排名分布频率条形图,下列命题中错误的是()
A.这400名学生中,高一人数比高二人数多40
B.成绩前200名的高一学生有90人
C.成绩前100名的学生中,高三学生人数不超过64
D.成绩第101名到第200名的学生中,高二人数比高一人数多
3.已知一组数据为,则“”是“这组数据的中位数为4”的( )
A.必要不充分条件 B.充分不必要条件
C.充要条件 D.既不充分又不必要条件
4.(25-26高一下·甘肃酒泉·期中)已知一组数据:中的最小数据为9,且第75百分位数是14,则的不同取值可能有( )
A.8个 B.6个 C.4个 D.1个
5.标志重捕法是指的是在一定范围内,对活动能力强、活动范围较大的动物种群进行粗略估算的一种生物统计方法,是根据自由活动的生物在一定区域内被调查与自然个体数的比例关系对自然个体总数进行数学推断.在被调查种群的生存环境中,捕获一部分个体,将这些个体进行标志后再放回原来的环境,经过一段时间后进行重捕,根据重捕中标志个体占总捕获数的比例来估计该种群的数量.标志重捕法估算种群密度是基于以下几种假设:①标记个体与未标记个体在重捕时被捕获的概率相等;②在调查期内标记的个体没有死亡,没有迁出,标记物没有脱落;③标记个体在种群中均匀分布.若应用标志重捕法调查鱼的种群密度,则下列捕鱼过程会导致估算结果与实际情况误差较大的是( ).
A.第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼
B.第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
C.第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼
D.第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
6.已知四个正整数满足,且 的平均数和中位数都为5,则可能的取值情况总数是( )
A.7 B.9 C.10 D.12
7.已知4个互不相等的正整数的平均数为3,极差为4,则这四个数的方差为( )
A. B. C.3 D.2
8.三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标、其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等;第三产业则包括服务业、金融业、信息技术等.如图为我国2020-2024年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2020-2024年第一产业增加值占国内生产总值比重逐年递增
B.2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%
C.2020-2024年第三产业增加值占国内生产总值比重的平均数为55.1%
D.2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第二产业
9.(多选题)(25-26高一下·全国·课堂例题)在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.
方法一:采用简单随机抽样的方法,将零件编号为00,01,…,99,用抽签法抽取20个;
方法二:采用分层抽样的方法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.
对于上述问题,下列说法中正确的有( )
A.不论采用哪种抽样方法,这100个零件中每个零件被抽到的概率都是
B.采用不同的方法,这100个零件中每一个零件被抽到的可能性各不相同
C.在上述两种抽样方法中,方法一抽到的样本比方法二抽到的样本更能反映总体的特征
D.在上述两种抽样方法中,方法二抽到的样本比方法一抽到的样本更能反映总体的特征
10.(多选题)(24-25高一下·陕西商洛·期末)某学校调查学生对学校食堂意见情况,该学校分高一,高二,高三三个年级,统计可得这三个年级的人数比例为.现用分层随机抽样的方法从这些学生中抽取n名学生进行调研,若高一年级抽到80人,则( ).
A.高二年级抽到60人 B.高三年级抽到90人
C. D.抽取的高二与高三人数之和比高一多40人
11.(多选题)(25-26高一·全国·假期作业)一组数据,,,,的平均值为5,方差为2,极差为7,中位数为6,记 ,,,,的平均值为,方差为,极差为,中位数为,则( )
A. B. C. D.
12.(多选题)某地区2025年2月至10月地方一般公共预算收入累计的统计图表如下(条形图为月累计值,折线图为与上年同月累计值的环比增长率):
月份
2月
3月
4月
5月
6月
7月
8月
9月
10月
累计收入(亿元)
43.88
66.57
83.96
96.87
134.69
150.09
161.05
191.67
213.39
同比增长率(%)
2
2.1
2.1
3
1
4.2
4.8
根据图表,下列说法正确的是( )
A.该地区2025年每月的地方一般公共预算收入一直递增
B.2025年8月该地区的地方一般公共预算收入超过22亿元
C.2025年9月该地区的地方一般公共预算收入比2024年9月高
D.2024年前9个月,该地区地方一般公共预算收入平均数高于20亿元
13.(多选题)(25-26高一下·全国·单元测试)已知一组数据:12,31,24,33,22,35,45,25,16,若去掉12和45,则剩下的数据与原数据相比,下列结论正确的是( )
A.中位数不变 B.平均数不变
C.标准差不变 D.四分位数不变
14.(多选题)一组互不相等的数据从小到大排列为…,去掉后,则( )
A.极差变大 B.平均数变大 C.中位数变小 D.分位数变大
15.(多选题)(25-26高一下·江苏南京·期中)若是样本数据:,,,的平均数(,,,不全相等),则( )
A.,,,的极差等于,,,,的极差
B.,,,的平均数等于,,,,的平均数
C.,,,的中位数等于,,,,的中位数
D.,,,的标准差大于,,,,的标准差
16.(多选题)(25-26高一下·全国·单元测试)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下,一定符合该标志的是( )
甲地:中位数为2,极差为5;乙地:总体平均数为2,众数为2;
丙地:总体平均数为1,总体方差大于0;丁地:总体平均数为2,总体方差为3.
A.甲地 B.乙地 C.丙地 D.丁地
17.(24-25高一下·山东烟台·月考)现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数和第25百分位数;
(2)在这100名候选者用分层随机抽样的方法从第四组和第五组面试者内抽取10人,再从这10名面试者中随机抽取两名,求两名面试者成绩都在第五组的概率.
(3)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平均数和方差分别为80和70,据此估计这次第二组和第四组所有面试者的面试成绩的方差.
18.(25-26高一下·河南南阳·月考)为了解学生对A,B两家餐厅的满意度情况,现从在A,B两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中B餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较A,B两家餐厅满意指数的平均数的大小;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若B餐厅满意指数频率分布直方图中第三组满意指数的方差为2,第四组满意指数的方差为1,估计在B餐厅用过餐的第三组与第四组所有学生的满意指数的方差.(计算平均数时同一组中的数据用该组区间的中点值作代表)
附:若数据的平均数为,方差为,数据的平均数为,方差为,将这两组数据混合在一起得到一组新数据,设新数据的平均数为,则新数据的方差.
19.(24-25高一下·广东广州·期末)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当时,求与;
(2)设函数,当时,求的解析式,并求在区间上的最小值.
1 / 3
学科网(北京)股份有限公司
$