内容正文:
专题04 用样本估计总体的数字特征
教学目标
1.通过实例了解样本的数字特征
2.理解样本的数字特征从不同角度反映数据特点
3.会求样本的有关数字特征
4.体会数学数据统计的过程,培养数学运算和数据分析的学科素养
教学重难点
重点:
(1)学会计算数据的标准差
(2)用样本平均数和标准差估计总体的平均数与标准差。
难点:
(1)对总体分布概念的理解,统计思想的建立。
(2)能应用相关知识解决简单的实际问题
知识点01 平均数、众数与中位数
1. 平均数
(1)定义∶如果给定的一组数是x1,x2,…,xn,则这组数的平均数为 .
(2)特征∶平均数用来刻画一组数据的 (或中心位置)。
(3)表示∶,其中的符号""表示求和,读作“西格玛”,“ ”右边式子中的i表示求和的范围,其最小值与最大值分别写在“ ”的下面与上面。
(4)性质:如果x1,x2,…,xn,的平均数为 ,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
2.众数
(1)定义:一组数据中出现次数最多的数据值.
(2)特点:①众数不唯一,若有多个数据出现次数相同且最多,则这些数据都是众数;
②众数不受极端值影响,适用于描述数据的 “多数水平”,常用于市场调研、投票统计等场景.
3.中位数
(1)定义:将一组数据按从小到大(或从大到小)的顺序排列后,处于中间位置的数.
(2)特点:不受极端值影响,能反映数据的 “中等水平”,适合数据分布不均匀的情况.
【注意事项】
平均数会受每一个数的影响,尤其是最大值、最小值.很多情况下,为了避免过于极端的值对结果影响太大等,会去掉最小值与最大值后再计算平均数.
4.三个统计量的比较:
统计量
计算依据
受极端值影响
适用场景
平均数
所有数据
是
数据分布均匀、无极端值的情况
众数
数据出现次数
否
描述 “多数情况”,如销量最高的商品型号
中位数
数据的位置顺序
否
数据有极端值、分布不均匀的情况
【即学即练】
1.(24-25高一上·黑龙江牡丹江·开学考试)已知,是方程的两个根,则数据:4,,,7的平均数是 .
2.(24-25高一上·四川成都·开学考试)某校四个植树小队,在植树节这天种下柏树的棵数分别为,若这组数据的中位数和平均数相等,那么 .
3.(24-23高一上·全国·单元测试)为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为,众数为,平均数为,则的大小关系是 .
知识点02 方差与标准差
1.方差
(1)定义∶如果x1,x2,…,xn,的平均数为,则方差可用求和符号表示为
.
(2)性质∶如果a,b为常数(a=0),则ax1+b,ax2+b,...,axn+b的方差为 .
2.标准差
(1)定义∶方差的 称为标准差.一般用s表示,即样本数据x1,x2,…,xn,的标准差为
(2)性质∶如果a,b为常数,则ax1+b,ax2+b,...,axn+b的标准差为 .
(3)如果一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没有离散性;若各数的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高,因此标准差(或方差)描述了数据相对于平均数的离散程度.
【即学即练】
1.(24-25高二上·河南·阶段练习)已知退休的王大爷连续天户外运动的步数(单位:百步)分别为,,,,,则该组数据的均值与方差分别为( )
A., B., C., D.,
2.(24-25高二上·湖南·开学考试)样本数据:48,49,50,50,50,50,51,52的方差为( )
A.1 B.1.25 C.2.5 D.4
知识点03 分层抽样的平均数
1.定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的平均数为,设上述两层构成的新样本中每层的平均数分别为 和于是,
.
记,,,称为权重,则+
2.推广:设样本中不同层的平均数和相应权重分别为,,…和,,…则这个样本的平均数为
为了简化表示,引进求和符号,记作
【即学即练】
1.(24-25高二上·湖南·阶段练习)已知总体划分为3层,按比例用分层随机抽样法抽样,各层的样本量及样本平均数如下表:
分层
样本量
样本平均数
第一层
10
55
第二层
30
75
第三层
10
90
估计总体平均数为( )
A.73 B.74 C.76 D.80
2.(25-26高一上·全国·课后作业)据统计某种疾病老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院这种疾病的平均治愈率是( )
A.86% B.83% C.90% D.84%
知识点04 分层抽样的方差
1.定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的方差为,设
上述两层构成的新样本中每层的方差分别为,,于是, .
记,,,称为权重,则[+]+[+]
2.推广:设样本中不同层的方差和相应权重,及平均数分别为,,…和,,…,,,…则这个样本的方差为 [+]+[+]+[+]为了简化表示,引进求和符号,记作
【即学即练】
1.(23-24高一下·浙江杭州·期末)在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的方差为 .
2.(23-24高一下·江苏常州·期末)设x,y,z都是正整数,且,,,当x,y,z的取值依次为 时,x,y,z这三个数的方差最小.(若存在多组取值符合条件,只需写出其中一组取值)
知识点05 百分位数
1.中位数定义:如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,xn,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称 为这组数的中位数.
【注意事项】
优点∶①不受少数几个极端数据的影响。
②易计算,便于利用中间数据的信息。
缺点:对极端值不敏感。
2.百分位数:一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值∶至少有p%的数据不大于该值,且至少有(100- p)%的数据不小于该值.直观来说,一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
3.步骤:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的 ,取Xi0为p%分位数;如果i是整数,取 为p%分位数.特别地,规定∶0分位数是x(即最小值),100%分位数是xn(即最大值).
【注意事项】
(1)中位数就是一个 50%分位数.
(2)按照定义可知,p%分位数可能不唯一,也正因为如此,各种统计软件所得出的
p%分位数可能会有差异.
(3)实际应用中,除了中位数外,经常使用的是 25%分位数(简称为第一四分位数)与75%分位数(简称为第三四分位数).
【即学即练】
1.(2024·四川南充·一模)甲同学近10次数学考试成绩情况如下:103,106,113,119,123,118,134,118,125,121,则甲同学数学考试成绩的第75百分位数是( )
A.118 B.121 C.122 D.123
2.(23-24高二下·内蒙古·期末)从一批棉花中随机抽测了8根棉花的纤维长度(单位:mm),其数据为88,89,76,101,121,89,90,90,则该组数据的第60百分位数为( )
A.89 B.90 C.89.5 D.101
题型01 平均数与众数
【典例1-1】(24-25高一下·湖北武汉·期末)立德中学某次课外定点投篮比赛中,登记的9个数据的平均数为8,其中.后来发现应该为10,并且漏登记了一个数据15,则修正后的10个数据的平均数为 .
【典例1-2】(24-25高一下·天津河东·期末)中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计.将所得到的有关数据绘制成频率分布直方图,如图所示.则这400名学生视力的众数为
1.平均数与每一个样本数据都有关,受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据,平均数对总体估计的可靠性较差,这时往往用众数或中位数去估计总体,有时也采用剔除最大值与最小值后所得的平均数去估计总体.
2.确定众数的关键是统计各数据出现的频数,频数最大的数据就是众数,当一组数据中有不少数据多次重复出现时,众数往往更能反映数据的集中趋势.
【变式1-1】(24-25高一上·全国·课后作业)已知一组数据4,,,5,6的平均数为4,则a的值是( )
A.3 B.2 C.4 D.6
【变式1-2】(24-25高一上·四川成都·开学考试)一组数据2,3,x,5,7的平均数是4,则这组数据的众数是 .
【变式1-3】(24-25高一上·黑龙江牡丹江·开学考试)已知,是方程的两个根,则数据:4,,,7的平均数是 .
【变式1-4】(23-24高一下·山东聊城·阶段练习)已知数据的平均数为,则数据的平均数为 .
题型02 方差、标准差的意义与计算
【典例2】(24-25高一上·四川雅安·开学考试)已知一组数据8,5,x,8,10的平均数是8,以下说法错误的是( )
A.极差是5 B.众数是8 C.中位数是9 D.方差是2.8
标准差与方差的统计意义
(1)标准差(方差)的取值范围是[0,+oo)(标准差的大小不会超过极差).
(2)标准差(方差)描述了一组数据相对于平均数离散程度的大小.
【变式2-1】(24-25高一上·山东·开学考试)为了解家里每月的用水量情况,小明收集并记录了家里连续6个月的用水量,分别是(单位:吨),关于这几个数据的说法,下列结论中正确的是( )
A.平均数是5 B.众数是6 C.中位数是5 D.方差是
【变式2-2】(23-24高三上·山西·阶段练习)已知一组正数的方差为,则另一组数据,的平均数为( )
A.4 B.5 C.6 D.7
【变式2-3】(多选)(24-25高一上·湖南株洲·开学考试)如图,下列是国家统计局公布的数据,下列关于这组数据的说法正确的是( )
A.众数是2.1 B.中位数是1.6
C.平均数是2.08 D.方差大于1
题型03 中位数、百分位数
【典例3-1】(24-25高三上·广东·阶段练习)样本数据,,,,,,,,,的平均数和第百分位数分别为( )
A., B., C., D.,
【典例3-2】(15-16高二上·江西赣州·期中)200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的中位数的估计值分别为 .
【典例3-3】(25-26高三上·四川内江·月考)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.评分在的人数约为20
C.估计评分的第25百分位数为65
D.估计评分的平均数为76.5
1.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.频率分布直方图中的数字特征
(1)众数:样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
【变式3-1】(24-25高三上·安徽阜阳·期末)将某大型出版公司所有打字员每分钟的平均打字数统计如图所示,则可以估计该公司打字员每分钟的平均打字数的中位数为 .
【变式3-2】(25-26高二上·云南曲靖·月考)从小到大排列的一组数据:,若这组数据的第50百分位数与平均数相同,则的值为( )
A.98 B.104 C.106 D.108
【变式3-3】(25-26高三上·四川内江·月考)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.评分在的人数约为20
C.估计评分的第25百分位数为65
D.估计评分的平均数为76.5
题型04 分层抽样的平均数与方差
【典例4】(2025·重庆·模拟预测)某动漫社团为了调查本校学生对新上映电影的喜好程度, 对该校学生进行了满意度调查, 其中男生共调查了 600 人,女生共调查了 400 人,男生平均给分 4 分,方差为 1 ,女生平均给分 3 分,方差也为 1 . 则调研对象总体方差为( )
A. B. C. D.
计算分层随机抽样的方差的步骤(以分两层抽样的情况为例)
第一步:确定,,,;
第二步:确定;
第三步:应用公式s2=[+]+[+],计算s2.
【变式4-1】(25-26高三上·云南昆明·期中)已知样本,,,,的平均数为12,样本,,,的平均数为16,则样本,,,,,,,,的平均数为( )
A.13.5 B.14 C.14.5 D.15
【变式4-2】(24-25高二上·湖北·阶段练习)在对某高中1500名高二年级学生的百米成绩的调查中,采用按学生性别比例分配的分层随机抽样抽取100人,已知这1500名高二年级学生中男生有900人,且抽取的样本中男生成绩的平均数和方差分别为13.2秒和13.36,女生成绩的平均数和方差分别为15.2秒和17.56.
(1)求抽取的总样本的平均数;
(2)试估计高二年级全体学生的百米成绩的方差.
【变式4-3】(24-25高一下·黑龙江大庆·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者,我市为提高市民对文明城市建设的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)若从成绩位于区间[80,90)和[90,100]的答卷中,采用分层随机抽样,抽取7份,再从这7份中随机抽取两份,求这两份答卷的成绩都落在[80,90)的概率;
(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差
题型05 用方差、标准差说明数据的波动程度
【典例5】(24-25高一上·四川成都·开学考试)甲、乙两人各射击次,甲所中的环数是,,,,,,且甲所中的环数的平均数是,众数是;乙所中的环数的平均数是,方差是4.根据以上数据,对甲,乙射击成绩的正确判断是( )
A.甲射击成绩比乙稳定 B.乙射击成绩比甲稳定
C.甲,乙射击成绩稳定性相同 D.甲、乙射击成绩稳定性无法比较
利用样本的方差、标准差解决优化决策问题的依据
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定;
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【变式5-1】(2025高二上·山东临沂·学业考试)甲、乙、丙、丁四名运动员参加射击项目选拔赛,每人10次射击成绩的平均数(单位:环)和方差如下表所示:
甲
乙
丙
丁
9
9
9.5
9.5
0.25
1
0.65
0.25
根据表中数据,若从中选择一名成绩好且发挥稳定的运动员参加比赛,则应该选( )
A.甲 B.乙 C.丙 D.丁
【变式5-2】(24-25高二上·吉林·开学考试)有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
设甲、乙两名运动员射击平均环数分别记为和,方差分别记为和.
(1)求,,,;
(2)如果你是教练,你如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
一、单选题
1.(25-26高三上·上海浦东新·期末)某班一次数学小测验(百分制)后,老师为了奖励同学们平时认真学习,决定给每位同学的成绩加上5分作为过程性评价奖励.加分后,与原始分数相比,不会发生改变的是( )
A.平均数 B.中位数 C.第80百分位数 D.方差
2.(2025高二上·山东枣庄·学业考试)如图是某地100户居民的月均用水量的频率分布直方图,估计众数与中位数分别是( )
A. B. C. D.
3.(24-25高一上·四川南充·开学考试)“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )
A.24,25 B.23,23
C.23,24 D.24,24
4.(2025·陕西西安·模拟预测)在从小到大依次排列的样本数据、、、、、中,已知中位数小于众数,则该组样本数据的平均数为( )
A. B. C. D.
5.(25-26高二上·北京海淀·月考)两位射击运动员在射击测试中各射靶10次,每次命中的环数如下:
甲
7
9
7
8
5
4
9
10
7
4
乙
8
5
7
8
7
6
10
6
7
7
用,分别表示甲、乙两名运动员10次射击成绩的平均数,用,分别表示甲、乙两名运动员10次射击成绩的标准差,则有( )
A., B.,
C., D.,
6.(25-26高三上·江苏·期中)在高三某次调研考试时,某学习小组对本组6名同学的考试成绩进行统计,其中数学试卷上有一道满分为15分的解答题,6名同学的得分按从低到高的顺序依次为,若该组数据的中位数等于这组数据的极差,则该组数据的上四分位数是( )
A.6 B.8 C.9 D.10
7.(25-26高三上·天津·月考)在一次科普知识竞赛中共有200名同学参赛,经过评判,这200名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论错误的是( )
A.可求得 B.这200名参赛者得分的中位数为64
C.得分在之间的频率为 D.得分在之间的共有80人
8.(25-26高二上·四川成都·期中)在去年的足球联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1,全年失球个数的标准差是0.4,下列说法错误的是( )
A.平均来说一队比二队防守技术好 B.二队比一队技术水平更稳定
C.一队在防守中有时表现差,有时又表现非常好
D.二队很少失球
二、多选题
9.(25-26高二上·江苏南京·月考)甲、乙两城市某月初连续7天的日均气温数据如下图,根据这7天的数据,则下列说法正确的是( )
A.乙城市日均气温的极差为
B.乙城市日均气温的众数为
C.甲城市日均气温的中位数与平均数相等
D.甲城市的日均气温比乙城市的日均气温稳定
10.(25-26高一上·全国·课后作业)为倡导健康生活方式,某大学社团联合学生会倡议全校学生参与“每日万步行”健走活动.如图为该校甲、乙两名同学在同一星期内每日步数的折线统计图,则下列说法正确的是( )
A.这一星期内甲的日步数的中位数小于乙的日步数的中位数
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的标准差小于甲的日步数的标准差
D.这一星期内乙的日步数的第75百分位数是12400
11.(2025·四川内江·一模)在一次考试中,5位同学的成绩均为正整数,中位数为70,唯一的众数为80,极差为15,则( )
A.该组数据的最小值为65 B.该组数据的平均值大于73
C.该组数据的第60百分位数为75 D.该组数据的方差不超过46
三、填空题
12.(24-25高一上·四川成都·开学考试)已知一组数据、、、、、的中位数是,则的值是 .
13.(24-25高一上·四川成都·开学考试)实施素质教育以来,某中学立足于学生的终身发展,大力开发课程资源,在七年级设立六个课外学习小组,下面是七年级学生参加六个学习小组的统计表和扇形统计图,请你根据图表中提供的信息回答下列问题.
学习小组
体育
美术
科技
音乐
写作
奥数
人数
72
36
54
18
(1)七年级共有学生 人;
(2)在表格中的空格处填上相应的数字 ; ; ;
(3)表格中所提供的六个数据的中位数是 ;
(4)众数是 .
14.(2025高一上·辽宁沈阳·专题练习)已知甲、乙两组按顺序排列的数据:甲组:27,28,37,,40,50;乙组:24,,34,43,48,52;若这两组数据的第30百分位数、第50百分位数分别对应相等,则等于 .
四、解答题
15.(25-26高三上·江西上饶·月考)黄金是国家经济的储备基石,受国际形势等因素的影响,金价往往不太稳定,但总体趋势逐渐上涨.下表为五个月的国际金价的变化(为美元):
月份
5月
6月
7月
8月
9月
价格/盎司
记这组数据的平均数为,方差为,定义.
(1)求;
(2)若,则称该组数据具有高检验水准,反之则称该组数据不具有高检验水准.判断该组数据是否具有高检验水准,并证明.
16.(25-26高三上·湖南衡阳·月考)衡阳县第一中学为预备2026年的全国高中数学联赛预赛,在该校先选取了前60名的学生(含60名),进行选拔,随后根据分数线选取参赛选手,该60名学生的成绩的频率分布直方图如下,数据的分组依次是(本场选拔总分为100分).
(1)估计该一中学生选拔成绩的平均值(提示:同一组中的数据用该组区间的中点值为代表)
(2)这次选拔测试成绩的第60百分位数可估计为?
(3)若学校定75分为标准选拔分数线,则参赛人数大约为?
17.(25-26高一上·辽宁沈阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第75百分位数;
(2)求样本成绩的中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
18.(2025·上海闵行·一模)小闵同学某一天进行了10次100米短跑集训,其中上午进行了6次,下午进行了4次;如下是他上午集训6次的成绩(单位:s):、、、、、.
(1)求这6次成绩的中位数;
(2)参考这一天上午集训的数据,用经验概率估计概率,求该同学训练100米短跑3次至少有一次用时小于13s的概率;
(3)若该同学下午4次的集训原始成绩记录丢失,但记得这4次的平均成绩是14.25s,方差是0.75,求他这一天10次训练成绩的平均值和方差.
19.(2026高三·全国·专题练习)已知A,B两家公司的员工月均工资(单位:万元)情况分别如图1,图2所示:
(1)以每组数据的区间中点值为代表,根据图1估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平?请说明理由;
(2)小明拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,他应该选哪个公司?
27 / 28
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题04 用样本估计总体的数字特征
教学目标
1.通过实例了解样本的数字特征
2.理解样本的数字特征从不同角度反映数据特点
3.会求样本的有关数字特征
4.体会数学数据统计的过程,培养数学运算和数据分析的学科素养
教学重难点
重点:
(1)学会计算数据的标准差
(2)用样本平均数和标准差估计总体的平均数与标准差。
难点:
(1)对总体分布概念的理解,统计思想的建立。
(2)能应用相关知识解决简单的实际问题
知识点01 平均数、众数与中位数
1. 平均数
(1)定义∶如果给定的一组数是x1,x2,…,xn,则这组数的平均数为。
(2)特征∶平均数用来刻画一组数据的平均水平(或中心位置)。
(3)表示∶,其中的符号""表示求和,读作“西格玛”,“ ”右边式子中的i表示求和的范围,其最小值与最大值分别写在“ ”的下面与上面。
(4)性质:如果x1,x2,…,xn,的平均数为 ,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
2.众数
(1)定义:一组数据中出现次数最多的数据值.
(2)特点:①众数不唯一,若有多个数据出现次数相同且最多,则这些数据都是众数;
②众数不受极端值影响,适用于描述数据的 “多数水平”,常用于市场调研、投票统计等场景.
3.中位数
(1)定义:将一组数据按从小到大(或从大到小)的顺序排列后,处于中间位置的数.
(2)特点:不受极端值影响,能反映数据的 “中等水平”,适合数据分布不均匀的情况.
【注意事项】
平均数会受每一个数的影响,尤其是最大值、最小值.很多情况下,为了避免过于极端的值对结果影响太大等,会去掉最小值与最大值后再计算平均数.
4.三个统计量的比较:
统计量
计算依据
受极端值影响
适用场景
平均数
所有数据
是
数据分布均匀、无极端值的情况
众数
数据出现次数
否
描述 “多数情况”,如销量最高的商品型号
中位数
数据的位置顺序
否
数据有极端值、分布不均匀的情况
【即学即练】
1.(24-25高一上·黑龙江牡丹江·开学考试)已知,是方程的两个根,则数据:4,,,7的平均数是 .
【答案】
【分析】先根据韦达定理求出,再根据平均数的求法即可求解.
【详解】解:,是方程的两个根,
,
则,
即4,,,7的平均数是.
2.(24-25高一上·四川成都·开学考试)某校四个植树小队,在植树节这天种下柏树的棵数分别为,若这组数据的中位数和平均数相等,那么 .
【答案】或
【分析】利用平均数,中位数的性质结合分类讨论求解即可.
【详解】当时,将数据进行排列,得到,
因为这组数据的中位数和平均数相等,所以,解得,
当时,将数据进行排列,得到,
因为这组数据的中位数和平均数相等,所以,
解得,与范围不符,故排除
当时,将数据进行排列,得到,
因为这组数据的中位数和平均数相等,所以,
解得,经检验,和均符合题意.
故答案为:或.
3.(22-23高一上·全国·单元测试)为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为,众数为,平均数为,则的大小关系是 .
【答案】
【知识点】计算几个数的众数、计算几个数的中位数、计算几个数的平均数
【分析】根据题意求中位数、众数和平均数,进而可对结果.
【详解】由条形统计图可知,30名学生的得分为
得分
3
4
5
6
7
8
9
10
频数
2
3
10
6
3
2
2
2
因为中位数为第15,16个数(分别为5,6)的平均数,所以,
且5出现次数最多,故,
平均数,
因为,即.
故答案为:.
知识点02 方差与标准差
1.方差
(1)定义∶如果x1,x2,…,xn,的平均数为,则方差可用求和符号表示为
=
(2)性质∶如果a,b为常数(a=0),则ax1+b,ax2+b,...,axn+b的方差为a2s2.
2.标准差
(1)定义∶方差的算术平方根称为标准差.一般用s表示,即样本数据x1,x2,…,xn,的标准差为
(2)性质∶如果a,b为常数,则ax1+b,ax2+b,...,axn+b的标准差为|a|s
(3)如果一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没有离散性;若各数的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高,因此标准差(或方差)描述了数据相对于平均数的离散程度.
【即学即练】
1.(24-25高二上·河南·阶段练习)已知退休的王大爷连续天户外运动的步数(单位:百步)分别为,,,,,则该组数据的均值与方差分别为( )
A., B., C., D.,
【答案】A
【分析】根据平均值和方差的计算公式,可得答案.
【详解】均值:,
方差:.
故选:A.
2.(24-25高二上·湖南·开学考试)样本数据:48,49,50,50,50,50,51,52的方差为( )
A.1 B.1.25 C.2.5 D.4
【答案】B
【分析】先求出数据的平均值,由方差公式计算方差.
【详解】样本数据的平均数,
方差.
故选:B.
知识点03 分层抽样的平均数
1.定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的平均数为,设上述两层构成的新样本中每层的平均数分别为 和于是,
=+=+
记,,,称为权重,则+
2.推广:设样本中不同层的平均数和相应权重分别为,,…和,,…则这个样本的平均数为 +…为了简化表示,引进求和符号,记作
【即学即练】
1.(24-25高二上·湖南·阶段练习)已知总体划分为3层,按比例用分层随机抽样法抽样,各层的样本量及样本平均数如下表:
分层
样本量
样本平均数
第一层
10
55
第二层
30
75
第三层
10
90
估计总体平均数为( )
A.73 B.74 C.76 D.80
【答案】B
【分析】利用分层抽样的平均数公式,列式计算即得.
【详解】依题意,估计总体平均数为.
故选:B
2.(25-26高一上·全国·课后作业)据统计某种疾病老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院这种疾病的平均治愈率是( )
A.86% B.83% C.90% D.84%
【答案】D
【分析】利用加权平均数可得答案.
【详解】由加权平均数公式得
.
故选:D.
知识点04 分层抽样的方差
1.定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的方差为,设
上述两层构成的新样本中每层的方差分别为,,于是,[+]+[+],
记,,,称为权重,则[+]+[+]
2.推广:设样本中不同层的方差和相应权重,及平均数分别为,,…和,,…,,,…则这个样本的方差为 [+]+[+]+[+]为了简化表示,引进求和符号,记作
【即学即练】
1.(23-24高一下·浙江杭州·期末)在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的方差为 .
【答案】37
【分析】按男女生比例抽取样本,结合相应公式计算均值和方差即可.
【详解】由题意知,
总样本的平均数为,
总样本的方差为.
故答案为:37
2.(23-24高一下·江苏常州·期末)设x,y,z都是正整数,且,,,当x,y,z的取值依次为 时,x,y,z这三个数的方差最小.(若存在多组取值符合条件,只需写出其中一组取值)
【答案】(或)
【分析】根据方差定义计算方差,再由方差最小,确定后转化为关于的二次函数,利用二次函数求最小值即可得解.
【详解】设,
则
,
要使方差最小,三个数据应尽量靠近,故,
则,
关于的二次函数的对称轴为,又且为正整数,
所以当或时,方差最小,最小值为.
故满足条件的为或.
故答案为:(或).
知识点05 百分位数
1.中位数定义:如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,xn,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
【注意事项】
优点∶①不受少数几个极端数据的影响。
②易计算,便于利用中间数据的信息。
缺点:对极端值不敏感。
2.百分位数:一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值∶至少有p%的数据不大于该值,且至少有(100- p)%的数据不小于该值.直观来说,一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
3.步骤:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取Xi0为p%分位数;如果i是整数,取为p%分位数.特别地,规定∶0分位数是x(即最小值),100%分位数是xn(即最大值).
【注意事项】
(1)中位数就是一个 50%分位数.
(2)按照定义可知,p%分位数可能不唯一,也正因为如此,各种统计软件所得出的
p%分位数可能会有差异.
(3)实际应用中,除了中位数外,经常使用的是 25%分位数(简称为第一四分位数)与75%分位数(简称为第三四分位数).
【即学即练】
1.(2024·四川南充·一模)甲同学近10次数学考试成绩情况如下:103,106,113,119,123,118,134,118,125,121,则甲同学数学考试成绩的第75百分位数是( )
A.118 B.121 C.122 D.123
【答案】D
【分析】根据百分位数的定义计算.
【详解】已知数据按从小到大排列为:,
,因此第75百分位数是第8个数123.
故选:D.
2.(23-24高二下·内蒙古·期末)从一批棉花中随机抽测了8根棉花的纤维长度(单位:mm),其数据为88,89,76,101,121,89,90,90,则该组数据的第60百分位数为( )
A.89 B.90 C.89.5 D.101
【答案】B
【分析】将这组数据从小到大排列后借助百分位数定义计算即可得.
【详解】将该组数据从小到大排列:
76,88,89,89,90,90,101,121,
由,故该组数据的第60百分位数为.
故选:B.
题型01 平均数与众数
【典例1-1】(24-25高一下·湖北武汉·期末)立德中学某次课外定点投篮比赛中,登记的9个数据的平均数为8,其中.后来发现应该为10,并且漏登记了一个数据15,则修正后的10个数据的平均数为 .
【答案】9
【分析】求出修正后的10个数据的和,进而求出平均数.
【详解】修正后的10个数据的和为,
修正后的10个数据的平均数为.
【典例1-2】(24-25高一下·天津河东·期末)中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计.将所得到的有关数据绘制成频率分布直方图,如图所示.则这400名学生视力的众数为
【答案】/
【分析】根据频率分布直方图中众数的求法求解即可.
【详解】由图可知,众数为.
故答案为:.
1.平均数与每一个样本数据都有关,受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据,平均数对总体估计的可靠性较差,这时往往用众数或中位数去估计总体,有时也采用剔除最大值与最小值后所得的平均数去估计总体.
2.确定众数的关键是统计各数据出现的频数,频数最大的数据就是众数,当一组数据中有不少数据多次重复出现时,众数往往更能反映数据的集中趋势.
【变式1-1】(24-25高一上·全国·课后作业)已知一组数据4,,,5,6的平均数为4,则a的值是( )
A.3 B.2 C.4 D.6
【答案】B
【分析】根据平均数定义列出等量关系式即可计算得解.
【详解】由题得,故.
故选:B.
【变式1-2】(24-25高一上·四川成都·开学考试)一组数据2,3,x,5,7的平均数是4,则这组数据的众数是 .
【答案】3
【分析】根据平均数得到方程,求出,从而求出众数.
【详解】∵一组数据2,3,x,5,7的平均数是4,
∴,解得,
由于3出现了2次,其他数据均出现1次,
∴这组数据的众数是3
故答案为:3
【变式1-3】(24-25高一上·黑龙江牡丹江·开学考试)已知,是方程的两个根,则数据:4,,,7的平均数是 .
【答案】
【分析】先根据韦达定理求出,再根据平均数的求法即可求解.
【详解】解:,是方程的两个根,
,
则,
即4,,,7的平均数是.
故答案为:.
【变式1-4】(23-24高一下·山东聊城·阶段练习)已知数据的平均数为,则数据的平均数为 .
【答案】
【分析】由平均数的计算公式及性质求解即可.
【详解】由于的平均数为=5,
所以的平均数为.
题型02 方差、标准差的意义与计算
【典例2】(24-25高一上·四川雅安·开学考试)已知一组数据8,5,x,8,10的平均数是8,以下说法错误的是( )
A.极差是5 B.众数是8 C.中位数是9 D.方差是2.8
【答案】C
【分析】根据平均数解得,将数据按升序排列,根据极差、众数、中位数和方差逐项分析判断.
【详解】由题意可知:,解得,
将数据按升序排列可得:5,8,8,9,10,则有:
极差为,故A正确;
众数是8,故B正确;
中位数为8,故C错误;
方差为,故D正确;
故选:C.
标准差与方差的统计意义
(1)标准差(方差)的取值范围是[0,+oo)(标准差的大小不会超过极差).
(2)标准差(方差)描述了一组数据相对于平均数离散程度的大小.
【变式2-1】(24-25高一上·山东·开学考试)为了解家里每月的用水量情况,小明收集并记录了家里连续6个月的用水量,分别是(单位:吨),关于这几个数据的说法,下列结论中正确的是( )
A.平均数是5 B.众数是6 C.中位数是5 D.方差是
【答案】D
【分析】将这组数据重新排列,再根据平均数、众数、中位数及方差的定义求解即可.
【详解】将这组数据重新排列为2、3、4、4、5、6,
∴这组数据的平均数为,
众数为4,
中位数为=,
方差为,
故选项A、B、C不符合题意,选项D符合题意.
故选:D.
【变式2-2】(23-24高三上·山西·阶段练习)已知一组正数的方差为,则另一组数据,的平均数为( )
A.4 B.5 C.6 D.7
【答案】B
【分析】根据题意,求得,结合数据平均数的性质,即可求解.
【详解】由,
可得且,所以,
故数据的平均数为.
故选:B.
【变式2-3】(多选)(24-25高一上·湖南株洲·开学考试)如图,下列是国家统计局公布的数据,下列关于这组数据的说法正确的是( )
A.众数是2.1 B.中位数是1.6
C.平均数是2.08 D.方差大于1
【答案】AC
【分析】根据平均数,众数,中位数以及方差的计算公式,分别对每一项进行分析计算即可得解.
【详解】对A:因为2.1出现了2次,出现的次数最多,所以众数数是2.1,故A正确;
对B:把这些数从小到大排列为:,中位数是2.1,故B错误;
对C:平均数是:,故C正确;
对D:,故D错误.
故选:AC.
题型03 中位数、百分位数
【典例3-1】(24-25高三上·广东·阶段练习)样本数据,,,,,,,,,的平均数和第百分位数分别为( )
A., B., C., D.,
【答案】B
【分析】根据给定条件,求出样本数据的平均数和第百分位数判断即可.
【详解】样本数据的平均数,
由,得样本数据的第百分位数为.
故选:B
【典例3-2】(15-16高二上·江西赣州·期中)200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的中位数的估计值分别为 .
【答案】/
【分析】先计算面积确定中位数所在的区间,再利用公式求出中位数.
【详解】前两个矩形的面积为,
前三个矩形的面积为,
所以中位数在区间,设中位数为,
由题得,解之得.
∴中位数的估计值为.
【典例3-3】(25-26高三上·四川内江·月考)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.评分在的人数约为20
C.估计评分的第25百分位数为65
D.估计评分的平均数为76.5
【答案】C
【分析】利用频率和为1求出判断A;利用频率求出频数判断B;求出下四分位数判断C;求出评分的平均数判断D.
【详解】对于A,由,得,故A正确;
对于B,评分在的频率为,评分在的人数约为,故B正确;
对于C,评分在的频率为,评分在的频率为,
则评分的第25百分位数在内,由,解得,故C错误;
对于D,评分的平均数,故D正确.
故选:C.
1.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.频率分布直方图中的数字特征
(1)众数:样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
【变式3-1】(24-25高三上·安徽阜阳·期末)将某大型出版公司所有打字员每分钟的平均打字数统计如图所示,则可以估计该公司打字员每分钟的平均打字数的中位数为 .
【答案】360
【知识点】由频率分布直方图估计中位数
【分析】由中位数的概念结合面积即可求解;
【详解】第一个矩形面积为,
第二个矩形面积为:,
前两个个面积和为:,
第三个矩形面积为:,
所以中位数为:,
【变式3-2】(25-26高二上·云南曲靖·月考)从小到大排列的一组数据:,若这组数据的第50百分位数与平均数相同,则的值为( )
A.98 B.104 C.106 D.108
【答案】B
【分析】求出第50百分位数和平均数,由第50百分位数和平均数相等得到的等式计算求解.
【详解】共6个数,第50百分位数是,
平均数为,
这组数据的第50百分位数与平均数相同,
,
.
故选:B.
【变式3-3】(25-26高三上·四川内江·月考)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.评分在的人数约为20
C.估计评分的第25百分位数为65
D.估计评分的平均数为76.5
【答案】C
【分析】利用频率和为1求出判断A;利用频率求出频数判断B;求出下四分位数判断C;求出评分的平均数判断D.
【详解】对于A,由,得,故A正确;
对于B,评分在的频率为,评分在的人数约为,故B正确;
对于C,评分在的频率为,评分在的频率为,
则评分的第25百分位数在内,由,解得,故C错误;
对于D,评分的平均数,故D正确.
故选:C.
题型04 分层抽样的平均数与方差
【典例4】(2025·重庆·模拟预测)某动漫社团为了调查本校学生对新上映电影的喜好程度, 对该校学生进行了满意度调查, 其中男生共调查了 600 人,女生共调查了 400 人,男生平均给分 4 分,方差为 1 ,女生平均给分 3 分,方差也为 1 . 则调研对象总体方差为( )
A. B. C. D.
【答案】D
【分析】根据分层平均数求出总体平均数,然后根据分层方差和总体方差的关系求解可得.
【详解】记男生平均给分为,方差为,女生平均给分为,方差为,
则,
所以总体平均数,
所以总体方差为.
故选:D
计算分层随机抽样的方差的步骤(以分两层抽样的情况为例)
第一步:确定,,,;
第二步:确定;
第三步:应用公式s2=[+]+[+],计算s2.
【变式4-1】(25-26高三上·云南昆明·期中)已知样本,,,,的平均数为12,样本,,,的平均数为16,则样本,,,,,,,,的平均数为( )
A.13.5 B.14 C.14.5 D.15
【答案】D
【分析】由平均数的计算公式求解即可.
【详解】由题知:样本,,,,的平均数为12,
故++++;
样本,,,的平均数为16,
故+++;
所以样本,,,,,,,,的平均数为:
++++++++,
故选:D.
【变式4-2】(24-25高二上·湖北·阶段练习)在对某高中1500名高二年级学生的百米成绩的调查中,采用按学生性别比例分配的分层随机抽样抽取100人,已知这1500名高二年级学生中男生有900人,且抽取的样本中男生成绩的平均数和方差分别为13.2秒和13.36,女生成绩的平均数和方差分别为15.2秒和17.56.
(1)求抽取的总样本的平均数;
(2)试估计高二年级全体学生的百米成绩的方差.
【答案】(1)14
(2)16
【分析】(1)先确定样本中男生、女生的人数,再求总样本的平均数.
(2)根据方差的概念,计算总样本的方差.
【详解】(1)样本中男生的人数为:;女生的人数为:.
所以总样本的平均数为:.
(2)记总样本的方差为,
则 .
所以,估计高二年级全体学生的百米成绩的方差为16.
【变式4-3】(24-25高一下·黑龙江大庆·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者,我市为提高市民对文明城市建设的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)若从成绩位于区间[80,90)和[90,100]的答卷中,采用分层随机抽样,抽取7份,再从这7份中随机抽取两份,求这两份答卷的成绩都落在[80,90)的概率;
(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差
【答案】(1)
(2)
(3),
【分析】(1)根据频率之和为1求的值.
(2)根据分层抽样的概念,古典概型概率公式求解即可.
(3)根据加权平均数与方差公式计算即可.
【详解】(1)由题意,解得:.
(2)由题可知,成绩在区间的频数为:;
成绩在区间的频数为:.
利用分层抽样,从中抽取7份,成绩在的频数为,成绩在的频数为.
再从这7份答卷中随机抽取两份,这两份答卷的成绩都落在的概率为:.
(3)因为落在与的频率比为,
所以,.
题型05 用方差、标准差说明数据的波动程度
【典例5】(24-25高一上·四川成都·开学考试)甲、乙两人各射击次,甲所中的环数是,,,,,,且甲所中的环数的平均数是,众数是;乙所中的环数的平均数是,方差是4.根据以上数据,对甲,乙射击成绩的正确判断是( )
A.甲射击成绩比乙稳定 B.乙射击成绩比甲稳定
C.甲,乙射击成绩稳定性相同 D.甲、乙射击成绩稳定性无法比较
【答案】B
【分析】甲所中的环数的平均数是,众数是,则可以得到a,b,c三个数其中一个是2,另两个数是8,求得则甲的方差,再进行比较得出结果.
【详解】∵这组数中的众数是8,
∴a,b,c中至少有两个是8,
∵平均数是6,
∴a,b,c三个数其中一个是2,
综上,甲所中环数为,
∴甲所中环数的方差,
∵,
∴乙射击成绩比甲稳定.
故选:B.
利用样本的方差、标准差解决优化决策问题的依据
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定;
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【变式5-1】(2025高二上·山东临沂·学业考试)甲、乙、丙、丁四名运动员参加射击项目选拔赛,每人10次射击成绩的平均数(单位:环)和方差如下表所示:
甲
乙
丙
丁
9
9
9.5
9.5
0.25
1
0.65
0.25
根据表中数据,若从中选择一名成绩好且发挥稳定的运动员参加比赛,则应该选( )
A.甲 B.乙 C.丙 D.丁
【答案】D
【分析】平均分越大越好,方差越小越好,结合图表即可得解.
【详解】由平均数,丙丁的平均分相等且最大;由方差,丙的方差大于丁的方差,方差越小越稳定,故应该选择丁参加比赛.
故选:D.
【变式5-2】(24-25高二上·吉林·开学考试)有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
设甲、乙两名运动员射击平均环数分别记为和,方差分别记为和.
(1)求,,,;
(2)如果你是教练,你如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
【答案】(1)7;7;4;1.2
(2)答案见解析
【分析】(1)根据平均数和方差公式计算即可;
(2)由(1)的结论,平均数一样,则通过方差判断其稳定性即可得结果.
【详解】(1),
,
,
.
(2)由(1)知,甲乙射击的平均成绩一样,但乙比甲射击的成绩更稳定,所以选择乙.
一、单选题
1.(25-26高三上·上海浦东新·期末)某班一次数学小测验(百分制)后,老师为了奖励同学们平时认真学习,决定给每位同学的成绩加上5分作为过程性评价奖励.加分后,与原始分数相比,不会发生改变的是( )
A.平均数 B.中位数 C.第80百分位数 D.方差
【答案】D
【分析】根据平均值、中位数、百分位数的概念判断ABC,根据方差性质判断D.
【详解】加分后,与原始分数相比,平均值,中位数,第80百分位数的数值都会发生改变,
但根据方差的性质,一组数据同时加上相同的数后,方差大小不变.
故选:D.
2.(2025高二上·山东枣庄·学业考试)如图是某地100户居民的月均用水量的频率分布直方图,估计众数与中位数分别是( )
A. B. C. D.
【答案】D
【分析】利用频率分布直方图,根据众数与中位数的定义列式求解即得.
【详解】由频率分布直方图可得众数为;
因中位数是频率为时对应的样本数据,由,而,
故中位数在第二组,中位数为.
故选:D.
3.(24-25高一上·四川南充·开学考试)“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )
A.24,25 B.23,23
C.23,24 D.24,24
【答案】C
【分析】把给定数据由小到大排列,再求出众数、中位数即得.
【详解】苗高由小到大排列为:,
所以这组数据的众数和中位数分别是23,24.
故选:C
4.(2025·陕西西安·模拟预测)在从小到大依次排列的样本数据、、、、、中,已知中位数小于众数,则该组样本数据的平均数为( )
A. B. C. D.
【答案】C
【分析】根据题意可知,或,结合题意可得出关于的不等式,即可得出的值,然后利用平均数公式可求得结果.
【详解】由题意可知,这组数据的中位数为,
因为该组数据存在众数,故或,则这组数据的众数为,
又这组数据的中位数小于众数,所以,解得,故,
因此,这组数据的平均数为.
故选:C.
5.(25-26高二上·北京海淀·月考)两位射击运动员在射击测试中各射靶10次,每次命中的环数如下:
甲
7
9
7
8
5
4
9
10
7
4
乙
8
5
7
8
7
6
10
6
7
7
用,分别表示甲、乙两名运动员10次射击成绩的平均数,用,分别表示甲、乙两名运动员10次射击成绩的标准差,则有( )
A., B.,
C., D.,
【答案】C
【分析】运用平均数和标准差的公式进行计算并比较即可.
【详解】,
,
,
,
显然,.
故选:C
6.(25-26高三上·江苏·期中)在高三某次调研考试时,某学习小组对本组6名同学的考试成绩进行统计,其中数学试卷上有一道满分为15分的解答题,6名同学的得分按从低到高的顺序依次为,若该组数据的中位数等于这组数据的极差,则该组数据的上四分位数是( )
A.6 B.8 C.9 D.10
【答案】D
【分析】根据中位数等于极差求出的值,再计算上四分位数即第75百分位数即可.
【详解】已知数据,,,,10,12,数据个数为偶数,所以中位数是中间两个数和的平均数,即中位数为.
极差是最大值12减去最小值,即极差为.
因为该组数据的中位数等于这组数据的极差,所以.可得:.
此时这组数据为,,,10,10,12.
计算,所以该数据的上四分位数是第个数,即10.
故选:D.
7.(25-26高三上·天津·月考)在一次科普知识竞赛中共有200名同学参赛,经过评判,这200名参赛者的得分都在之间,其得分的频率分布直方图如图,则下列结论错误的是( )
A.可求得 B.这200名参赛者得分的中位数为64
C.得分在之间的频率为 D.得分在之间的共有80人
【答案】B
【分析】根据频率分布直方图中所有小矩形面积和为1,计算即可判断A的正误;根据直方图中位数的求法,代入计算,即可判断B的正误;根据直方图中矩形面积代表频率,即频率、频数、总数的关系,即可判断C、D的正误.
【详解】选项A:由题意得,解得,故A正确;
选项B:,,
所以中位数位于内,且设为x,
则,解得,故B错误;
选项C:得分在之间的频率为,故C正确;
选项D:得分在之间的频率为,
所以得分在之间的共有人,故D正确.
故选:B
8.(25-26高二上·四川成都·期中)在去年的足球联赛上,一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1,全年失球个数的标准差是0.4,下列说法错误的是( )
A.平均来说一队比二队防守技术好 B.二队比一队技术水平更稳定
C.一队在防守中有时表现差,有时又表现非常好
D.二队很少失球
【答案】D
【分析】根据两个队伍的平均数和方差,进行比较,即可求解.
【详解】一队每场比赛平均失球个数是,二队每场比赛平均失球个数是,平均说来一队比二队防守技术好,A正确;
一队全年比赛失球个数的标准差为,二队全年比赛失球个数的标准差为,二队比一队技术水平更稳定,B正确;
因为一队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1,说明失球数波动较大,所以一队有时表现很差,有时表现又非常好,故C正确.
二队每场比赛平均失球数是2.1大于一队,全年失球个数的标准差是0.4小于一队,所以二队很少不失球,D错误.
故选:D
二、多选题
9.(25-26高二上·江苏南京·月考)甲、乙两城市某月初连续7天的日均气温数据如下图,根据这7天的数据,则下列说法正确的是( )
A.乙城市日均气温的极差为
B.乙城市日均气温的众数为
C.甲城市日均气温的中位数与平均数相等
D.甲城市的日均气温比乙城市的日均气温稳定
【答案】BC
【分析】根据极差的定义,可判定A错误;根据众数的定义,可判断B正确;根据中位数和平均数的求法,可判定C正确;根据数据的波动性,可判定D不正确.
【详解】由甲、乙两城市某月初连续7天的日均气温数据统计图表,
对于A,乙城市的最高气温为,最低气温为,所以乙城市日均气温的极差为,所以A错误;
对于B,由乙城市的日均气温的数据为,
根据众数的定义,可得数据的众数为,所以B正确;
对于C,由甲城市的日均气温的数据为:,
从小到大排列为,根据中位数的定义,数据的中位数为,
根据平均数的计算公式,可得数据的平均数为,
所以日均气温数据的中位数与平均数相等,所以C正确;
对于D,数据的稳定可通过方差来衡量,方差越小数据波动越稳定,观察图形可知,甲城市日均气温波动比乙城市大,所以乙城市的日均气温比甲城市的日均气温稳定,所以D错误.
故选:BC.
10.(25-26高一上·全国·课后作业)为倡导健康生活方式,某大学社团联合学生会倡议全校学生参与“每日万步行”健走活动.如图为该校甲、乙两名同学在同一星期内每日步数的折线统计图,则下列说法正确的是( )
A.这一星期内甲的日步数的中位数小于乙的日步数的中位数
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的标准差小于甲的日步数的标准差
D.这一星期内乙的日步数的第75百分位数是12400
【答案】BC
【分析】根据折线图得到这一星期内甲,乙的日步数,都从小到大进行排列,得到中位数后即可判断选项A;根据平均数计算公式,计算出这一星期内甲,乙的日步数的平均数,比较大小即可判断选项B;根据图象观察甲的波动程度较大,故方差较大,从而判断选项C;把乙一星期内的步数从小到大进行排列,并计算,故第六个数为所求,即可判断选项D.
【详解】由题中折线图可得甲这一星期内的日步数从小到大排列为:
11000,11800,12200,12600,13500,15400,18200,所以中位数为12600;
乙这一星期内的日步数从小到大排列为:11800,12200,12400,12600,13000,13800,14000,
所以中位数为12600.故这一星期内甲、乙的日步数的中位数都为12600,A错误;
这一星期内甲的日步数的平均数为
,
这一星期内乙的日步数的平均数为
,
因为,故B正确.
由图知,甲的波动程度较大,故方差、标准差较大,故C正确.
,则由A选项得这一星期内乙的日步数的第75百分位数是13800,故D错误.
故选:BC.
11.(2025·四川内江·一模)在一次考试中,5位同学的成绩均为正整数,中位数为70,唯一的众数为80,极差为15,则( )
A.该组数据的最小值为65 B.该组数据的平均值大于73
C.该组数据的第60百分位数为75 D.该组数据的方差不超过46
【答案】ACD
【分析】由题意设该组数据从小到大为、、、、,根据已知条件得出、、、的值,可判断A选项;利用平均数公式可判断B选项;利用百分位数的概念可判断C选项;利用方差公式可判断D选项.
【详解】由题意设该组数据从小到大为、、、、,
由题意可得,,,可得,A对;
这组数据为、、、、,则,所以,
这组数据的平均数为,B错;
对于C选项,因为,所以该数据的第百分位数为,C对;
对于D选项,当时,这组数据的平均数为,
这组数的方差为,
当时,这组数的平均数为,
这组数的方差为,
当时,这组数据的平均数为,
这组数的方差为,
当,此时这组数据的平均数为,
这组数的方差为,
因此,这组数据的方差不超过,D对.
故选:ACD
三、填空题
12.(24-25高一上·四川成都·开学考试)已知一组数据、、、、、的中位数是,则的值是 .
【答案】
【分析】先确定从小到大排列后的位置,再根据中位数的定义解答即可.
【详解】根据题意,的位置按照从小到大的排列只能是:、、、、、,
根据中位数是,得:,解得:.
故答案为:.
13.(24-25高一上·四川成都·开学考试)实施素质教育以来,某中学立足于学生的终身发展,大力开发课程资源,在七年级设立六个课外学习小组,下面是七年级学生参加六个学习小组的统计表和扇形统计图,请你根据图表中提供的信息回答下列问题.
学习小组
体育
美术
科技
音乐
写作
奥数
人数
72
36
54
18
(1)七年级共有学生 人;
(2)在表格中的空格处填上相应的数字 ; ; ;
(3)表格中所提供的六个数据的中位数是 ;
(4)众数是 .
【答案】 360; 72 108 20%; 63 72
【分析】利用给定的扇形图及频数分布表,结合统计的相关定义逐一求出各个结果.
【详解】(1)读图可知:有10%的学生即36人参加科技学习小组,
所以七年级共有学生:36÷10%=360(人).
(2)统计图中美术占:,
参加美术学习小组的有:(人),奥数小组的有360×30%=108(人);
学习小组
体育
美术
科技
音乐
写作
奥数
人数
72
72
36
54
18
108
(3)(4)将各组人数从小到大排列:18,36,54,72,72,108
所以众数是72,中位数=;
故答案为:360;72,108,20%;63,72
14.(2025高一上·辽宁沈阳·专题练习)已知甲、乙两组按顺序排列的数据:甲组:27,28,37,,40,50;乙组:24,,34,43,48,52;若这两组数据的第30百分位数、第50百分位数分别对应相等,则等于 .
【答案】/
【分析】根据百分位数的定义计算,建立关于的方程组,解之即可求解.
【详解】对于甲组数据,,
所以甲组数据的第30百分位数为28,第50百分位数为
对于乙组数据,,
所以乙组数据的第30百分位数为,第50百分位数为.
由题意得,,解得,
所以.
四、解答题
15.(25-26高三上·江西上饶·月考)黄金是国家经济的储备基石,受国际形势等因素的影响,金价往往不太稳定,但总体趋势逐渐上涨.下表为五个月的国际金价的变化(为美元):
月份
5月
6月
7月
8月
9月
价格/盎司
记这组数据的平均数为,方差为,定义.
(1)求;
(2)若,则称该组数据具有高检验水准,反之则称该组数据不具有高检验水准.判断该组数据是否具有高检验水准,并证明.
【答案】(1) 3540;67520.;(2)认为该组数据具有高检验水准,证明见解析
【分析】(1)应用平均数及方差公式计算求解;(2)应用已知计算计算比较求解;
(2)应用已知条件应用古典概型计算求解.
【详解】(1),
67520.
(2)由于,
故,
故认为该组数据具有高检验水准.
16.(25-26高三上·湖南衡阳·月考)衡阳县第一中学为预备2026年的全国高中数学联赛预赛,在该校先选取了前60名的学生(含60名),进行选拔,随后根据分数线选取参赛选手,该60名学生的成绩的频率分布直方图如下,数据的分组依次是(本场选拔总分为100分).
(1)估计该一中学生选拔成绩的平均值(提示:同一组中的数据用该组区间的中点值为代表)
(2)这次选拔测试成绩的第60百分位数可估计为?
(3)若学校定75分为标准选拔分数线,则参赛人数大约为?
【答案】(1)
(2)75
(3)24
【分析】(1)根据平均数的计算公式即可求解,
(2)根据百分位数的计算公式即可求解,
(3)根据频率即可得解.
【详解】(1)由图可估计选拔成绩的平均值为,
(2)成绩位于的频率为,
成绩位于的频率为,
因此第60百分位数位于,设为,
则,故,
(3)由(2)可知75分为第60百分位数,故能参赛的人约有个.
17.(25-26高一上·辽宁沈阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第75百分位数;
(2)求样本成绩的中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【答案】(1)0.030,84
(2)75,74
(3)62,37
【分析】(1)根据频率分布直方图的性质,以及由频率分布直方图求第百分位数的方法,求出结果即可.
(2)由频率分布直方图求中位数和平均数的方法,求出结果即可.
(3)根据平均数和方差的性质,由给出两组各自的均值和方差,求出合并后得均值和方差即可.
【详解】(1)由频率分布直方图面积和为,可得,
解得;
成绩在的频率为,
则第75百分位数为.
(2)由频率分布直方图可知成绩在的频率为,
则样本成绩的中位数为;
由频率分布直方图可得样本平均数为.
(3)可知成绩落在的人数为人,
成绩落在的人数为人,
则两组总体成绩平均数为,
则总体方差为.
18.(2025·上海闵行·一模)小闵同学某一天进行了10次100米短跑集训,其中上午进行了6次,下午进行了4次;如下是他上午集训6次的成绩(单位:s):、、、、、.
(1)求这6次成绩的中位数;
(2)参考这一天上午集训的数据,用经验概率估计概率,求该同学训练100米短跑3次至少有一次用时小于13s的概率;
(3)若该同学下午4次的集训原始成绩记录丢失,但记得这4次的平均成绩是14.25s,方差是0.75,求他这一天10次训练成绩的平均值和方差.
【答案】(1);
(2);
(3)均值,方差.
【分析】(1)将数据由小到大排列,然后由中位数定义求解可得;
(2)根据上午的成绩,由频率估计概率的方法求出用时小于13s的概率,然后由相互独立事件的概率乘法公式和对立事件的概率公式求解可得;
(3)利用分层平均数和分层方差公式求解即可.
【详解】(1)将这6次成绩从小到大排列为: 12.9、13.3、13.7、13.9、14.9、15.3,
这6次成绩的中位数为:;
(2)用时小于13s的概率为:,所以该同学训练100米短跑3次至少有一次用时小于13s的概率为:
;
(3)上午六次的成绩平均数为: ,
上午六次的方差为:
,
设下午四次成绩平均数为 ,下午四次的方差为 ,
总的平均数为: ,
总的方差为:
19.(2026高三·全国·专题练习)已知A,B两家公司的员工月均工资(单位:万元)情况分别如图1,图2所示:
(1)以每组数据的区间中点值为代表,根据图1估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平?请说明理由;
(2)小明拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,他应该选哪个公司?
【答案】(1)中位数更能反映该公司普通员工的工资水平,理由见解析
(2)应该选B公司
【分析】(1)根据平均数和中位数的定义和意义进行求解判断即可.
(2)求出B公司的平均数和中位数,然后与A公司的数据作比较,进而可进行判断.
【详解】(1)A公司员工月均工资的平均数为
(万元).
由题图1可知A公司员工月均工资在0.6万元以下的比例为,
所以A公司员工月均工资的中位数约为0.6万元.
用中位数更能反映该公司普通员工的工资水平,理由如下:
因为平均数受每一个数据的影响,越离群的数据对平均数的影响越大,
该公司少数员工的月收入很高,在这种情况下平均数并不能较好的反映普通员工的收入水平,
而中位数不受少数极端数据的影响,可以较好的反映普通员工的收入水平.
(2)B公司员工月均工资的平均数为
(万元),
由题图2知,B公司员工月均工资在0.6万元以下的频率为,
在0.8万元以下的频率为.
设B公司员工月均工资的中位数为x万元,则,得.
小明应选择B公司应聘,理由如下:
B公司员工工资数据较为集中,月均工资的平均数和中位数均能反映该公司普通员工的平均收入水平,
B公司员工月均工资平均数为0.69,中位数为0.7,均大于A公司员工月均工资的中位数,
所以以公司普通员工的工资水平作为决策依据,小明应该选B公司应聘.
27 / 28
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$