内容正文:
专题9.2 用样本估计总体
【知识梳理】 1
【考点1:绘制或补全频率分布直方图】 3
【考点2:由频率分布直方图计算频率、频数、样本容量、总体容量】 10
【考点3:频率分布直方图的实际应用】 13
【考点4:其他统计图及其实际应用】 18
【考点5:总体百分位数的估计】 22
【考点6:众数的计算】 24
【考点7:用众数的代表意义解决实际问题】 26
【考点8:中位数的计算】 29
【考点9:用中位数的代表意义解决实际问题】 32
【考点10:平均数的计算】 36
【考点11:用平均数的代表意义解决实际问题】 39
【考点12:方差、标准差的计算】 44
【考点13:用方差、标准差的代表意义解决实际问题】 47
【知识梳理】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
3.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
4.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平
均
数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中
位
数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众
数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
5.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差
.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中出
现的频数为,则总体方差为.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
6.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【考点1:绘制或补全频率分布直方图】
1.(25-26高二下·云南昆明·阶段检测)为调查社区居民对社区工作的满意度,在社区内抽取200名居民进行问卷调查,将收集到的数据分成五组,绘制出以下频率分布直方图,若的频率为0.48,,的值为( )
A.0.017,0.048 B.0.017,0.48 C.0.17,0.048 D.0.17,0.48
【答案】A
【分析】根据已知条件,由频率分布直方图中矩形高度的概念可求出,由频率分布直方图中各组矩形面积之和为1,即可求出.
【详解】由频率分布直方图可知组距为10,则,
又因为,解得.
故选:A
2.(25-26高二·上海·课堂例题)某校30名高一女生的扔手球记录如下(单位:m):
16.3
13.2
17.7
14.3
16.4
19.8
13.5
14.5
11.7
14.1
14.8
17.2
13.8
15.4
16.3
15.7
18.5
16.8
17.9
15.9
17.6
15.4
16.8
21.4
16.5
18.1
16.0
20.3
16.6
19.5
(1)选择适当的组距,制作一张频率分布表;
(2)在(1)的基础上,绘制一幅频率分布直方图.
【答案】(1)频率分布表见解析
(2)频率分布直方图见解析
【分析】(1)根据所给数据求出极差,分组,求出各区间的频数及频率即可求出频率分布表;
(2)根据(1)作出频率分布直方图即可
【详解】(1)由题目数据可知极差为,组距为,所以分5组较好,
,
频率分布表如下:
分组
频数
频率
3
7
11
6
3
合计
30
1.00
(2)根据(1)的频率分布表可以画出频率分布直方图如图所示:
3.(25-26高一上·全国·课堂例题)某学校为了了解和掌握学生的期末数学成绩的情况,随机地取出了100名考生的数学成绩(单位:分),数据如下:
135 98 102 110 99 121 110 96
100 103 125 97 117 113 110 92
102 109 104 112 105 124 87 131
97 102 123 104 104 128 109 123
111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117
104 109 111 89 110 121 80 120
121 104 108 118 129 99 90 99
121 123 107 111 91 100 99 101
116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97
126 108 123 119 98 121 101 113
102 103 104 108
(1)列出频率分布表;
(2)画出频率分布直方图.
【答案】(1)答案见解析
(2)答案见解析
【分析】(1)根据题目所给数据列出频率分布表.
(2)根据频率分布表画出频率分布直方图.
【详解】(1)在这100个数据中,最大值为135,最小值为80,极差为.
取组距为5,则组数为.
频率分布表如下:
分组
频数
频率
[80,85)
1
0.01
[85,90)
2
0.02
[90,95)
4
0.04
[95,100)
14
0.14
[100,105)
24
0.24
[105,110)
15
0.15
[110,115)
12
0.12
[115,120)
9
0.09
[120,125)
11
0.11
[125,130)
6
0.06
[130,135]
2
0.02
合计
100
1.00
(2)根据频率分布表中的有关信息画出频率分布直方图,如图所示.
4.(2026高三·全国·专题练习)某地抽样调查30个家庭的人均月收入,得到如下数据(单位:元):
4040 4440 5560 4300 3800 4200 5000 4300 4200 3840
4200 4040 4240 3400 4240 4120 3880 4720 3580 4760
3760 3960 4280 4440 3660 4360 3640 4380 3300 4260
(1)取组距为600,起点为3200,列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计人均月收入在的家庭所占的百分比.
【答案】(1)表格见解析
(2)作图见解析
(3)
【分析】(1)对数据进行整理即可得到频率分布表;
(2)根据频率分布表,画出频率分布直方图即可;
(3)根据频率分布直方图,计算人均月收入在的频率即可.
【详解】(1)频率分布表如下:
分组
频数
频率
6
0.20
18
0.60
4
0.13
2
0.07
合计
30
1.00
(2)频率分布直方图如图.
(3)人均月收入落在上的家庭所占的频率为,
所以估计人均月收入在的家庭所占的百分比为.
5.(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
【答案】(1)表格见解析
(2)作图见解析
(3)504
【分析】(1)利用频率、频数和样本容量的关系即可完成此表格;
(2)利用表中数据计算出这个分数段对应的矩形高度即可完成频率分布直方图.
(3)先找出成绩分及以上对应的分数段的频率,再用该频率乘以总人数即可得到.
【详解】(1)由频率分布表,可知样本容量为50,
故成绩在[60,70)的频数为,
成绩在[70,80)的频率为,
成绩在[90,100]的频数为,
频率为,
故频率分布表为:
分组
频数
频率
[50,60)
4
0.08
[60,70)
8
0.16
[70,80)
10
0.20
[80,90)
16
0.32
[90,100]
12
0.24
合计
50
1
(2)频率分布直方图如图所示:
(3)样本中成绩在[80,100]的频率为0.32 + 0.24 = 0.56,
所以估计该校获得环保纪念勋章的学生人数为900×0.56 = 504.
【考点2:由频率分布直方图计算频率、频数、样本容量、总体容量】
1.(2026·云南玉溪·二模)为调查社区居民对社区工作的满意度,在社区内抽取名居民进行问卷调查,将收集到的数据分成五组,绘制出如下频率分布直方图,若的频率为,的值为( )
A., B., C., D.,
【答案】A
【分析】根据频率分布直方图的性质计算即可求解.
【详解】已知的频率为,组距为,因此,解得.
又因为所有组频率和为,因此,
代入,计算得 ,则,
因此,.
2.(2026·吉林长春·二模)某精密仪器厂生产一种标准长度为的金属垫片.现随机抽取200个垫片测量其实际长度(单位:),按长度分组并绘制出如图所示的频率分布直方图.若规定长度在区间内的垫片为合格品,用样本频率估计总体的概率,则任取一个垫片为合格品的概率为( )
A.0.3 B.0.4 C.0.5 D.0.6
【答案】C
【分析】在频率分布表中,小矩形的面积等于这一组的频率,所以面积和为1,建立等量关系求出,进而求出长度在内的频率.
【详解】由题意知,,整理得,解得.
所以任取一个垫片为合格品的概率为:.
3.(25-26高三下·青海西宁·阶段检测)一农庄的某种水果成熟后,质地较好的水果的重量在80~120g间,现随机抽查100个这种水果,将其质量(单位:g)分组为,,,,,,,,并绘制出频率分布直方图如图,则这100个水果质量在区间(单位:g)内的个数为( )
A.66 B.68 C.70 D.72
【答案】C
【详解】由长方形的面积之和为1,得:
,
所以,
所以水果质量在区间(单位:g)内的个数为个.
4.(多选)(2026·河北张家口·二模)(多选)从工厂生产的零件中随机抽出100个,测量其直径(单位:),将所得数据分为5组:,并整理得到频率分布直方图如图,记这100个零件的直径的中位数为,平均数为,极差为,众数为,则( )
A. B.
C. D.
【答案】ABC
【详解】由图可知,这5组的频率依次为,
则这5组的频数依次为,
将这100个零件的直径数据从小到大排序,
第31个数大于或等于5.18,第65个数小于5.28,第50与第51个数之和为,
所以,故A正确;
若每个区间中的数都取最大值,
平均数,故B正确;
极差是最大数减去最小的数,所以,故C正确;
众数是指这100个数中,相等的数的个数最多的那个,
而在中最多有30个数相等,中最多有35个数相等,
则众数,D错误.
5.(2026·江西新余·二模)在某高校举行的一次国际学术与文化交流会上,对外国留学生举行了“中华文化知多少”的知识竞赛.某数学兴趣小组从中随机抽取部分学生的成绩,整理后分成五段:,绘制了如下的频率分布直方图.
(1)求的值;
(2)若参赛学生共有2000名,估计其中成绩小于70分的人数;
【答案】(1)
(2)
【分析】(1)根据频率分布直方图中,所有小矩形面积和为1,即可求得答案.
(2)先求出成绩小于70分的频率,根据总人数,即可得答案.
【详解】(1)由频率分布直方图中,所有小矩形面积和为1,
可得,解得.
(2)由图象可得,成绩小于70分的频率为,
则成绩小于70分的人数为.
【考点3:频率分布直方图的实际应用】
1.(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
【答案】A
【分析】利用频率和为1求参数,再估计身高低于170cm的人数.
【详解】由图可得,得,
所以估计这100名学生中身高低于170cm的人数为.
故选:A
2.(25-26高一下·全国·单元测试)某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是,样本数据分组为,,,,.
(1)频率分布直方图中的值为____________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1200名,估计新生中可以申请住校的学生有____________名.
【答案】 0.0125 144
【分析】(1)由频率分布直方图各个小矩形的面积和等于1,建立的方程,计算出.
(2)利用频率等于小矩形的面积计算新生上学路上所需时间不少于1小时的频率,利用频数等于频率乘以总体的容量得到所求.
【详解】(1)由频率分布直方图,可得,
所以.
(2)新生上学路上所需时间不少于1小时的频率为,
因为,所以1200名新生中约有144名学生可以申请住校.
故答案为:0.0125;144.
3.(2026高一上·全国·专题练习)南昌某种植园在香瓜成熟时,随机从一些香瓜藤上摘下100个香瓜,称得其质量(单位:克)分别在,,,,中,经统计绘制频率分布直方图如图所示:
(1)在样本中,用分层随机抽样的方法从质量在中的香瓜中随机抽取了n个香瓜,其中质量在中的香瓜有6个,求n的值.
(2)某个体经销商来收购香瓜,同一组中的数据以这组数据所在区间的中点值作代表,用样本估计总体,该种植园中大概共有香瓜20000个,经销商提出以下两种收购方案,方案①:所有香瓜以5元/500克收购;方案②:对质量低于350克的香瓜以3元/个收购,对质量高于或等于350克的香瓜以5元/个收购.请分别计算两种方案该种植园获得的收入,并说明种植园选择哪种方案收入更多.
【答案】(1)
(2)77400元,85200元,种植园选择方案②收入更多
【分析】(1)由分层抽样的性质可求解;
(2)分别算出两个方案的收益,比较,即可得结论.
【详解】(1)由分层随机抽样,知,所以.
(2)按照方案①:由题意可知20000个香瓜中,
200克的有(个),300克的有(个),
400克的有(个),500克的有(个),
600克的有(个),
则以5元/500克收购获得的收入为
77400(元).
按照方案②:质量低于350克的香瓜有(个),
质量高于或等于350克的香瓜有(个),
则对质量低于350克的香瓜以3元/个收购,对质量高于或等于350克的香瓜以5元/个收购获得的收入为(元).
因为,
所以该种植园选择方案②收入更多.
4.(24-25高一下·内蒙古鄂尔多斯·期末)为了了解小学生的体能情况,某机构抽取了某校部分学生进行一分钟跳绳次数测试,将取得数据整理后,画出频率分布直方图(如图)(每个分组包括左端点,不包括右端点).已知图中从左到右前三个小组频率分别为0.15,0.3,0.4,第一小组的频数为9.
(1)求第四小组的频率;
(2)参加这次测试的学生有多少人?
(3)若次数在60次以上(含60次)为达标,试估计该年级学生跳绳测试的达标率是多少.
【答案】(1)0.15
(2)60
(3)55%.
【分析】(1)由累积频率为1即可求解;
(2)第一小组的频数除以对应的频率即可求解;
(3)后面两组频率相加即可.
【详解】(1)由累积频率为1知,第四小组的频率为.
(2)设参加这次测试的学生有x人,则,
,即参加这次测试的学生有60人.
(3)达标率为,估计该年级学生跳绳测试的达标率为55%.
5.(25-26高二下·重庆·期中)某大学数学专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,,…,,并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于60的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中女生的人数.
【答案】(1);
(2);
(3).
【分析】(1)利用频率直方图频率和为1的性质,即可估计概率;
(2)利用频率来估计总体概率,即可估计总体中在区间的人数;
(3)利用频率计算频数,结合题意中的关系,即可估计总体中女生的人数.
【详解】(1)
根据频率分布直方图,可计算分数小于60的频率为:,
所以从总体的400名学生中随机抽取一人,估计其分数小于60的概率为;
(2)根据频率分布直方图,可计算分数小于50的频率为:,
所以可计算在100人的样本中,分数小于60的频数为:人,
已知样本中分数小于40的学生有人,所以分数在内的频数为:人,
即分数在内的频率为:,
从而可估计总体中分数在区间内的人数约为:人;
(3)根据频率分布直方图,可计算分数不小于的频率为:,
则计算样本中分数不小于的频数为:人,
由于样本中分数不小于70的男女生人数相等,所以此时男女生各有人;
而样本中有一半男生的分数不小于70,则样本中男生人数共有人,
所以样本中女生只有人,
可以估计总体中女生的人数约为:人.
【考点4:其他统计图及其实际应用】
1.(2026·陕西榆林·模拟预测)某同学收集并整理了某市年月日至日每日最高气温(单位:)的数据(均为整数),并绘制了如图所示的折线图,则月日至日最高气温的中位数为( )
A. B. C. D.
【答案】C
【分析】直接由中位数的定义计算可得.
【详解】由图知,月日至日的最高气温由低到高排列为,共个数据,
故中位数为.
2.(2026·河南平顶山·模拟预测)年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
【答案】D
【分析】根据折线统计图和条形统计图逐项判断可得出合适的选项.
【详解】对于A选项,由图可知,仅有月同比增速为,其余个月同比增速均为正数,故A正确;
对于B选项,由图可知个数据的平均数为
,故B正确;
对于C选项,由图可知这个月的数据中,第个月的最大,故C正确;
对于D选项,由,得年月该市星级酒店平均房价大于元,故D错误.
故选:D.
3.(多选)(24-25高一下·广东佛山·期末)(多选)广东某高校为传承粤语文化,举办了主题为“粤唱粤美好”的校园粤语歌手比赛在比赛中,由A,B两个评委小组(各9人)给参赛选手打分.根据两个评委小组对同一名选手的打分绘制成如图所示折线图,则下列说法正确的是( )
A.A组打分的众数为47 B.B组打分的中位数为75
C.A组的意见相对一致 D.B组打分的均值小于A组打分的均值
【答案】AC
【分析】由折线图中的数据,结合众数、中位数、平均数的定义对四个选项逐一分析判断即可.
【详解】解:由折线图可知,小组打分的分值为:42,47,45,46,50,47,50,47,
则小组打分的分值的众数为47,故选项A正确;
小组打分的分值为:55,36,70,66,75,68,68,62,58,
按照从小到大排列为:36,55,58,62,66,68,68,70,75,
中间数为66,故中位数为66,故选项B错误;
小组的打分成绩比较均匀,波动更小,故A小组意见相对一致,故选项C正确;
小组的打分分值的均值,而小组的打分分值的均值,
所以小组打分的分值的均值大于小组打分的分值的均值,故选项D错误.
故选:AC.
4.(多选)(24-25高二下·湖北孝感·期末)(多选)双峰山景区提档升级后,游客人数猛增.管委会为了解游客人数的变化规律,提高.旅游服务质量,收集并整理了2018年1月至2020年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论正确的是( )
A.年接待游客量逐年增加
B.各年的月接待游客量高峰期大致在8月
C.2018年1月至12月月接待游客量的中位数为30
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
【答案】ABD
【分析】根据折线图,逐项分析判断,即可得解.
【详解】根据题意,
对A,从图象看月份同比接待游客量是上升的,所以年接待游客量逐年增加,故A正确;
对B,从图象看各年的月接待游客量高峰期大致在8月,故B正确;
对C,2018年1月至12月月接待游客量的最低为30,不可能为中位数,故C错误;
对D,从图象看1月至6月的月接待游客量相对于7月至12月波动性更小,故D正确.
故选:ABD
5.(25-26高一上·黑龙江哈尔滨·开学考试)某校为了解九年级学生近两个月“推荐书目”的阅读情况,随机抽取了该年级的部分学生,调查了他们每人“推荐书目”的阅读本数,设每名学生的阅读本数为n,并按以下规定分为四档:当时,为“偏少”;当时,为“一般”;当时,为“良好”;当时,为“优秀”,现将调查结果统计后绘制成不完整的统计图表:
阅读本数(本)
1
2
3
4
5
6
7
8
9
人数(名)
1
2
6
7
12
7
y
1
请根据以上信息回答下列问题:
(1)求出本次随机抽取的学生总人数;
(2)分别求出统计表中的的值;
(3)估计该校九年级400名学生中为“优秀”档次的人数.
【答案】(1)50
(2)11;3
(3)32
【分析】(1)根据“一般”档次占比与对应人数即得;
(2)根据“良好”档次占比与对应人数建立方程,求解即得的值,再由学生总数求得的值;
(3)先算出“优秀”档次占比,再由总人数即可计算估计出“优秀”人数.
【详解】(1)由统计图表可知:当时,“一般”档次占比,对应的学生数为,故学生总人数为人;
(2)由统计图表可知:当时,“良好”档次占比,即,解得,
又总人数为人,故,即,;
(3)由统计图表可知:“优秀”档次占比为,
故该校九年级400名学生中为“优秀”档次的人数约为人.
【考点5:总体百分位数的估计】
1.(25-26高二下·上海·阶段检测)样本数据:1,1,2,2,3,3,4,4,5,5,6的第75百分位数为________.
【答案】5
【详解】显然该组数据是按照从小到大排列,且共有个数据,
因为,
所以这组数据的第75百分位数为第九个数据,即为5.
2.(2026·上海·三模)小明连续记录了7天自己每天花在课外阅读上的时间(单位:min),分别为70,42,54,90,55,47,58,则这组数据的第60百分位数是__________.
【答案】
【详解】对7个样本数据从小到大排序,可得:42,47,54,55,58,70,90;;因此排序后第5个数据就是第60百分位数,即58.
3.(2026·福建泉州·模拟预测)某校从高中部抽出100名学生参加AI基础知识竞赛,由成绩得到如图的频率分布直方图,则估计这100名学生成绩的48%分位数为__________分.
【答案】76
【详解】依题意,前三个小矩形的面积之和为,
前四个小矩形的面积之和为,
因此分位数位于内,,
所以估计这100名学生成绩的48%分位数为76分.
4.(25-26高三·全国·一轮复习)为纪念中国人民抗日战争暨世界反法西斯战争胜利80周年,某地面向全体中学生开展了以“铭记历史、缅怀先烈、珍爱和平、开创未来”为主题的知识竞赛活动.现从中随机抽取了100名学生的成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则估计这组数据的第85百分位数为( )
A.85 B.86 C.86.5 D.87
【答案】B
【分析】运用频率分布直方图的性质求出,结合百分位数的定义求解即可.
【详解】由,解得.
所以前4组频率和为,前5组频率和为,
设这组数据的第85百分位数为,则,解得.
5.(2026·贵州安顺·模拟预测)下表为“2016-2025年某地区数字经济总体规模”相关数据(其中市场规模是逐年递增的).
年份
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
市场规模/万亿元
22.6
27.2
31.3
35.8
39.2
45.5
50.2
63.2
70.8
由于不小心,2023年的市场规模数据被污染了,但知道表中数据的第40百分位数与上四分位数之和为93.6,则2023年的市场规模数据为( )
A.54.5 B.56.1 C.57.9 D.60.8
【答案】B
【详解】
设2023年的市场规模数据为,
因市场规模是逐年递增,由可知第40百分位数为,
由可知上四分位数为,
,解得.
【考点6:众数的计算】
1.(25-26高一下·甘肃武威·阶段检测)倡导中小学生学习践行“富强、民主、文明、和谐;自由、平等、公正、法治;爱国、敬业、诚信、友善”社会主义核心价值观这24个字,其中含有12组词,每组词的笔画数的和依次为,则这12个笔画数的众数是( )
A.17 B.16 C.1 D.24
【答案】A
【分析】根据一组数据中出现次数最多的数值来确定众数即可.
【详解】题目中的数据依次为:,
因为::各出现1次,
:出现2次,
:出现3次,
又因为出现的次数最多,所以这组数据的众数是.
2.(2026·湖南·三模)一组数据为50,40,20,19,16,16,14,10,则这组数据的众数与第60百分位数之和为( )
A.40 B.39 C.36 D.35
【答案】D
【详解】将题中数据按从小到大排列为10,14,16,16,19,20,40,50,则众数为16,
因为,所以第60百分位数为19,
所以众数与第60百分位数之和为.
3.(2026高二上·山东枣庄·学业考试)如图是某地100户居民的月均用水量的频率分布直方图,估计众数与中位数分别是( )
A. B. C. D.
【答案】D
【分析】利用频率分布直方图,根据众数与中位数的定义列式求解即得.
【详解】由频率分布直方图可得众数为;
因中位数是频率为时对应的样本数据,由,而,
故中位数在第二组,中位数为.
故选:D.
4.(多选)(2026高三·全国·专题练习)(多选)(多选)某班进行了一次数学测试,全班学生的成绩都落在区间内,其成绩的频率分布直方图如图所示,则该班学生这次数学测试成绩的中位数和众数的估计值为( )
A.81.5 B.75 C.81.25 D.85
【答案】CD
【分析】根据频率分布直方图,结合中位数、众数的求法求得正确答案.
【详解】因为,
,
所以该班学生这次数学测试成绩的中位数落在之间.
设中位数为,因为,
所以所求中位数为.
众数在之间,为85.
5.(2026高二下·湖南郴州·学业考试)如图是位居民月均用水量的频率分布直方图,并据此回答下列问题.
(1)月均用水量在范围内的居民有多少人?
(2)请估计居民月均用水量的众数;
(3)请估计居民月均用水量大于等于的概率.
【答案】(1)人
(2)
(3)
【分析】(1)将月均用水量在的频率乘以即可得出结果;
(2)利用最高矩形底边的中点值为众数可得结果;
(3)根据频率分布直方图可计算出月均用水量大于等于的概率.
【详解】(1)由频率分布直方图可知,月均用水量在范围内的居民有(人).
(2)由频率分布直方图可知,居民月均用水量的众数为.
(3)由频率分布直方图可知,居民月均用水量大于等于的概率为.
【考点7:用众数的代表意义解决实际问题】
1.(24-25高一下·广西来宾·期末)抽样调查了某班30位女生所穿鞋子的尺码,数据如下(单位:码).在这组数据的平均数、中位数、众数和方差中,鞋厂最感兴趣的是( )
鞋码号
33
34
35
36
37
人数
2
6
20
1
1
A.平均数 B.中位数 C.众数 D.方差
【答案】C
【分析】鞋厂最感兴趣的是销售量,即可根据数据的数字特征来判定.
【详解】鞋厂最感兴趣的是销售量最多的鞋号,即为数据的众数,故鞋厂最感兴趣的是众数.
故选 :C.
2.(2026高一下·全国·专题练习)某鞋店试销一种新款女鞋,销售情况如下表:
码号
34
35
36
37
38
39
40
41
数量/双
2
5
9
16
9
5
3
2
如果你是鞋店经理,最关心的是哪种码号的鞋销量最大,那么对你来说最重要的是________(填“平均数”“众数”或“中位数”).
【答案】众数
【分析】根据众数、平均数、中位数的意义进行选择.
【详解】鞋店经理最关心的是哪种码号的鞋销量最大,
由题表可知,码号为37的鞋销量最大,共销售了16双,37是这组数据的众数.
故答案为:众数
3.(2026高二下·辽宁·学业考试)为庆祝中国共产主义青年团成立100周年,某班级准备利用暑假进行“请党放心,强国有我”为主题的研学旅行.为了便于识别,该班级准备定做一批容量一致的双肩包.为此,班级负责人征求班内同学的意向,得到如下数据:为了照顾到绝大多数人的需求,则应该定做双肩包的容量为______.
容量
23
25
27
29
31
33
频数
3
4
5
26
3
2
【答案】29
【分析】根据表中数据直接求解即可.
【详解】解:由题知,容量为29的双肩包的频数为26,大于其他容量的频数,
所以,为了照顾到绝大多数人的需求,则应该定做双肩包的容量为29.
故答案为:29
4.(25-26高一·全国·课后作业)某轮胎厂为检验轮胎的使用寿命,抽取一个容量为24的样本,测得结果如下表:
使用寿命/km
轮胎数
95000
1
88000
1
56000
6
48000
8
40000
8
为了说明该厂生产的轮胎的平均寿命,选用哪个代表值最合适?为什么?
【答案】48000最合适,原因见解析.
【分析】因为有“95000”这一个“极端值”,所以不宜使用平均数,而众数和中位数均为48000,从而即可求解.
【详解】解:为了说明该厂生产的轮胎的平均寿命,应选48000代表值最合适.
因为容量总数为24,且有“95000”这一个“极端值”,所以不宜使用平均数,而众数和中位数均为48000,所以应选48000为代表值.
5.(2026高一下·全国·专题练习)某校开展了以“了解传统习俗,弘扬民族文化”为主题的实践活动,某实践小组就“是否知道中秋节的来由”这个问题,随机抽取部分学生进行了一次问卷调查,并对收集到的信息进行了统计,得到了下面两个尚不完整的统计图表,请你根据统计图表中所提供的信息解答下列问题:
调查情况
频数
频率
非常了解
0.10
了解
140
0.70
基本了解
0.18
不了解
4
0.02
合计
200
1.00
(1)此次问卷调查采用的是________方法(填“全面调查”或“抽样调查”),抽取的样本量是________.
(2)如果要对“是否知道中秋节的来由”这个问题作出合理判断,最应关注的数据是________(填“中位数”“众数”或“方差”).
(3)样本中对“中秋节的来由”非常了解的人数是________,基本了解的人数是________.
(4)补全上面的条形图.
【答案】(1)抽样调查,200
(2)众数
(3)20,36
(4)条形图见解析
【分析】根据题意,结合频率分布表中的数据,结合统计的相关概念和计算方法,逐个求解,即可得到答案.
【详解】(1)解:此次问卷调查采用了抽样调查方法,抽取的样本量为200.
(2)解:根据众数的定义,要对“是否知道中秋节的来由”作出合理判断,最应关注的数据是众数.
(3)解:样本中对“中秋节的来由”非常了解的人数是人,
基本了解的人数是人.
(4)解:补全条形图如下:
【考点8:中位数的计算】
1.(2026·上海普陀·二模)根据中国汽车工业协会发布的数据,年月至年月,我国新能源汽车月度销量(单位:万辆)为:,则这个月新能源汽车销量的中位数为______万辆.
【答案】
【分析】先将数据从小到大排列,再根据中位数的定义可得.
【详解】将年月至年月,我国新能源汽车月度销量按从小到大排列:
数据个数为,所以中位数是第个数,即万辆.
2.(25-26高一下·安徽阜阳·阶段检测)已知一组数据12,10,8,15,6,8,这组数据的中位数是( )
A.8 B.9 C.10 D.12
【答案】B
【详解】将这组数据从小到大排列为6,8,8,10,12,15,中间的两个数为8和10,
则中位数为.
3.(24-25高一下·黑龙江牡丹江·期末)某校开展“正心立德,劳动树人”主题教育活动,对参赛的 100名学生的劳动作品的得分情况进行统计, 并绘制了如图所示的频率分布直方图, 根据图中信息,这组数据中位数的估计值为 ( )
A.70 B.77 C.80 D.82
【答案】B
【分析】由频率之和为1求出值,由中位数公式计算中位数的估计值.
【详解】由频率之和为1得:,解得,
的频率为,
的频率为,
则中位数在内,所以这组数据中位数的估计值为,
故选:B.
4.(24-25高二上·四川·期末)将一次学校数学模拟竞赛的成绩统计如下图所示,记本次模拟竞赛的成绩的中位数为,则( )
A. B. C.75 D.
【答案】A
【分析】应用频率和为1计算求得,再应用中位数定义计算即可.
【详解】由图可知,解得,
所以前3组的频率和为,
前4组的频率和为,
故在第4组,且.
故选:A.
5.(2026·天津红桥·二模)为了保证驾乘人员的安全,某市要对该市出租车司机的年龄进行调查,现从中随机抽出名司机,已知抽到的司机年龄都在岁,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )
A.岁 B.岁 C.岁 D.岁
【答案】C
【分析】先补全组的频率,再通过累计频率判断中位数落在区间,最后利用中位数定义列方程求解即可.
【详解】根据所给的信息可知,在区间上的数据的频率为
,
因为的频率为,的频率为,
所以中位数在,
设为中位数为,则,
解得.
【考点9:用中位数的代表意义解决实际问题】
1.(25-26高三上·广东·开学考试)某公司购入了400根钢管拟切割打磨为其他产品,统计钢管口径后得以下频数分布表:
钢管口径
11.0
12.5
14.0
16.5
18.5
20.5
21.0
22.0
频数
26
74
100
40
46
52
38
24
则这批钢管口径的中位数为( )
A.14.00cm B.15.25cm C.16.25cm D.16.50cm
【答案】B
【分析】根据中位数的定义及频数表即可得解.
【详解】因为为整数,
所以样本数据的中位数为从小到大排列的第200个数据和第201个数据的平均数,
因为前三组的频数之和为200,所以这批钢管口径的中位数为15.25.
故选:B.
2.(多选)(2026·福建福州·模拟预测)(多选)近日,国家发展改革委等部门联合印发《完善碳排放统计核算体系工作方案》,指出要在2025年全面建立碳排放年报、快报制度,完善碳排放统计核算体系.专家在甲、乙、丙、丁四地2024年第4季度的周快报数据中随机抽取7周数据进行分析,整理出四地这7周各周内碳排放量超过的天数的数据特征:
地区
甲
乙
丙
丁
数据特征
中位数
3
中位数
1
均值
3
均值
2
众数
2
均值
<1
众数
4
方差
2
根据规定,若这7周中每周内碳排放量超过的天数都不多于5天,则可称该地区为低碳生态区.分析数据,四个地区中能判定为低碳生态区的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】BD
【分析】根据表中数据分别作出四个地方的数据分布,即可结合低碳生活区的定义求解.
【详解】将四地这7周各周内碳排放量超过的天数由小到大依次记为,,,,,,,分别对应第周.
对于甲地,由题可知(中位数),则可做表:
周
第周
第周
第周
第周
第周
第周
第周
天数
3
众数为二,可使,,显然可以是6或7,
此时第周内碳排放量超过的天数都多于5天,故无法判定甲地为低碳生态区;
对于乙地,由题可知(中位数),则可做表:
周
第周
第周
第周
第周
第周
第周
第周
天数
1
我们可以使,,,,尽可能小,
通过判断是否有可能来判断乙地是否能被判定为低碳生态区.
则,,可计算均值,化简得,
满足7周中每周内碳排放量超过的天数都不多于5天,因此可以判定乙地为低碳生态区;
对于丙丁,根据题意,我们无法直接判断对应的值,
但类似的,我们可以使,,,,,的和尽可能小,
通过判断是否有可能来判断丙地是否能被判定为低碳生态区.
则可以使,,,,,可做表:
周
第周
第周
第周
第周
第周
第周
第周
天数
0
1
2
3
4
4
均值,解得,
即此时第周内碳排放量超过的天数都多于5天,故无法判定丙地为低碳生态区;
对于乙地,假设,则方差,不合题意,
故,即满足7周中每周内碳排放量超过的天数都不多于5天,
因此可以判定丁地为低碳生态区;
综上所述,四地中能判定为低碳生态区的是乙地和丁地.
故选:BD
3.(2026高一·全国·专题练习)某公司为了了解一年内的用水情况,抽取了10天的用水量如下表所示:
用水量/t
22
38
40
41
44
50
95
天数
1
1
1
2
2
1
2
(1)在这10天中,该公司用水量的平均数是多少?每天用水量的中位数是多少?
(2)你认为应该用平均数和中位数中的哪一个来描述该公司每天的用水量?
【答案】(1)平均数是,中位数是.
(2)用中位数描述每天的用水量更合适.
【分析】(1)根据题意,先由平均数的计算公式可得,然后再由中位数的计算公式即可得到结果;
(2)根据题意,由平均数与中位数的定义即可得到结果.
【详解】(1)在这10天中,该公司用水量的平均数是
每天用水量的中位数是
(2)平均数受数据中的极端值(2个95)影响较大,使平均数在估计总体时可靠性降低,10天的用水量有8天都在平均值以下,故用中位数描述每天的用水量更合适.
4.(25-26高一·全国·课堂例题)下面的说法是否恰当?为什么?
(1)5人中有4名学生,1名教师,其中3名学生16岁,1名学生18岁,1名教师59岁,用他们的平均年龄25岁作为他们年龄的代表值.
(2)某服装店生产一种男式运动衫,店里决定用顾客购买的这种运动衫尺码的平均数作为生产的标准尺码(即生产的这种运动衫中大多数为该尺码).
(3)在一次满分为30分的小测试中,某小组的成绩是5个20分,3个26分,1个29分.采用中位数20作为这组数据的代表值.
【答案】(1)不恰当,理由见解析
(2)不恰当,理由见解析
(3)不恰当,理由见解析
【分析】(1)根据平均数的定义判断即可;
(2)根据平均数和众数的定义判断即可;
(3)根据中位数和众数的定义判断即可.
【详解】(1)不恰当.因为教师的年龄与学生的年龄差异太大,明显地拉高了平均数.此时平均数没有代表性.
(2)不恰当.销售商品的型号应该以众数为最多进货或生产的标准,平均数无太大的参考价值.
(3)由于测试的分数分布很特殊,中位数即为最小数,用中位数来代表小组的水平不恰当.
5.(25-26高二下·贵州遵义·月考)2022年起,某省将实行“”高考模式,为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高三年级学生的生物成绩进行赋分,具体赋分方案如下:先按照考生原始分从高到低按比例划定、共五个等级,然后在相应赋分区间内利用转换公式进行赋分,等级排名占比,赋分分数区间是;B等级排名占比,赋分分数区间是71-85:等级排名占比,赋分分数区间是56-70:等级排名占比,赋分分数区间是41-55;等级排名占比,赋分分数区间是30-40;现从全年级的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:
(1)求图中的值及这100名学生的原始成绩的中位数(中位数结果保留两位小数);
(2)用样本估计总体的方法,估计该校本次生物成绩原始分至少多少分才能达到赋分后的等级及以上(含等级)?(第(2)问结果保留整数)
【答案】(1),分
(2)分
【分析】(1)由频率分布直方图的性质,求得,结合中位数的计算方法,即可求解;
(2)根据等级达到及以上所占排名等级占比为,结合中位数的含义,即可求解.
【详解】(1)解:由频率分布直方图的性质,可得:
,解得,
由频率直方图可判断中位数落在第四组,设中位数为,
则,解得,
故抽取的这100名学生的原始成绩的中位数的估计值为分.
(2)解:由已知等级达到及以上所占排名等级占比为,
由(1)可得,中位数,
故原始分不少于分才能达到赋分后的等级及以上.
【考点10:平均数的计算】
1.(25-26高三下·山西太原·阶段检测)已知数据,,…,的平均数为4,将该组数据中的每个数据均变为原来的两倍,其平均数为,则( )
A.16 B.8 C.4 D.2
【答案】A
【详解】由题,可得,
所以将该组数据中的每个数据均变为原来的两倍,其平均数为,
所以,得.
2.(多选)(2026·甘肃嘉峪关·三模)(多选)为评估某款“端侧AI芯片”在不同模型架构下的推理延迟表现,研发团队在固定输入长度()的条件下,对200个公开的深度学习模型进行了单次推理延迟测试(单位:).测试结果经异常值剔除后,得到如图所示的频率分布直方图,其中分组区间为,,,,,则下列结论正确的是( )
A.样本中延迟在内的模型个数为60
B.估计样本的中位数落在区间内
C.估计样本的平均数约为
D.该分布呈现出右边“拖尾”形态,说明大部分模型的延迟时间较短
【答案】AD
【分析】求出各组频率判断A;利用中位数的定义计算判断B;估计平均数判断C;结合频率分布直方图分析判断D.
【详解】由频率分布直方图知,数据落在各分组区间的频率依次为:,
对于A,样本中延迟在内的模型个数为,A正确;
对于B,由,,得估计样本的中位数落在区间内,B错误;
对于C,样本的平均数约为,C错误;
对于D,该分布峰值在左侧低延迟区间,仅少数模型延迟较高,频率随延迟增大逐渐降低,
因此呈现右拖尾形态,说明大部分模型的延迟较低,D正确.
3.(25-26高二下·重庆·期中)先后抛掷一枚质地均匀的骰子次,记录向上一面的点数,若已知个点数的中位数为,唯一的众数为,则平均数最大为_____.
【答案】
【分析】根据题意将符合要求的个数据由小到大排列出来,再结合平均数公式求解即可.
【详解】将个数据由小到大进行排列,前个数依次为、、,要使得这个数据的平均数最大,
则后面两个数分别为、,即这个数据由小到大依次为、、、、,
所以这个点数的平均数的最大值为.
4.(2026·湖南长沙·模拟预测)某公司为了了解本公司职员的午餐费用情况,抽样调查了100位职员的午餐日平均费用(单位:元),得到如下图所示的频率分布直方图,图中标注a的数字模糊不清.
(1)试根据频率分布直方图求a的值,并估计该公司职员午餐日平均费用的众数和平均数;
(2)已知该公司有1000名职员,试估计该公司有多少职员午餐日平均费用不超过6元?
【答案】(1)
,众数为,平均数为
(2)
人
【分析】(1)利用频率分布直方图中所有小矩形面积之和为求出,根据最高矩形底边中点估计众数,利用各组中点值乘以频率之和估计平均数;
(2)计算日平均费用不超过元的频率,再乘以总人数即可.
【详解】(1)由频率分布直方图可得, , 解得.
由图可知,最高矩形的组为,故众数的估计值为该组底边的中点值,即.
平均数为:
故,众数为,平均数为.
(2)由频率分布直方图可知,午餐日平均费用不超过元的频率为:
.
已知该公司共有名职员, 则估计该公司午餐日平均费用不超过元的职员人数为: (人).
故估计该公司有名职员午餐日平均费用不超过元.
5.(25-26高一下·甘肃兰州·期中)某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
【答案】(1)
(2),
(3)众数:75 分;平均数:76.5 分;人
【分析】(1)由频率分布直方图中各个矩形的面积和为1即可求解;
(2)由频率分布直方图确定成绩落在,的频率,再由频率估计人数即可;
(3)由样本数据的数字特征求法依次求解即可.
【详解】(1)由题意得,解得.
(2)设为成绩落在上的概率,为成绩落在的人数,
由题意得,
设为成绩落在上的概率,为成绩落在的人数,
.
(3)由题意得众数为75分;
由(1)得成绩落在的频率为0.1,落在的频率为0.15,
落在的频率为0.35,落在的频率为0.3,落在的频率为0.1,
则平均数为,
设为78分以上的频率,为78分以上的人数,
则
,
故78分以上的人数为47人.
【考点11:用平均数的代表意义解决实际问题】
1.(25-26高一上·陕西咸阳·开学考试)某公司打算招聘一名职员.对甲、乙、丙三名应聘者进行了综合知识、工作经验、语言表达三方面的测试,他们的各项成绩如下表所示:
项目
应聘者
综合知识
工作经验
语言表达
甲
75
80
80
乙
85
80
70
丙
70
78
70
如果将每位应聘者的综合知识、工作经验、语言表达的成绩按5:2:3的比例计算其总成绩,并录用总成绩最高的应聘者,则被录用的是___________.
【答案】乙
【分析】根据题目所给比例计算三位应聘者得总成绩即可得到结论.
【详解】由题,对于甲,他的总成绩如下:
,
对于乙,他的总成绩:,
对于丙,他的总成绩:,
比较三者总成绩,乙的成绩最高。
故答案为:乙
2.(25-26高一下·全国·课后作业)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲
27
38
30
37
35
31
乙
35
29
40
34
30
36
分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?
【答案】甲的平均数为,乙的平均数为;乙参加比赛较合适.
【分析】由给定的数据求出平均数,再比较大小即可.
【详解】依题意,,,
而,所以选乙参加比赛较合适.
3.(25-26高三·全国·一轮复习)某校欲招聘一名数学教师,学校对甲、乙、丙三位候选人进行了三项能力测试,各项测试成绩满分均为100分,根据结果择优录用.三位候选人的各项测试成绩如下表所示:
测试项目
测试成绩
甲
乙
丙
教学能力
85
73
73
科研能力
70
71
65
组织能力
64
72
84
(1)如果根据三项测试的平均成绩,谁将被录用,说明理由;
(2)根据实际需要,学校将教学、科研和组织三项能力测试得分按5∶3∶2的比例确定每人的成绩,谁将被录用,说明理由.
【答案】(1)丙候选人将被录用,理由见解析
(2)甲侯选人将被录用,理由见解析
【分析】(1)由题意,分别计算三人的平均数即可求解;
(2)根据加权平均数的概念计算,即可求解.
【详解】(1)甲的平均成绩为,
乙的平均成绩为,
丙的平均成绩为(.
所以丙候选人将被录用.
(2)甲的测试成绩为.
乙的测试成绩为.
丙的测试成绩为.
所以甲侯选人将被录用.
4.(25-26高一下·浙江温州·期中)学校正在研究基于DeepSeek的人工智能答疑系统,更方便地帮助学生解决学习中碰到的问题.学校为了测试答疑系统是否准确,于是利用DeepSeek解答了50份不同的模拟试卷,收集其准确率,整理得到如下频率分布直方图.
(1)求图中的值及这组数据的中位数;
(2)若平均准确率不低于90%,则可以认为这个系统是准确的,并投入使用.请问,现在这个系统能否投入使用,并说明理由.
【答案】(1),
(2)这个系统能投入使用,理由见解析
【分析】(1)借助频率和为1计算即可得的值,利用中位数定义计算即可得结果;
(2)计算出准确率的平均数即可得结果.
【详解】(1)由频率分布直方图可得,解得;
设中位数为,前两个矩形的面积之和为,
前三个矩形的面积之和为,
所以,则,解得,
所以估计准确率的中位数为.
(2)估计准确率的平均数为,
,所以认为这个系统是准确的,并投入使用.
5.(25-26高一上·湖北十堰·自主招生)郧阳中学倡导学生“文明用餐,减少浪费”,为了解午餐的浪费情况,对高一高二年级在工作日(周一到周五)进行了连续四周的调查,得到这两个年级每天午餐浪费饭菜的重量,以下简称“每日餐余重量”(单位:千克),并对这些数据进行了整理、描述和分析.下面给出了部分信息:
①高一年级每日餐余重量的频数分布直方图如图(数据分成6组:,,,):
②高一年级每日餐余重量在这一组的是:6.1 6.6 7.0 7.0 7.0 7.8
③高二年级每日餐余重量如下:
1.4 2.8 6.9 7.8 1.9 9.7 3.1 4.6 6.9 10.8
6.9 2.6 7.5 6.9 9.5 7.8 8.4 8.3 9.4 8.8
④两个年级这20天每日餐余重量的平均数、中位数、众数如表:
年级
平均数
中位数
众数
高一
6.4
7.0
高二
6.6
7.2
根据以上信息,回答下列问题:
(1)写出表中的值;
(2)结合上表,在两个年级中,“文明用餐,减少浪费”做得较好的年级是______;理由是______.
(3)结合我们学校高一高二年级每日餐余重量的样本数据,估计我们学校三个年级一年(按240个工作日计算,假设每个年级人数相同)的餐余总重量.
【答案】(1)6.8,6.9
(2)高一,平均数和中位数均较小
(3)4680
【分析】(1)根据中位数和众数的定义求解即可;
(2)比较两个年级的中位数和平均数即可;
(3)直接根据两个年级的平均数计算即可.
【详解】(1)根据频率分布直方图,高一年级前3组(、、)的天数分别为1、2、5,共天,
第4组()的数是6.1、6.6、7.0、7.0、7.0、7.8,共6天,
高一年级调研数据的中位数为第10个数和第11个数和的一半,
故中位数,
高二年级20个工作日的餐余重量出现次数最多的是6.9,共出现4次,故众数是6.9,即.
(2)从中位数、平均数上看,高一年级的中位数较小,平均数也较小,说明浪费的少,因此,做得较好的是高一年级.
(3)考虑两个年级整体的平均值为(千克),
则三个年级一年的餐余总重量为(千克).
【考点12:方差、标准差的计算】
1.(2026·湖北武汉·三模)记样本数据1,2,2,2,3的方差为,样本数据3,5,5,5,7的方差为,则( )
A. B. C. D.
【答案】C
【详解】样本数据1,2,2,2,3的均值为,
则,
样本数据3,5,5,5,7的均值为,
则,
所以.
2.(25-26高二下·上海·阶段检测)现有甲、乙两组数据,甲组数据有5个数,其平均数为9,方差为8;乙组数据有10个数,其平均数为6,方差为2.若将这两组数据混合成一组,则新的数据的方差为________.
【答案】6
【分析】计算混合数据的平均数,计算混合数据的方差.
【详解】设甲组数据为,乙组数据为,
甲组平均数,乙组平均数,
混合后的平均数:,
甲组方差, 乙组方差,
,
.
3.(2026·福建福州·模拟预测)已知样本数据,,…,的平均数为6,方差为9.前五个数据,,,,的平均数7,方差为6,则后十个数据,,…,的方差是__________.
【答案】
【详解】由题意得,,,
,,
则,,,
,
则,
则,
故后十个数据,,…,的方差是
4.(25-26高一下·浙江金华·阶段检测)学校对高一学生期中考试的数学成绩进行调查,现抽取100人进行数据统计,绘制频率分布直方图如下,
(1)求的值和该组数据的中位数:
(2)若这100人中有女生40人,且男生平均分106,方差为16;女生平均分101,方差为36,求这100人的数学平均分和方差.
【答案】(1),
(2),
【详解】(1),
,,
所以中位数在区间内,故.
(2),.
所以这100人的数学平均分为,方差为.
5.(25-26高二下·上海闵行·期中)为了了解某校高三年级学生的体育成绩,随机选取100名学生参加考核,将考核的成绩(满分100分,成绩均为不低于40分的整数)分成六组:、、、、、,得到如图所示的频率分布直方图.
(1)在考核成绩为、、的三组学生中,用分层抽样的方法抽取13人,则考核成绩在中的学生应抽取多少人?
(2)若落在学生的平均成绩是54.4,方差是5.2,落在学生的平均成绩为66.4,方差是9.2,求这两组学生成绩的平均数和方差.(结果精确到0.1)
【答案】(1)
(2)平均数为,方差为
【分析】(1)先利用频率之和为结合频率分布直方图列式求出,再利用频率分布直方图求出成绩为,,的学生人数,再根据分层抽样的概念求解即可;
(2)先利用频率分布直方图求出和的学生人数,再根据平均数和方差公式计算求解即可.
【详解】(1)由频率分布直方图可得,解得,
则样本考核成绩在,,的三组学生有(人),
其中样本考核成绩在的学生人数为,
所以用分层抽样的方法应从考核成绩在的学生中抽取(人).
(2)由频率分布直方图知,
成绩在的学生人数为,
成绩在的学生人数为,
所以这两组学生成绩的平均数为,
所以这两组学生成绩的总方差为.
【考点13:用方差、标准差的代表意义解决实际问题】
1.(25-26高一上·陕西渭南·期末)澄城县统计局对两所高中高一学生的月考数学成绩进行抽样分析,得到如下数据:
甲校:85,88,90,92,95
乙校:80,85,90,95,100
(1)分别计算两校样本的平均数、极差和方差;
(2)若以“成绩稳定且优秀”为标准,哪所学校表现更好?说明理由.
【答案】(1)甲:均值90,极差10,方差;乙:均值90,极差20,方差50;
(2)甲校方差小,成绩更稳定,表现更好.
【分析】(1)根据两个学校的数据,分别代入平均数,极差,方差公式,即可求解;
(2)根据平均数和方差的大小,判断哪所学校表现更好.
【详解】(1)甲校的平均数,极差为,
方差为,
乙校的平均数,极差为,
方差为.
(2)两个学校的平均水平一样,但甲校的方差小,所以甲校的成绩更稳定,表现更好.
2.(25-26高一下·宁夏银川·期中)在某中学举办的“校园好声音”歌手决赛中,由8名专业人士和8名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分:
小组:86 86 87 90 91 93 93 94
小组:69 84 90 91 92 93 94 99
(1)分别求两组评委打分的平均分;
(2)判断小组A和小组B中哪一个更像是由专业人士组成,根据所学的统计知识,说明理由.
【答案】(1)90,89;
(2)组更像,理由见解析
【分析】(1)根据平均数的定义计算即可求解;
(2)分别求出两组的方差,比较大小,结合方差的表示意义即可下结论.
【详解】(1)记小组的数据依次为,小组的数据依次为,,
由题意可得:每组的平均数分别为:,.
(2)组更像是由专业人士组成,理由如下:
两组的方差分别为:,.
由于专业人士给分更符合专业规则,相似程度更高,,,
因而,根据方差越大数据波动越大,因此组更像是由专业人士组成的.
3.(25-26高一下·甘肃武威·阶段检测)在篮球选修课上,男、女生各有5名编号为的学生进行投篮练习,每人投10次,投中的次数如图所示,试根据折线图通过计算比较本次投篮练习中男、女生的投篮水平,
(1)求男、女生投篮命中数的极差和平均数
(2)求男、女生投篮命中数的方差并判断谁的命中数更稳定.
【答案】(1)男生投篮命中数的极差和平均数分别为,女生投篮命中数的极差和平均数分别为
(2)男、女生投篮命中数的方差分别为,女生的命中数更稳定
【分析】(1)利用极差公式和平均数公式即可求出答案;
(2)利用方差公式即可求出男、女生投篮命中数的方差,根据方差越小越稳定即可进行判断.
【详解】(1)男生投篮命中数最大值为,最小值为,
所以男生投篮命中数的极差为,
男生投篮命中数的平均数为,
女生投篮命中数最大值为,最小值为,
所以女生投篮命中数的极差为,
女生投篮命中数的平均数为.
(2)男生投篮命中数的方差,
女生投篮命中数的方差为,
因为,所以女生命中数更稳定.
4.(25-26高一下·全国·单元测试)某学校高一(1)、(2)班各有49名学生,两班在一次数学测验中的成绩统计如下表.
(1)请你对下面的一段话给予简要分析.
高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”
平均分
众数
中位数
标准差
(1)班
79
70
87
19.8
(2)班
79
70
79
5.2
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
【答案】(1)答案见解析
(2)答案见解析
【分析】(1)根据中位数的数值特征即可求解.
(2)分别从中位数、平均分及标准差的意义进行分析即可.
【详解】(1)由于(1)班49名学生数学测验成绩的中位数是87,则85分排在全班第25名之后,
从位次上看,不能说85分是上游,该成绩应该属于中游,
但是我们不能以位次来判断学习的好坏,小刚得了85分,
说明他对这段时间的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.
(2)(1)班成绩的中位数是87分,说明高于87分(含87分)的人数占一半以上,
而平均分为79分,标准差又很大,说明低分也很多,两极分化严重,建议加强对学习困难的学生的帮助;
(2)班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,
学习很差的学生少,学习优异的学生也很少,建议采取措施提高优秀率.
5.(2026高一·全国·专题练习)甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示.
(1)填写下表:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从三个不同的角度对这次测试进行分析;
①由平均数和方差结合分析谁的成绩更稳定;
②由平均数和中位数结合分析谁的成绩好些;
③由折线图上两人射击命中环数及走势分析谁更有潜力.
【答案】(1)
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲的成绩更稳定;②乙射靶成绩比甲好;③乙更有潜力
【分析】(1)根据图中数据,分别求出乙的平均数、中位数和甲的中位数,即可完成表格.
(2)根据方差、中位数的意义及折线图的走势,分析即可得答案.
【详解】(1)由题图可知,乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,
所以.
乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是.
甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.
于是填充后的表格如下表所示:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲、乙的平均数相同,均为7,但,
说明甲偏离平均数的程度小,而乙偏离平均数的程度大,故甲的成绩更稳定.
②甲、乙的平均水平相同,而乙的中位数比甲大,
故从平均数和中位数的角度分析乙射靶成绩比甲好.
③从折线图可以看出乙的成绩有明显进步,甲的较为稳定,所以乙更有潜力.
第 1 页 共 15 页
学科网(北京)股份有限公司
$
专题9.2 用样本估计总体
【知识梳理】 1
【考点1:绘制或补全频率分布直方图】 3
【考点2:由频率分布直方图计算频率、频数、样本容量、总体容量】 8
【考点3:频率分布直方图的实际应用】 10
【考点4:其他统计图及其实际应用】 13
【考点5:总体百分位数的估计】 16
【考点6:众数的计算】 17
【考点7:用众数的代表意义解决实际问题】 18
【考点8:中位数的计算】 21
【考点9:用中位数的代表意义解决实际问题】 22
【考点10:平均数的计算】 25
【考点11:用平均数的代表意义解决实际问题】 27
【考点12:方差、标准差的计算】 31
【考点13:用方差、标准差的代表意义解决实际问题】 33
【知识梳理】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
3.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
4.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平
均
数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中
位
数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众
数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
5.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差
.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中出
现的频数为,则总体方差为.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
6.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【考点1:绘制或补全频率分布直方图】
1.(25-26高二下·云南昆明·阶段检测)为调查社区居民对社区工作的满意度,在社区内抽取200名居民进行问卷调查,将收集到的数据分成五组,绘制出以下频率分布直方图,若的频率为0.48,,的值为( )
A.0.017,0.048 B.0.017,0.48 C.0.17,0.048 D.0.17,0.48
2.(25-26高二·上海·课堂例题)某校30名高一女生的扔手球记录如下(单位:m):
16.3
13.2
17.7
14.3
16.4
19.8
13.5
14.5
11.7
14.1
14.8
17.2
13.8
15.4
16.3
15.7
18.5
16.8
17.9
15.9
17.6
15.4
16.8
21.4
16.5
18.1
16.0
20.3
16.6
19.5
(1)选择适当的组距,制作一张频率分布表;
(2)在(1)的基础上,绘制一幅频率分布直方图.
3.(25-26高一上·全国·课堂例题)某学校为了了解和掌握学生的期末数学成绩的情况,随机地取出了100名考生的数学成绩(单位:分),数据如下:
135 98 102 110 99 121 110 96
100 103 125 97 117 113 110 92
102 109 104 112 105 124 87 131
97 102 123 104 104 128 109 123
111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117
104 109 111 89 110 121 80 120
121 104 108 118 129 99 90 99
121 123 107 111 91 100 99 101
116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97
126 108 123 119 98 121 101 113
102 103 104 108
(1)列出频率分布表;
(2)画出频率分布直方图.
4.(2026高三·全国·专题练习)某地抽样调查30个家庭的人均月收入,得到如下数据(单位:元):
4040 4440 5560 4300 3800 4200 5000 4300 4200 3840
4200 4040 4240 3400 4240 4120 3880 4720 3580 4760
3760 3960 4280 4440 3660 4360 3640 4380 3300 4260
(1)取组距为600,起点为3200,列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计人均月收入在的家庭所占的百分比.
5.(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
【考点2:由频率分布直方图计算频率、频数、样本容量、总体容量】
1.(2026·云南玉溪·二模)为调查社区居民对社区工作的满意度,在社区内抽取名居民进行问卷调查,将收集到的数据分成五组,绘制出如下频率分布直方图,若的频率为,的值为( )
A., B., C., D.,
2.(2026·吉林长春·二模)某精密仪器厂生产一种标准长度为的金属垫片.现随机抽取200个垫片测量其实际长度(单位:),按长度分组并绘制出如图所示的频率分布直方图.若规定长度在区间内的垫片为合格品,用样本频率估计总体的概率,则任取一个垫片为合格品的概率为( )
A.0.3 B.0.4 C.0.5 D.0.6
3.(25-26高三下·青海西宁·阶段检测)一农庄的某种水果成熟后,质地较好的水果的重量在80~120g间,现随机抽查100个这种水果,将其质量(单位:g)分组为,,,,,,,,并绘制出频率分布直方图如图,则这100个水果质量在区间(单位:g)内的个数为( )
A.66 B.68 C.70 D.72
4.(多选)(2026·河北张家口·二模)(多选)从工厂生产的零件中随机抽出100个,测量其直径(单位:),将所得数据分为5组:,并整理得到频率分布直方图如图,记这100个零件的直径的中位数为,平均数为,极差为,众数为,则( )
A. B.
C. D.
5.(2026·江西新余·二模)在某高校举行的一次国际学术与文化交流会上,对外国留学生举行了“中华文化知多少”的知识竞赛.某数学兴趣小组从中随机抽取部分学生的成绩,整理后分成五段:,绘制了如下的频率分布直方图.
(1)求的值;
(2)若参赛学生共有2000名,估计其中成绩小于70分的人数;
【考点3:频率分布直方图的实际应用】
1.(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
2.(25-26高一下·全国·单元测试)某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是,样本数据分组为,,,,.
(1)频率分布直方图中的值为____________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1200名,估计新生中可以申请住校的学生有____________名.
3.(2026高一上·全国·专题练习)南昌某种植园在香瓜成熟时,随机从一些香瓜藤上摘下100个香瓜,称得其质量(单位:克)分别在,,,,中,经统计绘制频率分布直方图如图所示:
(1)在样本中,用分层随机抽样的方法从质量在中的香瓜中随机抽取了n个香瓜,其中质量在中的香瓜有6个,求n的值.
(2)某个体经销商来收购香瓜,同一组中的数据以这组数据所在区间的中点值作代表,用样本估计总体,该种植园中大概共有香瓜20000个,经销商提出以下两种收购方案,方案①:所有香瓜以5元/500克收购;方案②:对质量低于350克的香瓜以3元/个收购,对质量高于或等于350克的香瓜以5元/个收购.请分别计算两种方案该种植园获得的收入,并说明种植园选择哪种方案收入更多.
4.(24-25高一下·内蒙古鄂尔多斯·期末)为了了解小学生的体能情况,某机构抽取了某校部分学生进行一分钟跳绳次数测试,将取得数据整理后,画出频率分布直方图(如图)(每个分组包括左端点,不包括右端点).已知图中从左到右前三个小组频率分别为0.15,0.3,0.4,第一小组的频数为9.
(1)求第四小组的频率;
(2)参加这次测试的学生有多少人?
(3)若次数在60次以上(含60次)为达标,试估计该年级学生跳绳测试的达标率是多少.
5.(25-26高二下·重庆·期中)某大学数学专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,,…,,并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于60的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中女生的人数.
【考点4:其他统计图及其实际应用】
1.(2026·陕西榆林·模拟预测)某同学收集并整理了某市年月日至日每日最高气温(单位:)的数据(均为整数),并绘制了如图所示的折线图,则月日至日最高气温的中位数为( )
A. B. C. D.
2.(2026·河南平顶山·模拟预测)年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
3.(多选)(24-25高一下·广东佛山·期末)(多选)广东某高校为传承粤语文化,举办了主题为“粤唱粤美好”的校园粤语歌手比赛在比赛中,由A,B两个评委小组(各9人)给参赛选手打分.根据两个评委小组对同一名选手的打分绘制成如图所示折线图,则下列说法正确的是( )
A.A组打分的众数为47 B.B组打分的中位数为75
C.A组的意见相对一致 D.B组打分的均值小于A组打分的均值
4.(多选)(24-25高二下·湖北孝感·期末)(多选)双峰山景区提档升级后,游客人数猛增.管委会为了解游客人数的变化规律,提高.旅游服务质量,收集并整理了2018年1月至2020年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论正确的是( )
A.年接待游客量逐年增加
B.各年的月接待游客量高峰期大致在8月
C.2018年1月至12月月接待游客量的中位数为30
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
5.(25-26高一上·黑龙江哈尔滨·开学考试)某校为了解九年级学生近两个月“推荐书目”的阅读情况,随机抽取了该年级的部分学生,调查了他们每人“推荐书目”的阅读本数,设每名学生的阅读本数为n,并按以下规定分为四档:当时,为“偏少”;当时,为“一般”;当时,为“良好”;当时,为“优秀”,现将调查结果统计后绘制成不完整的统计图表:
阅读本数(本)
1
2
3
4
5
6
7
8
9
人数(名)
1
2
6
7
12
7
y
1
请根据以上信息回答下列问题:
(1)求出本次随机抽取的学生总人数;
(2)分别求出统计表中的的值;
(3)估计该校九年级400名学生中为“优秀”档次的人数.
【考点5:总体百分位数的估计】
1.(25-26高二下·上海·阶段检测)样本数据:1,1,2,2,3,3,4,4,5,5,6的第75百分位数为________.
2.(2026·上海·三模)小明连续记录了7天自己每天花在课外阅读上的时间(单位:min),分别为70,42,54,90,55,47,58,则这组数据的第60百分位数是__________.
3.(2026·福建泉州·模拟预测)某校从高中部抽出100名学生参加AI基础知识竞赛,由成绩得到如图的频率分布直方图,则估计这100名学生成绩的48%分位数为__________分.
4.(25-26高三·全国·一轮复习)为纪念中国人民抗日战争暨世界反法西斯战争胜利80周年,某地面向全体中学生开展了以“铭记历史、缅怀先烈、珍爱和平、开创未来”为主题的知识竞赛活动.现从中随机抽取了100名学生的成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则估计这组数据的第85百分位数为( )
A.85 B.86 C.86.5 D.87
5.(2026·贵州安顺·模拟预测)下表为“2016-2025年某地区数字经济总体规模”相关数据(其中市场规模是逐年递增的).
年份
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
市场规模/万亿元
22.6
27.2
31.3
35.8
39.2
45.5
50.2
63.2
70.8
由于不小心,2023年的市场规模数据被污染了,但知道表中数据的第40百分位数与上四分位数之和为93.6,则2023年的市场规模数据为( )
A.54.5 B.56.1 C.57.9 D.60.8
【考点6:众数的计算】
1.(25-26高一下·甘肃武威·阶段检测)倡导中小学生学习践行“富强、民主、文明、和谐;自由、平等、公正、法治;爱国、敬业、诚信、友善”社会主义核心价值观这24个字,其中含有12组词,每组词的笔画数的和依次为,则这12个笔画数的众数是( )
A.17 B.16 C.1 D.24
2.(2026·湖南·三模)一组数据为50,40,20,19,16,16,14,10,则这组数据的众数与第60百分位数之和为( )
A.40 B.39 C.36 D.35
3.(2026高二上·山东枣庄·学业考试)如图是某地100户居民的月均用水量的频率分布直方图,估计众数与中位数分别是( )
A. B. C. D.
4.(多选)(2026高三·全国·专题练习)(多选)(多选)某班进行了一次数学测试,全班学生的成绩都落在区间内,其成绩的频率分布直方图如图所示,则该班学生这次数学测试成绩的中位数和众数的估计值为( )
A.81.5 B.75 C.81.25 D.85
5.(2026高二下·湖南郴州·学业考试)如图是位居民月均用水量的频率分布直方图,并据此回答下列问题.
(1)月均用水量在范围内的居民有多少人?
(2)请估计居民月均用水量的众数;
(3)请估计居民月均用水量大于等于的概率.
【考点7:用众数的代表意义解决实际问题】
1.(24-25高一下·广西来宾·期末)抽样调查了某班30位女生所穿鞋子的尺码,数据如下(单位:码).在这组数据的平均数、中位数、众数和方差中,鞋厂最感兴趣的是( )
鞋码号
33
34
35
36
37
人数
2
6
20
1
1
A.平均数 B.中位数 C.众数 D.方差
2.(2026高一下·全国·专题练习)某鞋店试销一种新款女鞋,销售情况如下表:
码号
34
35
36
37
38
39
40
41
数量/双
2
5
9
16
9
5
3
2
如果你是鞋店经理,最关心的是哪种码号的鞋销量最大,那么对你来说最重要的是________(填“平均数”“众数”或“中位数”).
3.(2026高二下·辽宁·学业考试)为庆祝中国共产主义青年团成立100周年,某班级准备利用暑假进行“请党放心,强国有我”为主题的研学旅行.为了便于识别,该班级准备定做一批容量一致的双肩包.为此,班级负责人征求班内同学的意向,得到如下数据:为了照顾到绝大多数人的需求,则应该定做双肩包的容量为______.
容量
23
25
27
29
31
33
频数
3
4
5
26
3
2
4.(25-26高一·全国·课后作业)某轮胎厂为检验轮胎的使用寿命,抽取一个容量为24的样本,测得结果如下表:
使用寿命/km
轮胎数
95000
1
88000
1
56000
6
48000
8
40000
8
为了说明该厂生产的轮胎的平均寿命,选用哪个代表值最合适?为什么?
5.(2026高一下·全国·专题练习)某校开展了以“了解传统习俗,弘扬民族文化”为主题的实践活动,某实践小组就“是否知道中秋节的来由”这个问题,随机抽取部分学生进行了一次问卷调查,并对收集到的信息进行了统计,得到了下面两个尚不完整的统计图表,请你根据统计图表中所提供的信息解答下列问题:
调查情况
频数
频率
非常了解
0.10
了解
140
0.70
基本了解
0.18
不了解
4
0.02
合计
200
1.00
(1)此次问卷调查采用的是________方法(填“全面调查”或“抽样调查”),抽取的样本量是________.
(2)如果要对“是否知道中秋节的来由”这个问题作出合理判断,最应关注的数据是________(填“中位数”“众数”或“方差”).
(3)样本中对“中秋节的来由”非常了解的人数是________,基本了解的人数是________.
(4)补全上面的条形图.
【考点8:中位数的计算】
1.(2026·上海普陀·二模)根据中国汽车工业协会发布的数据,年月至年月,我国新能源汽车月度销量(单位:万辆)为:,则这个月新能源汽车销量的中位数为______万辆.
2.(25-26高一下·安徽阜阳·阶段检测)已知一组数据12,10,8,15,6,8,这组数据的中位数是( )
A.8 B.9 C.10 D.12
3.(24-25高一下·黑龙江牡丹江·期末)某校开展“正心立德,劳动树人”主题教育活动,对参赛的 100名学生的劳动作品的得分情况进行统计, 并绘制了如图所示的频率分布直方图, 根据图中信息,这组数据中位数的估计值为 ( )
A.70 B.77 C.80 D.82
4.(24-25高二上·四川·期末)将一次学校数学模拟竞赛的成绩统计如下图所示,记本次模拟竞赛的成绩的中位数为,则( )
A. B. C.75 D.
5.(2026·天津红桥·二模)为了保证驾乘人员的安全,某市要对该市出租车司机的年龄进行调查,现从中随机抽出名司机,已知抽到的司机年龄都在岁,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )
A.岁 B.岁 C.岁 D.岁
【考点9:用中位数的代表意义解决实际问题】
1.(25-26高三上·广东·开学考试)某公司购入了400根钢管拟切割打磨为其他产品,统计钢管口径后得以下频数分布表:
钢管口径
11.0
12.5
14.0
16.5
18.5
20.5
21.0
22.0
频数
26
74
100
40
46
52
38
24
则这批钢管口径的中位数为( )
A.14.00cm B.15.25cm C.16.25cm D.16.50cm
2.(多选)(2026·福建福州·模拟预测)(多选)近日,国家发展改革委等部门联合印发《完善碳排放统计核算体系工作方案》,指出要在2025年全面建立碳排放年报、快报制度,完善碳排放统计核算体系.专家在甲、乙、丙、丁四地2024年第4季度的周快报数据中随机抽取7周数据进行分析,整理出四地这7周各周内碳排放量超过的天数的数据特征:
地区
甲
乙
丙
丁
数据特征
中位数
3
中位数
1
均值
3
均值
2
众数
2
均值
<1
众数
4
方差
2
根据规定,若这7周中每周内碳排放量超过的天数都不多于5天,则可称该地区为低碳生态区.分析数据,四个地区中能判定为低碳生态区的是( )
A.甲地 B.乙地 C.丙地 D.丁地
3.(2026高一·全国·专题练习)某公司为了了解一年内的用水情况,抽取了10天的用水量如下表所示:
用水量/t
22
38
40
41
44
50
95
天数
1
1
1
2
2
1
2
(1)在这10天中,该公司用水量的平均数是多少?每天用水量的中位数是多少?
(2)你认为应该用平均数和中位数中的哪一个来描述该公司每天的用水量?
4.(25-26高一·全国·课堂例题)下面的说法是否恰当?为什么?
(1)5人中有4名学生,1名教师,其中3名学生16岁,1名学生18岁,1名教师59岁,用他们的平均年龄25岁作为他们年龄的代表值.
(2)某服装店生产一种男式运动衫,店里决定用顾客购买的这种运动衫尺码的平均数作为生产的标准尺码(即生产的这种运动衫中大多数为该尺码).
(3)在一次满分为30分的小测试中,某小组的成绩是5个20分,3个26分,1个29分.采用中位数20作为这组数据的代表值.
5.(25-26高二下·贵州遵义·月考)2022年起,某省将实行“”高考模式,为让学生适应新高考的赋分模式,某校在一次校考中使用赋分制给高三年级学生的生物成绩进行赋分,具体赋分方案如下:先按照考生原始分从高到低按比例划定、共五个等级,然后在相应赋分区间内利用转换公式进行赋分,等级排名占比,赋分分数区间是;B等级排名占比,赋分分数区间是71-85:等级排名占比,赋分分数区间是56-70:等级排名占比,赋分分数区间是41-55;等级排名占比,赋分分数区间是30-40;现从全年级的生物成绩中随机抽取100名学生的原始成绩(未赋分)进行分析,其频率分布直方图如图所示:
(1)求图中的值及这100名学生的原始成绩的中位数(中位数结果保留两位小数);
(2)用样本估计总体的方法,估计该校本次生物成绩原始分至少多少分才能达到赋分后的等级及以上(含等级)?(第(2)问结果保留整数)
【考点10:平均数的计算】
1.(25-26高三下·山西太原·阶段检测)已知数据,,…,的平均数为4,将该组数据中的每个数据均变为原来的两倍,其平均数为,则( )
A.16 B.8 C.4 D.2
2.(多选)(2026·甘肃嘉峪关·三模)(多选)为评估某款“端侧AI芯片”在不同模型架构下的推理延迟表现,研发团队在固定输入长度()的条件下,对200个公开的深度学习模型进行了单次推理延迟测试(单位:).测试结果经异常值剔除后,得到如图所示的频率分布直方图,其中分组区间为,,,,,则下列结论正确的是( )
A.样本中延迟在内的模型个数为60
B.估计样本的中位数落在区间内
C.估计样本的平均数约为
D.该分布呈现出右边“拖尾”形态,说明大部分模型的延迟时间较短
3.(25-26高二下·重庆·期中)先后抛掷一枚质地均匀的骰子次,记录向上一面的点数,若已知个点数的中位数为,唯一的众数为,则平均数最大为_____.
4.(2026·湖南长沙·模拟预测)某公司为了了解本公司职员的午餐费用情况,抽样调查了100位职员的午餐日平均费用(单位:元),得到如下图所示的频率分布直方图,图中标注a的数字模糊不清.
(1)试根据频率分布直方图求a的值,并估计该公司职员午餐日平均费用的众数和平均数;
(2)已知该公司有1000名职员,试估计该公司有多少职员午餐日平均费用不超过6元?
5.(25-26高一下·甘肃兰州·期中)某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
【考点11:用平均数的代表意义解决实际问题】
1.(25-26高一上·陕西咸阳·开学考试)某公司打算招聘一名职员.对甲、乙、丙三名应聘者进行了综合知识、工作经验、语言表达三方面的测试,他们的各项成绩如下表所示:
项目
应聘者
综合知识
工作经验
语言表达
甲
75
80
80
乙
85
80
70
丙
70
78
70
如果将每位应聘者的综合知识、工作经验、语言表达的成绩按5:2:3的比例计算其总成绩,并录用总成绩最高的应聘者,则被录用的是___________.
2.(25-26高一下·全国·课后作业)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲
27
38
30
37
35
31
乙
35
29
40
34
30
36
分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?
3.(25-26高三·全国·一轮复习)某校欲招聘一名数学教师,学校对甲、乙、丙三位候选人进行了三项能力测试,各项测试成绩满分均为100分,根据结果择优录用.三位候选人的各项测试成绩如下表所示:
测试项目
测试成绩
甲
乙
丙
教学能力
85
73
73
科研能力
70
71
65
组织能力
64
72
84
(1)如果根据三项测试的平均成绩,谁将被录用,说明理由;
(2)根据实际需要,学校将教学、科研和组织三项能力测试得分按5∶3∶2的比例确定每人的成绩,谁将被录用,说明理由.
4.(25-26高一下·浙江温州·期中)学校正在研究基于DeepSeek的人工智能答疑系统,更方便地帮助学生解决学习中碰到的问题.学校为了测试答疑系统是否准确,于是利用DeepSeek解答了50份不同的模拟试卷,收集其准确率,整理得到如下频率分布直方图.
(1)求图中的值及这组数据的中位数;
(2)若平均准确率不低于90%,则可以认为这个系统是准确的,并投入使用.请问,现在这个系统能否投入使用,并说明理由.
5.(25-26高一上·湖北十堰·自主招生)郧阳中学倡导学生“文明用餐,减少浪费”,为了解午餐的浪费情况,对高一高二年级在工作日(周一到周五)进行了连续四周的调查,得到这两个年级每天午餐浪费饭菜的重量,以下简称“每日餐余重量”(单位:千克),并对这些数据进行了整理、描述和分析.下面给出了部分信息:
①高一年级每日餐余重量的频数分布直方图如图(数据分成6组:,,,):
②高一年级每日餐余重量在这一组的是:6.1 6.6 7.0 7.0 7.0 7.8
③高二年级每日餐余重量如下:
1.4 2.8 6.9 7.8 1.9 9.7 3.1 4.6 6.9 10.8
6.9 2.6 7.5 6.9 9.5 7.8 8.4 8.3 9.4 8.8
④两个年级这20天每日餐余重量的平均数、中位数、众数如表:
年级
平均数
中位数
众数
高一
6.4
7.0
高二
6.6
7.2
根据以上信息,回答下列问题:
(1)写出表中的值;
(2)结合上表,在两个年级中,“文明用餐,减少浪费”做得较好的年级是______;理由是______.
(3)结合我们学校高一高二年级每日餐余重量的样本数据,估计我们学校三个年级一年(按240个工作日计算,假设每个年级人数相同)的餐余总重量.
【考点12:方差、标准差的计算】
1.(2026·湖北武汉·三模)记样本数据1,2,2,2,3的方差为,样本数据3,5,5,5,7的方差为,则( )
A. B. C. D.
2.(25-26高二下·上海·阶段检测)现有甲、乙两组数据,甲组数据有5个数,其平均数为9,方差为8;乙组数据有10个数,其平均数为6,方差为2.若将这两组数据混合成一组,则新的数据的方差为________.
3.(2026·福建福州·模拟预测)已知样本数据,,…,的平均数为6,方差为9.前五个数据,,,,的平均数7,方差为6,则后十个数据,,…,的方差是__________.
4.(25-26高一下·浙江金华·阶段检测)学校对高一学生期中考试的数学成绩进行调查,现抽取100人进行数据统计,绘制频率分布直方图如下,
(1)求的值和该组数据的中位数:
(2)若这100人中有女生40人,且男生平均分106,方差为16;女生平均分101,方差为36,求这100人的数学平均分和方差.
5.(25-26高二下·上海闵行·期中)为了了解某校高三年级学生的体育成绩,随机选取100名学生参加考核,将考核的成绩(满分100分,成绩均为不低于40分的整数)分成六组:、、、、、,得到如图所示的频率分布直方图.
(1)在考核成绩为、、的三组学生中,用分层抽样的方法抽取13人,则考核成绩在中的学生应抽取多少人?
(2)若落在学生的平均成绩是54.4,方差是5.2,落在学生的平均成绩为66.4,方差是9.2,求这两组学生成绩的平均数和方差.(结果精确到0.1)
【考点13:用方差、标准差的代表意义解决实际问题】
1.(25-26高一上·陕西渭南·期末)澄城县统计局对两所高中高一学生的月考数学成绩进行抽样分析,得到如下数据:
甲校:85,88,90,92,95
乙校:80,85,90,95,100
(1)分别计算两校样本的平均数、极差和方差;
(2)若以“成绩稳定且优秀”为标准,哪所学校表现更好?说明理由.
2.(25-26高一下·宁夏银川·期中)在某中学举办的“校园好声音”歌手决赛中,由8名专业人士和8名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分:
小组:86 86 87 90 91 93 93 94
小组:69 84 90 91 92 93 94 99
(1)分别求两组评委打分的平均分;
(2)判断小组A和小组B中哪一个更像是由专业人士组成,根据所学的统计知识,说明理由.
3.(25-26高一下·甘肃武威·阶段检测)在篮球选修课上,男、女生各有5名编号为的学生进行投篮练习,每人投10次,投中的次数如图所示,试根据折线图通过计算比较本次投篮练习中男、女生的投篮水平,
(1)求男、女生投篮命中数的极差和平均数
(2)求男、女生投篮命中数的方差并判断谁的命中数更稳定.
4.(25-26高一下·全国·单元测试)某学校高一(1)、(2)班各有49名学生,两班在一次数学测验中的成绩统计如下表.
(1)请你对下面的一段话给予简要分析.
高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”
平均分
众数
中位数
标准差
(1)班
79
70
87
19.8
(2)班
79
70
79
5.2
(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.
5.(2026高一·全国·专题练习)甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示.
(1)填写下表:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从三个不同的角度对这次测试进行分析;
①由平均数和方差结合分析谁的成绩更稳定;
②由平均数和中位数结合分析谁的成绩好些;
③由折线图上两人射击命中环数及走势分析谁更有潜力.
第 1 页 共 15 页
学科网(北京)股份有限公司
$