内容正文:
考点21 用样本估计总体
考点一:频率分布直方图
1.画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差);
第2步:决定组距与组数;
第3步:将数据分组;
第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
考点二:数字特征
①众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
②极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
③性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
考点三:百分位数
1.定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2.计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
题型一:统计图与实际问题
先读懂图表类型(频率分布直方图、柱状图等),提取组距、频率、频数、总量等关键数据,明确图表横轴与纵轴含义。再将实际问题转化为频率、频数、占比计算,按题目要求求比例、估计人数或做合理判断。
答题时紧扣图表信息,不额外添加条件,用频率=频数/总数、频数=频率×总数两个核心公式求解,结果保留题目要求的精度。
【例1】某小商品生产企业对2025年1月到11月甲,乙两个车间的产量(单位:百万件)进行了统计,得到如图所示的折线图,则( )
A.乙车间产量的中位数为6月份的产量
B.甲车间产量的极差大于乙车间产量的极差
C.甲车间产量的平均值小于乙车间产量的平均值
D.甲车间产量的第80百分位数大于乙车间产量的第80百分位数
【答案】D
【详解】一共11个月的产量数据,中位数是将产量从小到大排序后的第个数据,
对乙车间产量排序后,第6个数据是月份的产量,不是6月份,A错误;
甲车间产量极差约为,乙车间产量极差约为,甲的极差小于乙的极差,B错误;
观察折线图,除9月、10月外,其余月份甲车间产量均高于乙车间,整体估算可得甲产量平均值大于乙的平均值,C错误;
第80百分位数为,根据百分位数计算可知第80百分位数是排序后的第9个数据,
从小到大排序后,甲的第9个数据约为3.85,乙的第9个数据约为3.6,甲的第80百分位数大于乙,D正确.
【例2】某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中正确的是( )
A.丁险种参保人数超过六成 B.41岁以上参保人数超过总参保人数的五成
C.54周岁以上人群参保的总费用最少 D.人均参保费用不超过5000元
【答案】D
【详解】对于A,由条形图可知丁险种参保比例为,故A错误;
对于B,由扇形图可知,41岁以上参保人数占比为,故B错误;
对于C,由扇形图与折线图可知18-29周岁人群参保人数占比,人均参保费用在元,
而54岁及以上人群参保比例虽只占,但人均参保费用为6000元,所以18-29周岁人群参保的总费用最少,故C错误;
对于D,由扇形图与折线图可知,人均参保费用约,故D正确.
【变式1-1】下图是2010—2020年这11年我国考研人数统计图,则关于这11年考研人数下列说法正确的是( ).
A.2010年以来我国考研报名人数逐年增多
B.这11年来考研报名人数的极差超过260万人
C.2015年是这11年来报考人数最少的一年
D.2015年的报录比最低,2020年的报录比最高
【答案】D
【详解】选项A,观察柱状图,2014年报考人数少于2013年,2015年报考人数少于2014年,并非逐年增多,A错误;
选项B,由图可知:最小报考人数约为145万(2010年),最大报考人数约为330万(2020年),差值约为185万,小于260万,B错误;
选项C,由柱状图可知,报考人数最少的是2010年,不是2015年,C错误;
选项D,观察报录比的虚线点,2015年的报录比是11年中最低的,此后报录比持续上升,2020年报录比为最高, D正确.
【变式1-2】(多选)2020—2024年我国粮食产量(单位:万吨)如图所示,下列结论正确的是( )
A.2020—2024年我国粮食产量逐年增加
B.2020—2024年我国粮食产量的中位数为68653万吨
C.2020—2024年我国粮食产量的极差为3699万吨
D.2020—2024年我国粮食产量与年份负相关
【答案】AB
【详解】对于A选项,对比每年产量可得,
故年我国粮食产量逐年增加,A正确.
对于B选项,年我国粮食产量的中位数为万吨,B正确.
对于C选项,年我国粮食产量的极差为万吨,C错误.
对于D选项,年我国粮食产量与年份正相关,D错误.
【变式1-3】(多选)如图,这是全国年下半年商品零售额和餐饮收入同比增长速度图,则全国年下半年( )
A.商品零售额同比增长速度的极差为
B.商品零售额同比增长速度逐渐降低
C.餐饮收入同比增长速度的分位数为
D.餐饮收入同比增长速度的平均数小于
【答案】BC
【详解】商品零售额同比增长速度的极差为,故A错误;
由图象可知,商品零售额同比增长速度逐渐降低,故B正确;
餐饮收入升序排列为:,
,向上取整为第2个数,
餐饮收入同比增长速度的分位数为,故C正确;
,
餐饮收入同比增长速度的平均数大于,故D错误.
题型二:总体百分位数的估计
先将数据从小到大排序,计算i=n×p%,再按i是否为整数确定百分位数:非整数取比邻整数项,整数取第i项与第i+1项的平均数。遇到分组数据时,结合频率分布直方图用面积累计法定位。
计算时注意排序不能乱、比例不搞错,四分位数是25%、50%、75%分位数,直接按百分位数步骤计算即可,重点保证步骤规范、结果准确。
【例3】样本数据的第75百分位数是( )
A.7 B.8 C.9 D.10
【答案】C
【详解】这组样本数据共8个数,且从小到大排列为,
由可知,这组数据的第75百分位数是.
【例4】已知一组数据1,2,4,6,8,10,的上四分位数为,则的值可能是( )
A.3 B.5 C.7 D.9
【答案】D
【详解】依题意,,
故为该组数据按照从小到大排列后的第6个数,
则.
【变式2-1】某篮球运动员近8场比赛的得分从低到高依次为6,9,,,,,,,则这8个数据的上四分位数是____________.
【答案】/
【详解】数据升序排列为:6,9,,,,,,,
上四分位数的位置为,
位置为整数,取第项的平均值.
【变式2-2】已知班内7位同学的体重数据(单位:kg)由以下茎叶图(十位数字为茎,个位数字为叶)所示,则这组数据的第70百分位数是__________.
【答案】58
【详解】根据茎叶图,将7位同学的体重从小到大排列为:,
共个数据,则索引,
根据高中百分位数的计算规则,向上取整为,
即第个数据为所求,因此这组数据的第百分位数是.
【变式2-3】某校将学生分为5个队伍进行研学活动,这5个队伍的人数分别为:50,,55,45,.已知本次研学活动的总人数为250人,且各队人数的第40百分位数不小于48,则各队人数的第70百分位数的最大值是( )
A.51 B.52 C.53 D.54
【答案】D
【详解】由题意得,解得,
不妨设,则,而当时,,
此时从小到大的排列顺序为,45,50,55,,而,
故第40百分位数,矛盾,
当时,,此时从小到大的排列顺序为45,,50,,55,
此时,得,于是,
此时,可知第70百分位数是,故D正确.
题型三:平均数、众数、中位数的计算
原始数据直接计算:众数是出现次数最多的数,中位数是排序后中间位置的数,平均数是所有数据之和除以个数。偶数个数据时,中位数取中间两数的平均值,众数可能不唯一。
多组数据或表格题先统计频数,加权平均数用数据×频数求和再除以总数,计算时先排序再找中位数,避免因未排序导致结果错误。
【例5】已知一组数据的中位数为10,则该组数据的平均数为( )
A.7 B.8 C.9 D.10
【答案】C
【详解】由时,中位数,
由时,中位数,
而中位数为10,显然,
综上,且,可得,
所以数据的平均数为.
【例6】一组从小到大排列的数据:.若它们的第60百分位数比平均数大2,则的值为( )
A.10 B.11 C.12 D.13
【答案】A
【详解】,这5个数据的第60百分位数是第三个数据和第四个数据的平均数,
即,即有,解得.
【变式3-1】已知五个数的平均数为50,则这五个数的中位数为( )
A.45 B.47.5 C.50 D.52.5
【答案】C
【详解】由题意知,得,
若,则这五个数为45,50,50,50,55,中位数为50.
若,不妨设,则,又,所以这五个数的中位数仍是50.
【变式3-2】(多选)如图,这是某校写作兴趣小组25名同学暑假的课外阅读量(单位:本)的折线统计图,则( )
A.这25名同学暑假的课外阅读量的众数是4本
B.这25名同学暑假的课外阅读量的中位数是5本
C.这25名同学暑假的课外阅读量的平均数是4.4本
D.这25名同学暑假的课外阅读量的第80百分位数是6本
【答案】BCD
【详解】由图可得课外阅读量为本的同学有人,为本的同学有人,为本的同学有人,
为本的同学有人,为本的同学有人,为本的同学有人,为本的同学有人,
对于A,这25名同学暑假的课外阅读量的众数是5本,A错误;
对于B,将课外阅读量按照从小到大排列,第个数为,中位数是5本,B正确;
对于C,平均数是本,C正确;
对于D,,将课外阅读量按照从小到大排列,第个数为,第个数为,
所以这25名同学暑假的课外阅读量的第80百分位数是6本,D正确.
【变式3-3】一组按照从小到大排列的数据,其平均数为,则___________.
【答案】
【详解】由题意可得,
整理得,
故或,又,故.
题型四:频率分布直方图的绘制与应用
先按求极差→定组距与组数→分组→列表→画图五步完成绘制,纵轴必须是频率/组距,小矩形面积代表对应组的频率。解题时先算组距、频率、频数,利用所有矩形面积和为1求未知量,再结合频率公式进行计算或判断。
应用问题常考求某区间频率、频数或估计总体,先定位目标区间对应的矩形,用面积=频率计算,再用频数=总数×频率得到结果,注意单位与比例统一。
【例7】某校抽取100名学生测量他们的身高,其山最大值为,最小值,绘制身高频率分布直方图,若组距为5,且第一组下限为,则组数为__________.
【答案】7
【详解】,则组数为7.
故答案为:7.
【例8】下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):
区间界限
人数
5
8
10
22
33
区间界限
人数
20
11
6
5
(1)列出样本的频率分布表(频率保留两位小数);
(2)画出频率分布直方图;
(3)估计身高低于134cm的人数占总人数的百分比.
【答案】(1)答案见解析
(2)答案见解析
(3)
【分析】
【详解】(1)列出样本频率分布表:
分组
频数
频率
5
0.04
8
0.07
10
0.08
22
0.18
33
0.28
20
0.17
11
0.09
6
0.05
5
0.04
合计
120
1.00
(2)画出频率分布直方图,如图所示,
(3)因为样本中身高低于134cm的人数的频率为
所以估计身高低于134cm的人数约占总人数的.
【变式4-1】对于频率分布直方图,下列说法中正确的是( )
A.小长方形的高表示取某数的频率
B.小长方形的高表示该组个体在样本中出现的频数
C.小长方形的高表示该组个体在样本中出现的频率与组距的比
D.小长方形的高表示该组个体在样本中出现的频数与组距的比
【答案】C
【详解】在频率分布直方图中,各小长方形的面积表示相应各组的频率,
小长方形的高表示该组个体在样本中出现的频率与组距的比,
故A,B,D错误,C正确,
故选:C
【变式4-2】从A校高一年级学生中抽取66名学生测量他们的身高,其中最大值为184cm,最小值152cm,绘制身高频率分布直方图,若组距为3,且第一组下限为151.5,则组数为________.
【答案】11
【详解】第一组下限为151.5,组距为3,所以,
故第11组的下限为181.5,因此组数为11,
故答案为:11
【变式4-3】为了了解中学生身体发育情况,对某中学15岁的60名女生的身高(单位:)进行了测量,结果如下:
154 159 166 169 159 156 166 162 158 159
156 166 160 164 160 157 151 157 161 162
158 153 158 164 158 163 158 153 157 168
162 159 154 165 166 157 155 146 151 158
160 165 158 163 163 162 161 154 165 161
162 159 157 159 149 164 168 159 153 160
列出样本的频率分布表,绘制频率分布直方图.
【答案】频率分布表为:
分组
频数
频率
1
0.017
3
0.050
6
0.100
8
0.133
18
0.300
11
0.183
10
0.167
3
0.050
合计
60
1.000
频率分布直方图:
【详解】第一步,求极差:上述60个数据中最大为169,最小为146.故极差为.
第二步,确定组距和组数,可取组距为,则组数为,可将全部数据分为8组.
第三步,分组,,,,,,,.
第四步,列频率分布表:
分组
频数
频率
1
0.017
3
0.050
6
0.100
8
0.133
18
0.300
11
0.183
10
0.167
3
0.050
合计
60
1.000
第五步,根据上述数据绘制频率分布直方图:
题型五:频率分布直方图的特征数
众数取最高矩形底边中点横坐标;中位数找左右面积各为0.5的分界线横坐标;平均数用每组中点×该组面积再求和。牢记三个特征数的快速取法,直接套用不混淆。
计算中位数时从左向右累计面积,直到面积达到0.5,用区间比例精确计算;平均数计算逐项相乘再相加,保证每一组数据都参与运算。
【例9】某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.估计评分的平均数为76.5
C.估计评分的第25百分位数为65
D.评分在的人数约为20
【答案】C
【详解】对A,由频率之和为1得,解得,故A正确;
对B,平均数为,故B正确;
对C,评分在的频率为,评分在的频率为,
评分的第25百分位数对应累计频率为,落在组内,
故第25百分位数为,故C错误;
对D,评分在的频率为,则其中人数约为 ,故D正确.
【例10】某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
【答案】(1)
(2),
(3)众数:75 分;平均数:76.5 分;人
【分析】
【详解】(1)由题意得,解得.
(2)设为成绩落在上的概率,为成绩落在的人数,
由题意得,
设为成绩落在上的概率,为成绩落在的人数,
.
(3)由题意得众数为75分;
由(1)得成绩落在的频率为0.1,落在的频率为0.15,
落在的频率为0.35,落在的频率为0.3,落在的频率为0.1,
则平均数为,
设为78分以上的频率,为78分以上的人数,
则
,
故78分以上的人数为47人.
【变式5-1】为了了解某次数学测验学生的得分情况,数学老师从甲、乙两个班分别随机选取若干名学生成绩,整理后作出图表.甲班所选取同学成绩作出图(1),且图中;乙班所选取同学成绩作出图(2),且图中有一个数字污损不清.则下列说法正确的是( )
A.
B.若图(2)(多选)中现有数据的平均数和污损前相等,则图(2)污损前数据的众数为76
C.若直方图中每个数据都用该区间的中点值代替,则估计甲班同学成绩的平均数为76
D.估计乙班同学成绩的75%分位数为85
【答案】BCD
【详解】选项A:因为,所以设,则,
由题意得, 所以,解得,
所以,故A错误;
选项B:图(2)中现有数据为58,64,66,73,76,83,85,88,91,
平均数为,
因为现有数据的平均数和污损前相等,所以被污损数字为6,成绩为76,
则图(2)污损前数据的众数为76,故B正确;
选项C:甲班同学成绩的平均数,故C正确;
选项D:设被污损成绩为a,则,
所以乙班同学的成绩为58,64,66,73,76,a,83,85,88,91,
则,所以乙班同学成绩的75%分位数为85,故D正确.
故选:BCD
【变式5-2】(多选)某校有学生人,其中男生人,女生人.为调查学生的课外阅读情况,按性别比例分配,用分层随机抽样的方法抽取学生人,并统计样本中男生和女生一天的阅读时间(单位:分钟),绘制成如下两个频率分布直方图,则( )
A.
B.样本中男生阅读时间的中位数低于分钟
C.样本中阅读时间在分钟以下的学生中,男生人数比女生人数多
D.用样本估计总体,全校学生中阅读时间在分钟以上的约有人
【答案】ACD
【详解】对于A,由于频率分布直方图中,所有矩形的面积为,即,解得,故A正确;
对于B,男生前两组的频率为,前三组的频率为,
因此,男生阅读时间的中位数位于第三组,设中位数为,则有,解得,
即男生阅读时间的中位数为分钟,高于分钟,故B错误;
对于C,由于总人数人,其中男生人,女生人,抽样人按比例分配,其中男生人,女生人,
男生阅读时间在分钟以下的人数为人,女生阅读时间在分钟以下的人数为人,
因此阅读时间在分钟以下的人数中,男生人数比女生人数多,故C正确;
对于D,男生阅读时间在分钟以上的人数为人,
女生阅读时间在分钟以上的人数为人,因此样本中阅读时间在分钟以上的人数为人,
全校估计阅读时间在分钟以上的人数为人,故D正确.
【变式5-3】人工智能的广泛应用,给人们的生活带来了便捷.截至2026年3月,AI软件已广泛覆盖办公、学习、创作、生活等多个场景.某网站组织经常使用豆包的人进行了AI知识竞赛.从参赛者中随机选出100人作为样本,并将这100人按成绩分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示.
(1)填空:______;
(2)求样本数据的中位数与第35百分位数;
(3)已知直方图中成绩在内的平均数为85;成绩在内的平均数为95.求成绩在内的平均数.
【答案】(1)0.005
(2)中位数为80;75
(3)89.
【详解】(1),故.
(2)前三组频率之和为,所以样本数据的中位数为80;
前两组频率之和为,则样本数据的第35百分位数落在第三组.
设第35百分位数为,则,解得,
(3)由题意,成绩在,内的人数分别为30,20,
所以成绩在内的平均数为:,
所以,成绩在内的平均数为89.
题型六:标准差、方差的计算
【例11】某同学5次数学周测成绩为:80,84,84,86,86;这组数据的方差为__________.
【答案】4.8
【详解】所以这组数据的平均数为,
方差为.
【例12】一组样本数据依次为,,0,2,4,5.关于这组数据的数字特征,下列选项正确的是( )
A.极差为 B.平均数小于0 C.方差小于1 D.中位数为1
【答案】D
【详解】已知样本升序排列为:,,0,2,4,5,
极差为:,故A错误;
平均数为:,故B错误;
方差为:
,故C错误;
因这组数据有6个,故其中位数为中间两个数的平均值,即中位数为,故D正确.
【变式6-1】已知一组数据,,,,满足,,则这组数据的方差是________.
【答案】3.6/
【详解】由可知,,,,的平均数,
方差
.
【变式6-2】已知如下的两组数据:第一组:20,21,22,25,24,23;第二组:.若两组数据的方差相等,则实数的值为_____.
【答案】21或27
【详解】
将数据分为两层:,其中.
则
于是或27.
故答案为:21或27.
【变式6-3】若A组数据,,,的平均数为25,方差为5,B组数据,,,,5m的方差为8,则( )
A.8 B.4 C.4或5 D.4或6
【答案】D
【详解】由已知得,,
又,
所以数据的方差为
所以,
即,
所以,
所以,
即,解得或.
题型七:平均数、方法、标准差的性质
数据平移(+b):平均数加b,方差、标准差不变;数据伸缩(×a):平均数乘a,方差乘a²,标准差乘|a|。直接用性质快速计算,不用重新逐项计算。
同时平移与伸缩时,先算伸缩再算平移,按平均数:a+b,方差:a²s²统一套用,选择题、填空题用性质可大幅提速,保证不出计算错误。
【例13】(多选)一组从小到大排列的数据,,,…,的平均数为5,方差为6,极差为20,则对新数据,,…,的叙述正确的是( )
A.平均数为15 B.方差为54 C.75%分位数为 D.极差为59
【答案】BC
【详解】对于A,新数据的平均数为,A错误,
对于B,新数据的方差为,B正确,
对于C,因为,所以新数据的分位数是数据的第个数据,即为,C正确,
对于D,新数据的极差为,D错误,
【例14】(多选)一组数据的平均数为5,方差为2,极差为7,中位数为6,记,,,的平均数为a,方差为b,极差为c,中位数为d,则下列结论正确的是( )
A. B. C. D.
【答案】ABD
【详解】由题意可得:平均数;方差;极差;中位数
【变式7-1】(多选)已知数据的平均数为M,中位数为N,方差为P,极差为Q,设,得到新数据,则对于所得新数据,下列说法一定正确的是( )
A.平均数是3M B.中位数是
C.方差是9P D.极差是
【答案】BC
【详解】对于A,由数据的平均数为,可得,
新数据的平均数为
,所以A错误;
对于B,由数据的中位数为,
将新数据从小到大排序,因为,所以新数据的排序和原数据的排序相同,
所以新数据的中位数为,所以B正确;
对于C,由数据的方差为,
设新数据的方差为,因为新数据满足,可得,所以C正确;
对于D,由原数据的极差为,可得,
因为新数据满足,则新数据的极差为,所以D错误.
【变式7-2】(多选)已知第一组样本数据,,…,的方差为1,第二组样本数据,,…,的平均数为14,则( )
A.第一组数据的平均数为4 B.第二组数据的方差为3
C.将两组数据合并后数据的平均数是9 D.将两组数据合并后数据的方差是30
【答案】ACD
【详解】设第一组样本数据,,…,的平均数为,方差为,
则第二组样本数据,,…,的平均数为,方差为,
由题意知,,
则有,解得第一组的平均数为,故选项A正确;
第二组的方差为,故选项B错误;
将两组数据合并后数据的平均数是,故选项C正确;
第一组样本数据的方差,
即,
即,
即,
,
,
则两组数据合并后数据的方差是
,
,
,
则两组数据合并后数据的方差
,故选项D正确.
【变式7-3】(多选)已知点(,)与点(,)关于点对称,若的平均数为,中位数为,方差为,极差为,则满足( )
A.,,,…,的方差为
B.,,,…,的极差为
C.,,,…,的平均数为
D.,,,…,的中位数为
【答案】BC
【详解】由题意得,,则,
若的平均数为,中位数为,方差为,极差为,
则的平均数为,中位数为,方差为,极差为,
故,,,…,的方差为,极差为,故A错误,B正确;
,,,…,的平均数为,中位数为,故C正确,D错误.
故选:BC
题型八:分层方差计算总体方差
【例15】某校男生人,女生人,男生、女生每天运动时间(分钟)的平均值为,方差分别为,结合此数据,请你估计该校全体学生每天运动时间的平均值(分钟)和方差分别为( )
A. B. C. D.
【答案】D
【详解】依题意,平均值为:
而混合数据后,新方差计算如下:.
【例16】某校高一年级开设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.
(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数:
(2)现已知直方图中考核得分在内的平均数为75,方差为6.25,在内的平均数为85,方差为0.5,求得分在内的平均数和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)
【答案】(1),85;
(2)得分在内的平均数为81,方差为26.8.
【分析】
【详解】(1)由题意得:,解得,
设第60百分位数为,则,
解得,第60百分位数为85.
(2)由题意知,落在区间内的数据有个,
落在区间内的数据有个.
由题意,,则.
根据方差的定义,
故得分在内的平均数为81,方差为26.8.
【变式8-1】某果园为检测两试验园苹果的质量,现从试验园抽取30个苹果,其平均质量为,方差为48,从试验园抽取20个苹果,其平均质量为,方差为40,则抽取的这50个苹果的方差为( )
(参考公式:样本分为2层,各层的容量、平均数和方差分别为,,,,,,记样本的平均数为,方差为,则.)
A.45.8 B.140.8 C.176 D.183.2
【答案】B
【详解】这50个苹果的平均数,
则方差
.
【变式8-2】某校为调查高一年级的某次考试的数学情况,选取高一年级甲班和乙班进行调查.若甲班学生数学成绩的平均数为90,方差为3,乙班学生数学成绩的平均数为81,方差为5,且甲乙两班的学生人数之比为,则这两班数学的总成绩平均分和方差分别为( )
A.85.5; B.; C.85.5; D.;
【答案】B
【详解】设两个班级的总人数为,则甲班的学生数为,乙班学生数为,
所以两班数学的总成绩平均分为,
两班数学的方差为.
【变式8-3】“2026重庆马拉松”成功举行,某单位承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)求a,b的值;
(2)若面试成绩前的候选者为优秀候选者,请估计优秀候选者成绩的最低分;
(3)现从以上各组中用分层抽样的方法选取20人,担任本次宣传者.若本次宣传者中第二组面试者的面试成绩的平均数和方差分别为62和30,第四组面试者的面试成绩的平均数和方差分别为80和40,据此估计这次第二组和第四组这两组的所有面试者的方差.
【答案】(1)
(2)
(3)
【分析】
【详解】(1)由题意可知,,解得;
(2)由(1)及图知,,
所以面试成绩前候选者(分数从高到低)的最低分位于区间,设为,
所以,可得.
(3)设第二组、第四组的平均数分别为,方差分别为,
且各组频率之比为:
,
所以用分层抽样的方法抽取第二组面试者人,
第四组面试者人,
则第二组和第四组面试者的面试成绩的平均数,
第二组、第四组面试者的面试成绩的方差
,
故估计第二组、第四组面试者的面试成绩的方差是.
一、单选题
1.哈尔滨市某月连续10天的AQI(空气质量指数)分别为29,32,34,36,39,50,47,66,48,78,则这组数据的第75百分位数为( )
A.33 B.34 C.49 D.50
【答案】D
【详解】数据从小到大重新排列为29,32,34,36,39,47,48,50,66,78,
因为,由百分位数的定义可知:这组数据的第75百分位数是第8个数据50.
2.在某足球联赛的常规赛中,甲队进球个数的平均数为2.1,标准差为1.1;乙队进球个数的平均数为1.4,标准差为1.2,则( )
A.甲队进攻能力比乙队强,甲队进球数波动较大
B.乙队进攻能力比甲队强,乙队进球数波动较大
C.甲队进攻能力比乙队强,乙队进球数波动较大
D.乙队进攻能力比甲队强,甲队进球数波动较大
【答案】C
【详解】因为甲队进球个数的平均数为2.1,乙队进球个数的平均数为1.4,
所以甲队进攻能力比乙队强,
又因为甲队进球个数的标准差为1.1,乙队进球个数的标准差为1.2,
所以乙队进球数波动较大.
3.某精密仪器厂生产一种标准长度为的金属垫片.现随机抽取200个垫片测量其实际长度(单位:),按长度分组并绘制出如图所示的频率分布直方图.若规定长度在区间内的垫片为合格品,用样本频率估计总体的概率,则任取一个垫片为合格品的概率为( )
A.0.3 B.0.4 C.0.5 D.0.6
【答案】C
【详解】由题意知,,整理得,解得.
所以任取一个垫片为合格品的概率为:.
4.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2025年国庆期间该市和两个景区的日接待人数的数据(单位:万人),绘制了如下折线图,则( )
A.景区这7日数据的第80%分位数是8.7
B.景区这7日数据的极差是1.7
C.景区这7日数据的平均数比景区的两倍小
D.景区这7日数据的方差比景区的大
【答案】C
【详解】对于A项,将景区 A 的数据从小到大排序得,
因为,不是整数,
故景区这7日数据的第80%分位数是第项为,故A错误;
对于B项,景区这7日数据的极差是,故B错误;
对于C项,因为景区的平均数:,
景区的平均数:,
所以景区这7日数据的平均数比景区的两倍小,故C正确;
对于D项,由折线图可知景区的人数波动比景区的人数波动小,故景区这7日数据的方差比景区的小,故D错误.
5.某中学为了解大数据提供的个性化作业质量情况,随机访问50名学生,根据这50名学生对个性化作业的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为,,,,,.则估计该中学学生对个性化作业的评分不低于70分的概率为( )
A.0.65 B.0.68 C.0.72 D.0.55
【答案】B
【详解】由频率分布直方图的性质知:,解得,
故评分不低于70分的概率为:.
6.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将地区200家实体店该品牌洗衣机的月经济损失统计如图所示.估算月经济损失的平均数为,中位数为,则( )
A.50 B.75 C.90 D.100
【答案】C
【详解】根据频率分布直方图的性质,所有的矩形块面积之和等于1,
,
第一块小矩形的面积为,第二块小矩形的面积为,所以中位数在第二组,
故,
又平均数,
故.
故选:C.
7.某校高三某班共50人参加某次数学测试,该班学生成绩(单位:分)的方差为30,男生成绩的平均数为86,方差为16,女生成绩的平均数为81,方差为36,则该班的女生人数是( )
A.20 B.25 C.30 D.35
【答案】A
【详解】设该班男生占比为,则女生占比为,其中,
已知男生成绩的平均数,方差,
女生成绩的平均数,方差,
全班成绩的总平均数,
因为全班成绩的总方差,
即,
化简得,
解得或(舍),
所以该班女生人数为人.
8.有8位评委给一名考生打分,满分为100分.将8位评委的打分从低到高排列为36,42,.若这8个分数的极差等于中位数,则该组数据的第60百分位数是( )
A.62 B.63 C.64 D.65
【答案】C
【详解】数据共有8个,为偶数个,
中位数是中间两个数60和的平均数,即为,
极差是最大值98减去最小值36,即极差为62.
这8个分数的极差等于中位数,,解得,
所以这组数据为36,42,51,60,64,73,87,98.计算,
所以第60百分位数是第5个数,即64.
二、多选题
9.已知一组数据为,且这组数据的众数为8,那么下列选项正确的是( )
A.中位数是8 B.平均数是6
C. D.
【答案】ABD
【详解】由这组数据的众数为8,故,则这组数据为,
则这组数据中位数是8,平均数为,
故A、B、D正确,C错误.
10.某校组织学生参加全市一项比赛,现将参加考核的160名学生的成绩分为5个小组,绘制如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)( )
A.的值为0.025
B.参加考核学生成绩的中位数约为71.4
C.参加考核学生成绩在区间的学生有104人
D.估计参加考核学生成绩的平均数约为69.5
【答案】ACD
【详解】对于A,由,得,A正确;
对于B,成绩在的频率分别为,则成绩的中位数,
,解得,B错误;
对于C,成绩在的频率为,
由,得成绩在区间的学生有104人,C正确;
对于D,成绩的平均数,D正确.
三、填空题
11.某中学三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的平均分是86,则__________,__________.
【答案】
【详解】甲班选出的7名学生数学竞赛的成绩分别为:,
甲班学生的平均分为,解得;
乙班选出的7名学生数学竞赛的成绩分别为:,
乙班学生的平均分为,解得.
故答案为:,.
12.先后抛掷一枚质地均匀的骰子次,记录向上一面的点数,若已知个点数的中位数为,唯一的众数为,则平均数最大为_____.
【答案】
【详解】将个数据由小到大进行排列,前个数依次为、、,要使得这个数据的平均数最大,
则后面两个数分别为、,即这个数据由小到大依次为、、、、,
所以这个点数的平均数的最大值为.
13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知______(结果保留3位小数).若要从身高在,,三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为______.
【答案】 0.030 3
【详解】由,
解得,
的频率为,的频率为,的频率为,
三组之比为,
所以用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为,
故答案为:,3
四、解答题
14.2025年5月22日至5月28日是第三届全国城市生活垃圾分类宣传周,本次宣传周的主题为“分类齐参与,低碳新时尚”.某中学举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛的成绩情况,从中随机抽取了100名学生的竞赛成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,按,,,,分为5组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计这100名学生这次竞赛成绩的平均数;
(3)在这100名学生中,从这次竞赛成绩在内的学生中采用分层随机抽样的方法抽取27名学生进行调查,求这100名学生这次竞赛成绩在内被抽取的人数.
【答案】(1)
(2)
(3)
【分析】
【详解】(1)由频率分布直方图可知,各组的组距都是
各组对应的小长方形面积之和等于总频率,所以
化简得即即即
所以图中
(2)由第(1)问可得
因此各组的频率分别为
对应这名学生的人数分别为
各组的组中值分别为
所以这 名学生竞赛成绩的平均数估计为
计算得
所以估计这名学生这次竞赛成绩的平均数为分.
(3)由第(2)问可知,成绩在内的人数为
成绩在内的人数为
所以成绩在内的总人数为
现从这人中采用分层随机抽样的方法抽取人,
则成绩在内被抽取的人数为
所以这名学生这次竞赛成绩在内被抽取的人数为
15.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩分成,,,,这五组,得到如图所示的频率分布直方图.
(1)估计样本成绩的平均数及方差;(同一组中的数据用该组区间的中点值作为代表)
(2)已知落在内的平均成绩是80分,方差是4分,落在内的平均成绩是88分,方差是6分,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为m,,;n,,,记两组数据总体的样本平均数为,则总体样本方差.
【答案】(1)平均数100,方差104
(2),
【分析】
【详解】(1)由频率分布直方图得,
平均数,
方差
.
(2)第一组的样本容量,,
第二组的样本容量,,
所以合并后的平均数,
则.
16.人工智能是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.很多学校已经推出基于DeepSeek的人工智能通识课程,帮助学生深入了解人工智能的历史、关键技术及其在科学研究、社会发展中的高效应用,培养跨学科思维,推动人工智能技术在多领域的深度融合与创新.某探究小组利用DeepSeek解答了50份不同的模拟试卷(每份试卷包含文科、理科共30个题),收集其准确率,整理得到如下频率分布直方图.
(1)求图中a的值;
(2)求这组数据的中位数;
(3)若将准确率不低于90%定义为“优秀表现”,且已知:①每份试卷中,文科题(语文、英语、历史)与理科题(数学、物理、化学)各占比50%,DeepSeek解答理科题的平均正确率比文科题高5%;②理科题每题6分,文科题每题4分,请计算:
①DeepSeek在“优秀表现”试卷中,理科题和文科题的平均正确率分别是多少?
②一份“优秀表现”的试卷,DeepSeek的平均得分是多少?
【答案】(1)
(2)
(3)①理科题的平均正确率为,文科题的平均正确率为;②分
【分析】
【详解】(1)由频率分布直方图可得,解得;
(2)设中位数为,前两个矩形的面积之和为,
前三个矩形的面积之和为,
所以,则,解得,
所以估计准确率的中位数为;
(3)①设“优秀表现”试卷中文科题平均正确率为,则理科题平均正确率为,
优秀表现的准确率区间为,
其平均准确率为:,
则,解得,
则理科题平均正确率为;
②文科得分为,理科得分为,
则DeepSeek的平均得分为分.
1 / 10
学科网(北京)股份有限公司
$
考点21 用样本估计总体
考点一:频率分布直方图
1.画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差);
第2步:决定组距与组数;
第3步:将数据分组;
第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
考点二:数字特征
①众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
②极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
③性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
考点三:百分位数
1.定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2.计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
题型一:统计图与实际问题
先读懂图表类型(频率分布直方图、柱状图等),提取组距、频率、频数、总量等关键数据,明确图表横轴与纵轴含义。再将实际问题转化为频率、频数、占比计算,按题目要求求比例、估计人数或做合理判断。
答题时紧扣图表信息,不额外添加条件,用频率=频数/总数、频数=频率×总数两个核心公式求解,结果保留题目要求的精度。
【例1】某小商品生产企业对2025年1月到11月甲,乙两个车间的产量(单位:百万件)进行了统计,得到如图所示的折线图,则( )
A.乙车间产量的中位数为6月份的产量
B.甲车间产量的极差大于乙车间产量的极差
C.甲车间产量的平均值小于乙车间产量的平均值
D.甲车间产量的第80百分位数大于乙车间产量的第80百分位数
【例2】某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中正确的是( )
A.丁险种参保人数超过六成 B.41岁以上参保人数超过总参保人数的五成
C.54周岁以上人群参保的总费用最少 D.人均参保费用不超过5000元
【变式1-1】下图是2010—2020年这11年我国考研人数统计图,则关于这11年考研人数下列说法正确的是( ).
A.2010年以来我国考研报名人数逐年增多
B.这11年来考研报名人数的极差超过260万人
C.2015年是这11年来报考人数最少的一年
D.2015年的报录比最低,2020年的报录比最高
【变式1-2】(多选)2020—2024年我国粮食产量(单位:万吨)如图所示,下列结论正确的是( )
A.2020—2024年我国粮食产量逐年增加
B.2020—2024年我国粮食产量的中位数为68653万吨
C.2020—2024年我国粮食产量的极差为3699万吨
D.2020—2024年我国粮食产量与年份负相关
【变式1-3】(多选)如图,这是全国年下半年商品零售额和餐饮收入同比增长速度图,则全国年下半年( )
A.商品零售额同比增长速度的极差为
B.商品零售额同比增长速度逐渐降低
C.餐饮收入同比增长速度的分位数为
D.餐饮收入同比增长速度的平均数小于
题型二:总体百分位数的估计
先将数据从小到大排序,计算i=n×p%,再按i是否为整数确定百分位数:非整数取比邻整数项,整数取第i项与第i+1项的平均数。遇到分组数据时,结合频率分布直方图用面积累计法定位。
计算时注意排序不能乱、比例不搞错,四分位数是25%、50%、75%分位数,直接按百分位数步骤计算即可,重点保证步骤规范、结果准确。
【例3】样本数据的第75百分位数是( )
A.7 B.8 C.9 D.10
【例4】已知一组数据1,2,4,6,8,10,的上四分位数为,则的值可能是( )
A.3 B.5 C.7 D.9
【变式2-1】某篮球运动员近8场比赛的得分从低到高依次为6,9,,,,,,,则这8个数据的上四分位数是____________.
【变式2-2】已知班内7位同学的体重数据(单位:kg)由以下茎叶图(十位数字为茎,个位数字为叶)所示,则这组数据的第70百分位数是__________.
【变式2-3】某校将学生分为5个队伍进行研学活动,这5个队伍的人数分别为:50,,55,45,.已知本次研学活动的总人数为250人,且各队人数的第40百分位数不小于48,则各队人数的第70百分位数的最大值是( )
A.51 B.52 C.53 D.54
题型三:平均数、众数、中位数的计算
原始数据直接计算:众数是出现次数最多的数,中位数是排序后中间位置的数,平均数是所有数据之和除以个数。偶数个数据时,中位数取中间两数的平均值,众数可能不唯一。
多组数据或表格题先统计频数,加权平均数用数据×频数求和再除以总数,计算时先排序再找中位数,避免因未排序导致结果错误。
【例5】已知一组数据的中位数为10,则该组数据的平均数为( )
A.7 B.8 C.9 D.10
【例6】一组从小到大排列的数据:.若它们的第60百分位数比平均数大2,则的值为( )
A.10 B.11 C.12 D.13
【变式3-1】已知五个数的平均数为50,则这五个数的中位数为( )
A.45 B.47.5 C.50 D.52.5
【变式3-2】(多选)如图,这是某校写作兴趣小组25名同学暑假的课外阅读量(单位:本)的折线统计图,则( )
A.这25名同学暑假的课外阅读量的众数是4本
B.这25名同学暑假的课外阅读量的中位数是5本
C.这25名同学暑假的课外阅读量的平均数是4.4本
D.这25名同学暑假的课外阅读量的第80百分位数是6本
【变式3-3】一组按照从小到大排列的数据,其平均数为,则___________.
题型四:频率分布直方图的绘制与应用
先按求极差→定组距与组数→分组→列表→画图五步完成绘制,纵轴必须是频率/组距,小矩形面积代表对应组的频率。解题时先算组距、频率、频数,利用所有矩形面积和为1求未知量,再结合频率公式进行计算或判断。
应用问题常考求某区间频率、频数或估计总体,先定位目标区间对应的矩形,用面积=频率计算,再用频数=总数×频率得到结果,注意单位与比例统一。
【例7】某校抽取100名学生测量他们的身高,其山最大值为,最小值,绘制身高频率分布直方图,若组距为5,且第一组下限为,则组数为__________.
【例8】下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):
区间界限
人数
5
8
10
22
33
区间界限
人数
20
11
6
5
(1)列出样本的频率分布表(频率保留两位小数);
(2)画出频率分布直方图;
(3)估计身高低于134cm的人数占总人数的百分比.
【变式4-1】对于频率分布直方图,下列说法中正确的是( )
A.小长方形的高表示取某数的频率
B.小长方形的高表示该组个体在样本中出现的频数
C.小长方形的高表示该组个体在样本中出现的频率与组距的比
D.小长方形的高表示该组个体在样本中出现的频数与组距的比
【变式4-2】从A校高一年级学生中抽取66名学生测量他们的身高,其中最大值为184cm,最小值152cm,绘制身高频率分布直方图,若组距为3,且第一组下限为151.5,则组数为________.
【变式4-3】为了了解中学生身体发育情况,对某中学15岁的60名女生的身高(单位:)进行了测量,结果如下:
154 159 166 169 159 156 166 162 158 159
156 166 160 164 160 157 151 157 161 162
158 153 158 164 158 163 158 153 157 168
162 159 154 165 166 157 155 146 151 158
160 165 158 163 163 162 161 154 165 161
162 159 157 159 149 164 168 159 153 160
列出样本的频率分布表,绘制频率分布直方图.
题型五:频率分布直方图的特征数
众数取最高矩形底边中点横坐标;中位数找左右面积各为0.5的分界线横坐标;平均数用每组中点×该组面积再求和。牢记三个特征数的快速取法,直接套用不混淆。
计算中位数时从左向右累计面积,直到面积达到0.5,用区间比例精确计算;平均数计算逐项相乘再相加,保证每一组数据都参与运算。
【例9】某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法错误的是( )
A.
B.估计评分的平均数为76.5
C.估计评分的第25百分位数为65
D.评分在的人数约为20
【例10】某校100名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在与中的学生人数;
(3)估计这次考试的众数、平均数及78分以上的人数.
【变式5-1】为了了解某次数学测验学生的得分情况,数学老师从甲、乙两个班分别随机选取若干名学生成绩,整理后作出图表.甲班所选取同学成绩作出图(1),且图中;乙班所选取同学成绩作出图(2),且图中有一个数字污损不清.则下列说法正确的是( )
A.
B.若图(2)(多选)中现有数据的平均数和污损前相等,则图(2)污损前数据的众数为76
C.若直方图中每个数据都用该区间的中点值代替,则估计甲班同学成绩的平均数为76
D.估计乙班同学成绩的75%分位数为85
【变式5-2】(多选)某校有学生人,其中男生人,女生人.为调查学生的课外阅读情况,按性别比例分配,用分层随机抽样的方法抽取学生人,并统计样本中男生和女生一天的阅读时间(单位:分钟),绘制成如下两个频率分布直方图,则( )
A.
B.样本中男生阅读时间的中位数低于分钟
C.样本中阅读时间在分钟以下的学生中,男生人数比女生人数多
D.用样本估计总体,全校学生中阅读时间在分钟以上的约有人
【变式5-3】人工智能的广泛应用,给人们的生活带来了便捷.截至2026年3月,AI软件已广泛覆盖办公、学习、创作、生活等多个场景.某网站组织经常使用豆包的人进行了AI知识竞赛.从参赛者中随机选出100人作为样本,并将这100人按成绩分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示.
(1)填空:______;
(2)求样本数据的中位数与第35百分位数;
(3)已知直方图中成绩在内的平均数为85;成绩在内的平均数为95.求成绩在内的平均数.
题型六:标准差、方差的计算
【例11】某同学5次数学周测成绩为:80,84,84,86,86;这组数据的方差为__________.
【例12】一组样本数据依次为,,0,2,4,5.关于这组数据的数字特征,下列选项正确的是( )
A.极差为 B.平均数小于0 C.方差小于1 D.中位数为1
【变式6-1】已知一组数据,,,,满足,,则这组数据的方差是________.
【变式6-2】已知如下的两组数据:第一组:20,21,22,25,24,23;第二组:.若两组数据的方差相等,则实数的值为_____.
【变式6-3】若A组数据,,,的平均数为25,方差为5,B组数据,,,,5m的方差为8,则( )
A.8 B.4 C.4或5 D.4或6
题型七:平均数、方法、标准差的性质
数据平移(+b):平均数加b,方差、标准差不变;数据伸缩(×a):平均数乘a,方差乘a²,标准差乘|a|。直接用性质快速计算,不用重新逐项计算。
同时平移与伸缩时,先算伸缩再算平移,按平均数:a+b,方差:a²s²统一套用,选择题、填空题用性质可大幅提速,保证不出计算错误。
【例13】(多选)一组从小到大排列的数据,,,…,的平均数为5,方差为6,极差为20,则对新数据,,…,的叙述正确的是( )
A.平均数为15 B.方差为54 C.75%分位数为 D.极差为59
【例14】(多选)一组数据的平均数为5,方差为2,极差为7,中位数为6,记,,,的平均数为a,方差为b,极差为c,中位数为d,则下列结论正确的是( )
A. B. C. D.
【变式7-1】(多选)已知数据的平均数为M,中位数为N,方差为P,极差为Q,设,得到新数据,则对于所得新数据,下列说法一定正确的是( )
A.平均数是3M B.中位数是
C.方差是9P D.极差是
【变式7-2】(多选)已知第一组样本数据,,…,的方差为1,第二组样本数据,,…,的平均数为14,则( )
A.第一组数据的平均数为4 B.第二组数据的方差为3
C.将两组数据合并后数据的平均数是9 D.将两组数据合并后数据的方差是30
【变式7-3】(多选)已知点(,)与点(,)关于点对称,若的平均数为,中位数为,方差为,极差为,则满足( )
A.,,,…,的方差为
B.,,,…,的极差为
C.,,,…,的平均数为
D.,,,…,的中位数为
题型八:分层方差计算总体方差
【例15】某校男生人,女生人,男生、女生每天运动时间(分钟)的平均值为,方差分别为,结合此数据,请你估计该校全体学生每天运动时间的平均值(分钟)和方差分别为( )
A. B. C. D.
【例16】某校高一年级开设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.
(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数:
(2)现已知直方图中考核得分在内的平均数为75,方差为6.25,在内的平均数为85,方差为0.5,求得分在内的平均数和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)
【变式8-1】某果园为检测两试验园苹果的质量,现从试验园抽取30个苹果,其平均质量为,方差为48,从试验园抽取20个苹果,其平均质量为,方差为40,则抽取的这50个苹果的方差为( )
(参考公式:样本分为2层,各层的容量、平均数和方差分别为,,,,,,记样本的平均数为,方差为,则.)
A.45.8 B.140.8 C.176 D.183.2
【变式8-2】某校为调查高一年级的某次考试的数学情况,选取高一年级甲班和乙班进行调查.若甲班学生数学成绩的平均数为90,方差为3,乙班学生数学成绩的平均数为81,方差为5,且甲乙两班的学生人数之比为,则这两班数学的总成绩平均分和方差分别为( )
A.85.5; B.; C.85.5; D.;
【变式8-3】“2026重庆马拉松”成功举行,某单位承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)求a,b的值;
(2)若面试成绩前的候选者为优秀候选者,请估计优秀候选者成绩的最低分;
(3)现从以上各组中用分层抽样的方法选取20人,担任本次宣传者.若本次宣传者中第二组面试者的面试成绩的平均数和方差分别为62和30,第四组面试者的面试成绩的平均数和方差分别为80和40,据此估计这次第二组和第四组这两组的所有面试者的方差.
一、单选题
1.哈尔滨市某月连续10天的AQI(空气质量指数)分别为29,32,34,36,39,50,47,66,48,78,则这组数据的第75百分位数为( )
A.33 B.34 C.49 D.50
2.在某足球联赛的常规赛中,甲队进球个数的平均数为2.1,标准差为1.1;乙队进球个数的平均数为1.4,标准差为1.2,则( )
A.甲队进攻能力比乙队强,甲队进球数波动较大
B.乙队进攻能力比甲队强,乙队进球数波动较大
C.甲队进攻能力比乙队强,乙队进球数波动较大
D.乙队进攻能力比甲队强,甲队进球数波动较大
3.某精密仪器厂生产一种标准长度为的金属垫片.现随机抽取200个垫片测量其实际长度(单位:),按长度分组并绘制出如图所示的频率分布直方图.若规定长度在区间内的垫片为合格品,用样本频率估计总体的概率,则任取一个垫片为合格品的概率为( )
A.0.3 B.0.4 C.0.5 D.0.6
4.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2025年国庆期间该市和两个景区的日接待人数的数据(单位:万人),绘制了如下折线图,则( )
A.景区这7日数据的第80%分位数是8.7
B.景区这7日数据的极差是1.7
C.景区这7日数据的平均数比景区的两倍小
D.景区这7日数据的方差比景区的大
5.某中学为了解大数据提供的个性化作业质量情况,随机访问50名学生,根据这50名学生对个性化作业的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为,,,,,.则估计该中学学生对个性化作业的评分不低于70分的概率为( )
A.0.65 B.0.68 C.0.72 D.0.55
6.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将地区200家实体店该品牌洗衣机的月经济损失统计如图所示.估算月经济损失的平均数为,中位数为,则( )
A.50 B.75 C.90 D.100
7.某校高三某班共50人参加某次数学测试,该班学生成绩(单位:分)的方差为30,男生成绩的平均数为86,方差为16,女生成绩的平均数为81,方差为36,则该班的女生人数是( )
A.20 B.25 C.30 D.35
8.有8位评委给一名考生打分,满分为100分.将8位评委的打分从低到高排列为36,42,.若这8个分数的极差等于中位数,则该组数据的第60百分位数是( )
A.62 B.63 C.64 D.65
二、多选题
9.已知一组数据为,且这组数据的众数为8,那么下列选项正确的是( )
A.中位数是8 B.平均数是6
C. D.
10.某校组织学生参加全市一项比赛,现将参加考核的160名学生的成绩分为5个小组,绘制如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)( )
A.的值为0.025
B.参加考核学生成绩的中位数约为71.4
C.参加考核学生成绩在区间的学生有104人
D.估计参加考核学生成绩的平均数约为69.5
三、填空题
11.某中学三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的平均分是86,则__________,__________.
12.先后抛掷一枚质地均匀的骰子次,记录向上一面的点数,若已知个点数的中位数为,唯一的众数为,则平均数最大为_____.
13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知______(结果保留3位小数).若要从身高在,,三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为______.
四、解答题
14.2025年5月22日至5月28日是第三届全国城市生活垃圾分类宣传周,本次宣传周的主题为“分类齐参与,低碳新时尚”.某中学举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛的成绩情况,从中随机抽取了100名学生的竞赛成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,按,,,,分为5组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计这100名学生这次竞赛成绩的平均数;
(3)在这100名学生中,从这次竞赛成绩在内的学生中采用分层随机抽样的方法抽取27名学生进行调查,求这100名学生这次竞赛成绩在内被抽取的人数.
15.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩分成,,,,这五组,得到如图所示的频率分布直方图.
(1)估计样本成绩的平均数及方差;(同一组中的数据用该组区间的中点值作为代表)
(2)已知落在内的平均成绩是80分,方差是4分,落在内的平均成绩是88分,方差是6分,求两组成绩合并后的平均数和方差.
附:设两组数据的样本量、样本平均数和样本方差分别为m,,;n,,,记两组数据总体的样本平均数为,则总体样本方差.
16.人工智能是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.很多学校已经推出基于DeepSeek的人工智能通识课程,帮助学生深入了解人工智能的历史、关键技术及其在科学研究、社会发展中的高效应用,培养跨学科思维,推动人工智能技术在多领域的深度融合与创新.某探究小组利用DeepSeek解答了50份不同的模拟试卷(每份试卷包含文科、理科共30个题),收集其准确率,整理得到如下频率分布直方图.
(1)求图中a的值;
(2)求这组数据的中位数;
(3)若将准确率不低于90%定义为“优秀表现”,且已知:①每份试卷中,文科题(语文、英语、历史)与理科题(数学、物理、化学)各占比50%,DeepSeek解答理科题的平均正确率比文科题高5%;②理科题每题6分,文科题每题4分,请计算:
①DeepSeek在“优秀表现”试卷中,理科题和文科题的平均正确率分别是多少?
②一份“优秀表现”的试卷,DeepSeek的平均得分是多少?
1 / 10
学科网(北京)股份有限公司
$