内容正文:
第16讲 用样本估计总体
【人教A版】
模块一
总体取值规律的估计
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【题型1 补全、绘制频率分布直方图】
【例1】(24-25高二·上海·课堂例题)从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):,2;,3;,10;,15;,12;,8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在分的学生所占总体的百分比.
【答案】(1)答案见解析
(2)答案见解析
(3)
【解题思路】(1)根据题中所给数据 即可得出频率分布表;
(2)根据频率分布表画出频率分布直方图即可;
(3)根据频率分布直方图即可得解.
【解答过程】(1)频率分布表如下:
成绩分组
频数
频率
2
0.04
3
0.06
10
0.20
15
0.30
12
0.24
8
0.16
合计
50
1.00
(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:
(3)由频率分布直方图,可估计成绩在分的学生所占总体的百分比是.
【变式1.1】(24-25高一下·辽宁阜新·月考)有一个容量为60的样本(60名学生的数学考试成绩),分组情况如下表:
分组
频数
3
6
12
频率
0.3
(1)补全表中所剩的空格;
(2)画出频率分布直方图和频率分布折线图.
【答案】(1)答案见解析
(2)答案见解析
【解题思路】(1)分别计算各分数段的频率与频数,再补表格即可;
(2)分别计算各分数段的频率除以组距的值,然后画出频率分布直方图和频率分布折线图即可.
【解答过程】(1)根据题意,的频率为;的频率为;
的频率为;的频率为,
频数为;的频数为.
填表如下.
分组
频数
3
6
12
21
18
频率
0.05
0.1
0.2
0.35
0.3
(2)计算的,的,
的,的,
的.
画出的频率分布直方图和频率分布折线图如图所示.
【变式1.2】(24-25高一下·吉林长春·月考)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
5
0.05
①
0.20
35
②
30
0.30
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在岁的人数;
(3)现用比例分配的分层随机抽样从、、的样本中共抽取n名志愿者,已知从中抽取了2人,求n的值.
【答案】(1)①应填,②应填;
(2)直方图见解析,人数为175;
(3)15
【解题思路】(1)结合抽取的总人数,结合表格中数据,计算出结果;
(2)计算出区间的频率/组距,绘制直方图,并利用年龄在岁的频率得到答案;
(3)计算出三个区间的比例,从而计算出从、中分别抽取的人数,得到答案.
【解答过程】(1)①应填,②应填;
(2)区间的频率为0.20,故频率/组距为,
故补全频率分布直方图,如下:
这500名志愿者中年龄在岁的人数为;
(3)、、的人数比例为,
从中抽取了2人,故从、中分别抽取了7人和6人,
故.
【变式1.3】(24-25高一下·全国·单元测试)为了让学生了解环保知识,增强环保意识,某中学举办了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频数分布表和频数分布直方图,解答下列问题:
分组
频数
频率
50.5~60.5
4
0.08
60.5~70.5
0.16
70.5~80.5
10
80.5~90.5
16
0.32
90.5~100.5
合计
50
(1)填充频数分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5的学生为二等奖,问获得二等奖的学生约为多少人?
【答案】(1)表格见解析
(2)直方图见解析
(3)人
【解题思路】(1)根据频数和频率的关系计算完善表格即可.
(2)求出第二组的频数后补全频数分布直方图即可.
(3)求出成绩在75.5~85.5的学生频率即可求解.
【解答过程】(1)易知样本容量为50,
故第二组的频数为,第三组的频率为,
第四组的频数为,频率为,
故频数分布表为
分组
频数
频率
50.5~60.5
4
0.08
60.5~70.5
8
0.16
70.5~80.5
10
0.20
80.5~90.5
16
0.32
90.5~100.5
12
0.24
合计
50
1.00
(2)由(1)知,60.5~70.5这一组的频数为8,补全频数分布直方图,如图:
(3)成绩在75.5~80.5的学生占70.5~80.5的学生的,
因为成绩在70.5~80.5的学生频率为0.20,所以成绩在75.5~80.5的学生频率为0.10.
成绩在80.5~85.5的学生占80.5~90.5的学生的,
因为成绩在80.5~90.5的学生频率为0.32,所以成绩在80.5~85.5的学生频率为0.16,
所以成绩在75.5~85.5的学生频率为.
由于有900名学生参加了这次竞赛,
所以该校获得二等奖的学生约为(人).
【题型2 频率分布直方图的相关计算问题】
【例2】(24-25高一下·江苏连云港·月考)某科研单位对Deepseek的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在50分到100分之间的问卷)中随机抽取了100份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,这批用户问卷的得分不低于80分的份数为( )
A.20 B.30 C.35 D.40
【答案】B
【解题思路】由图计算出这批用户问卷的得分不低于80分的频率即可求相应的人数.
【解答过程】由图可得这批用户问卷的得分不低于80分的频率为,
故这批用户问卷的得分不低于80分的份数为:,
故选:B.
【变式2.1】(24-25高一下·安徽·月考)某厂对一批产品进行抽样检测,如图所示的是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为.若这批产品有200个,估计其中净重大于或等于80克的个数是( )
A.110 B.140 C.150 D.90
【答案】B
【解题思路】根据频率分布直方图中的数据,求得净重大于或等于80克的频率为,进而的得到答案.
【解答过程】由频率分布直方图,可得净重大于或等于80克的频率为,
所以净重大于或等于80克的个数为个.
故选:B.
【变式2.2】(24-25高三上·天津河东·期末)某校根据学生情况将物理考试成绩进行赋分,目的是为了更好地对新高考改革中不同选科学生的考试成绩进行横向对比,经过对全校300名学生的成绩统计,可得到如图所示的频率分布直方图,则这些同学物理成绩大于等于60分的人数为( )
A.270 B.240 C.180 D.150
【答案】B
【解题思路】根据频率之和为1得到方程,求出,进而求出物理成绩大于等于60分的人数.
【解答过程】,解得,
故物理成绩大于等于60分的人数为.
故选:B.
【变式2.3】(2025高二下·湖南·学业考试)某中学举行了一次“网络信息安全”知识竞赛,将参赛的500名学生成绩分为6组,绘制了如图所示的频率分布直方图,则成绩在区间内的学生有( )
A.80名 B.100名 C.120名 D.140名
【答案】B
【解题思路】先根据频率分布直方图的性质,求得的值,再根据样本中成绩在区间内的频率参赛的人数即可.
【解答过程】由频率分布直方图可知,解得,
所以成绩在区间内的学生有名.
故选:B.
【题型3 条形、折线、扇形统计图】
【例3】(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【答案】A
【解题思路】根据图1和图2,逐项分析判断即可.
【解答过程】结合图1和图2,计算可得2020至2024年第一产业增加值依次为
3167.578,3362.034,3505.425,3520.571,3543.75,成递增趋势,故A错误;
结合图1和图2,计算可得2020至2024年第二产业增加值依次为
15297.084,16939.479,17709.225,18712.076,19591.875,成递增趋势,故B正确;
由图2可知,2020至2024年第三产业增加值占地区生产总值比重逐年升高,故C正确;
由图1可知,2020至2024年全省地区生产总值逐年增长,故D正确.
故选:A.
【变式3.1】(24-25高二下·广东东莞·期中)为弘扬中华优秀传统文化,济南市公开招募“泉润非遗”志愿者.现从所有报名的志愿者中,随机选取300人进行调查,其中青年人、中年人、老年人三个年龄段的比例饼状图如图1所示,各年龄段志愿者的性别百分比等高堆积条形图如图2所示,则下列关于样本数据的分析正确的是( )
A.老年男性志愿者人数为90
B.老年女性志愿者人数大于中年女性志愿者人数
C.青年女性志愿者人数为72
D.中年男性志愿者人数大于青年男性志愿者人数
【答案】C
【解题思路】根据各个年龄层的人数,结合等高堆积条形图即可结合选项逐一求解.
【解答过程】由图1可知300名主播中,青年人有人,
中年人有人,老年人有人,
对于A,由图2可知样本老年男性志愿者人数为人,故A错误;
对于B,由图2可知老年女性志愿者人数为人;
中年女性志愿者有人;故B错误,
青年女性志愿者有人,故C正确,
中年男性志愿者人数为,青年男性志愿者人数,故D错误,
故选:C.
【变式3.2】(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
【答案】D
【解题思路】根据折线图分别判断信息及计算平均数进而判断各个选项即可.
【解答过程】对于A,由游客人数折线图可知,甲景点7,8,9月份的总游客人数为,乙景点的7,8,9月份的总游客人数为,,A正确;
对于B,根据乙景点的游客人数折线图可知,乙景点每月的游客人数逐月增多,所以总体呈上升趋势,故B正确;
对于C,甲景点游客人数的平均值为,,C正确;
对于D,由游客人数折线图可知,甲景点4月到9月中游客量的最高峰期在8月,乙景点4月到9月中游客量的最高峰期在9月,D错误.
故选:D.
【变式3.3】(24-25高一下·广东佛山·期末)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( )
A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成
C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元
【答案】B
【解题思路】利用统计图表一一分析选项即可.
【解答过程】对于A,由条形图可知丁险种参保比例为,
超过五成,故A正确;
对于B,由扇形图可知,41岁以上参保人数占比:,故B错误;
对于C,由扇形图与折线图可知18-29周岁人群参保人数占比,
人均参保费用在,而54岁及以上人群参保比例虽,
但人均参保费用在6000,所以18-29周岁人群参保的总费用最少,故C正确;
对于D,由扇形图与折线图可知,人均参保费用约
,
不超过5000元,故D正确.
故选:B.
模块二
总体百分位数的估计
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【题型4 百分位数的求解】
【例4】(24-25高一下·新疆阿克苏·期末)某班级的老师随机抽查了该班8名同学周末在家学习的时长(单位:h),所得数据如下:3,4,4,5,6,6,7,8,则这组数据的75%分位数为( )
A.6.5 B.6 C.5.5 D.5
【答案】A
【解题思路】根据百分位数的计算公式即可求解。
【解答过程】,故这组数据的75%分位数为,
故选:A.
【变式4.1】(24-25高一下·四川眉山·期末)为落实“双碳”目标,某环保组织调研10个国家2024年度的人均碳排放强度(单位:吨/人·年)后,得到数据如下:2,4,5,7,8,9,11,12,13,15.则该组数据的分位数是( )
A.5 B.6 C.7 D.12
【答案】B
【解题思路】根据百分位数的定义计算求解.
【解答过程】数据从小到大为:2,4,5,7,8,9,11,12,13,15,且,
则该组数据的分位数是.
故选:B.
【变式4.2】(24-25高一下·黑龙江·期末)2024年巴黎奥运会奖牌榜前8名的金牌数依次为40,40,20,18,16,15,14,13,则这组数据的上四分位数为( )
A.40 B.30 C.15 D.14.5
【答案】B
【解题思路】运用百分位数的求法求这组数据的上四分位数即可.
【解答过程】由题设,数据从小到大为,且,
所以数据的上四分位数为.
故选:B.
【变式4.3】(24-25高一下·河南商丘·期末)某校为了加强食堂用餐质量,该校随机调查了名学生,得到这名学生对食堂用餐质量给出的评分数据(评分均在[50,100]内),将所得数据分成五组:,,,,,得到如图所示的频率分布直方图,估计学生对食堂用餐质量的评分的第百分位数为( )
A.82.5 B.81.5 C.87.5 D.85
【答案】D
【解题思路】先判断第百分位数所在组,然后根据频率直方图面积之和等于确定取值.
【解答过程】因为,,
所以第60百分位数位于,设为,
则,
解得,即估计学生对食堂用餐质量的评分的第百分位数为.
故选:D.
模块三
总体集中趋势的估计
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平均数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中位数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【注意】1.若x1,x2,…,xn的平均数为,那么的平均数为.
【题型5 众数、中位数、平均数的计算】
【例5】(24-25高一下·山东临沂·月考)数据86,82,78,93,86,84,81,90,85,79,86,85,88,81,87的众数和中位数分别为( )
A.85,86 B.85,85 C.86,85 D.86,86
【答案】C
【解题思路】将数据按从小到大排序,根据众数和中位数的定义即可求解.
【解答过程】数据86,82,78,93,86,84,81,90,85,79,86,85,88,81,87从小到大排序可得:78,79,81,81,82,84,85,85,86,86,86,87,88,90,93,
所以该组数据的众数为86,中位数为.
故选:C.
【变式5.1】(2025·山东聊城·三模)已知数据,9,7,9的中位数和平均数相等,那么的值为( )
A.5 B.7 C.5或9 D.7或11
【答案】D
【解题思路】根据平均数的计算及中位数的定义,分类讨论,列出方程即可求解.
【解答过程】平均数为,
将这组数据排序,若,7,9,9,则中位数为,
所以,符合题意;
将这组数据排序,若7,,9,9,则中位数为,
所以,符合题意;
若7,9,9,,则中位数为,
所以,符合题意;
综上所述,的值为7或11,
故选:D.
【变式5.2】(24-25高一下·陕西汉中·期末)某校举办“迎七一”红歌比赛,五位评委给某参赛班级的评分分别为87,87,89,m,90,若这组数据的平均数为88,则这组数据的中位数为( )
A.88 B.87 C.89 D.90
【答案】B
【解题思路】根据给定的平均数求出m,再利用中位数的定义计算作答.
【解答过程】依题意,,解得,
参赛班级所得分从小到大依次为:87,87,87,89,90,
所以这组数据的中位数为87.
故选:B.
【变式5.3】(24-25高一下·河北邯郸·期末)已知高一三班的某次数学测试中,某学习小组的成绩如下:70,75,94,85,85,90,86,90,85,100,则该小组成绩的平均数、众数、中位数的大小关系是( )
A.众数=中位数<平均数 B.众数<中位数<平均数
C.众数<平均数<中位数 D.众数=平均数<中位数
【答案】B
【解题思路】根据众数、中位数、平均数的概念,求出相应的这三个数,比较大小,即得答案.
【解答过程】学习小组的成绩从小到大排列如下:70,75,85,85,85,86,90,90,94,100,
众数为85;中位数为,
平均数为,
故众数<中位数<平均数,
故选:B.
【题型6 根据频率分布直方图计算众数、中位数、平均数】
【例6】(24-25高一下·天津南开·期末)某人工智能公司为优化新开发的语言模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,图中,则下列结论不正确的( )
A.
B.满意度计分的众数约为75分
C.满意度计分的平均分约为80分
D.满意度计分的第一四分位数约为70分
【答案】C
【解题思路】由频率分布直方图的面积和为1可得A正确;由频率分布直方图计算众数,平均数,第25百分位数可得B正确,C错误,D正确.
【解答过程】对于A,由频率分布直方图可得,又,
解得,故A正确;
对于B,满意度计分的众数为最高矩形底边中点横坐标75分,故B正确;
对于C,满意度计分的平均分约为,故C错误;
对于D,前两组的频率之和为,所以满意度计分的第一四分位数约为70分,故D正确.
故选:C.
【变式6.1】(24-25高一下·福建龙岩·期末)某学校为了调查高一年级学生期中物理考试的情况,随机选取了100名学生成绩,绘制了如图所示的频率分布直方图,则( )
A.平均数的估计值为70(注:同一组数据用该组区间的中点值作为代表)
B.第60百分位数估计值为71
C.众数的估计值为75
D.随机选取这100名学生中只有25名学生物理成绩不低于80分
【答案】C
【解题思路】根据频率分布直方图中的数据,结合平均数,百分位数,众数和频率的计算方法,逐项计算求解,即可得到答案.
【解答过程】对于A中,根据频率分布直方图中的数据,可得数据的平均数为:
,所以A不正确;
对于B中,由前三个矩形的面积为,
前四个矩形的面积为,
所以数据的60百分位数落在第4个矩形,设为,则,所以B错误;
对于C中,根据频率分布直方图中的数据,可得数据的众数为,所以C正确;
对于D中,根据频率分布直方图,可得位于的频率为,
则,所以随机选取这100名学生中只有30名学生物理成绩不低于80分,所以D错误.
故选:C.
【变式6.2】(24-25高一下·黑龙江哈尔滨·期末)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图所示.
(1)估计此批棉花纤维长度的众数;
(2)估计此批棉花纤维长度的下四分位数和中位数;(保留整数)
(3)估计此批棉花纤维长度的平均数.(保留整数)
【答案】(1)
(2)下四分位数约为,中位数约为
(3)
【解题思路】(1)由众数的定义即可求解;
(2)由百分位数、中位数的定义即可求解;
(3)由平均数的定义即可求解.
【解答过程】(1)由图可知,区间对应的矩形最高,所以估计此批棉花纤维长度的众数为;
(2)因为前两组的频率之和为,前三组的频率之和,
所以估计此批棉花纤维长度的下四分位数在区间,且为,
因为前三组的频率之和,前四组的频率之和,
所以估计此批棉花纤维长度的中位数在区间,且为;
(3)估计此批棉花纤维长度的平均数为
.
【变式6.3】(24-25高一下·吉林长春·期末)某市为了研究高三学生在全市质检中的语文成绩的情况,从全市16000名学生中随机抽取了1600名学生的成绩作为样本(成绩均在内),将所得的成绩分成七组:,,,,,,,得到频率分布直方图如图所示.
(1)求的值,并估计该市语文成绩落在区间内的学生人数;
(2)估计本次考试全市语文成绩的中位数(精确到0.01)和平均数(同一组中的数据用该区间的中点值作代表).
【答案】(1),8000人
(2)中位数为97.14,平均数为98.2
【解题思路】(1)由频率分布直方图中小长方形的面积和为1求出,算出该市语文成绩落在区间的频率,进而可得答案;
(2)先确定中位数所在区间,然后根据中位数的概念列方程求解中位数;由频率分布直方图中平均数的计算方法求平均数.
【解答过程】(1)由题意知,解得,
所以该市语文成绩落在区间的频率为,
估计该市语文成绩落在区间内的学生人数是;
(2)由频率分布直方图得,分数在区间的频率为,
的频率分别为,
因此该校语文成绩的中位数在之间,
所以,解得,
语文成绩的平均数为.
模块四
总体离散程度的估计
1.总体离散程度的估计
(1)方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为.
总体标准差:.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的样本,其中的数据都相等.
【注意】
1.数据x1,x2,…,xn与数据的方差相等,即数据经过平移后方差不变.
2.若x1,x2,…,xn的方差为s2,那么的方差为a2s2.
【题型7 方差、标准差的求解及应用】
【例7】(2025·山东·三模)某班成立了A、B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组平均成绩为130分,方差为115,B组平均成绩为110分,方差为215,则在这次测试中,全班学生的平均成绩和方差为( )
A.120分, 105 B.120分, 265 C.115分, 105 D.115分, 265
【答案】D
【解题思路】先利用加权平均数公式求出全班学生的平均成绩,再利用混合模型的方差公式计算即得.
【解答过程】依题意,A组10人,B组30人,A组平均成绩为130分,方差为115,B组平均成绩为110分,方差为215.
则全班学生的平均成绩为:,
其方差为:.
故选:D.
【变式7.1】(24-25高一下·河南信阳·期末)数据的平均数为,方差,现在增加两个数据和,则这组新数据的标准差为( )
A. B. C. D.
【答案】B
【解题思路】根据平均数的计算公式求出新数据的平均数,再根据方差的计算公式求出新数据的方差,最后根据标准差与方差的关系求出新数据的标准差.
【解答过程】数据的平均数为,方差
即,
则数据,,的平均数为
方差,
标准差为.
故选B.
【变式7.2】(24-25高一下·山东滨州·期末)设一组样本数据的平均数为3,方差为4,则数据,,,,的平均数和方差分别为( )
A.4,14 B.4,16 C.5,14 D.5,16
【答案】C
【解题思路】由平均数公式可得,由方差公式可得,再利用平均数和方差公式可求得结果.
【解答过程】由样本数据的平均数为,方差为,得,,
则,,
因此数据,的平均数为
,
方差为
.
故选:C.
【变式7.3】(24-25高一下·安徽六安·期末)某中学高一年级有600名男学生,400名女学生,现用分层随机抽样的方法调查了50名高一学生的身高.若样本中男生身高的平均数和方差分别为172和9,女生身高的平均数和方差分别为162和14,则估计高一年级学生的平均身高和方差分别为( )
A.168,35 B.168,20 C.169.6,35 D.169.6,20
【答案】A
【解题思路】先得到样本中的男生和女生人数,进而利用平均数和整体方差的求解公式进行计算.
【解答过程】男学生和女学生人数比例为,
故样本中男生人数为人,女生人数为人,
样本的平均数为,
样本的方差为.
故选:A.
【题型8 频率分布直方图中的方差、标准差】
【例8】(24-25高一下·山东济宁·期末)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)求样本成绩的上四分位数;
(3)已知落在的平均成绩是57,方差是7,落在的平均成绩为69,方差是4,求两组成绩的总平均数和总方差.
【答案】(1);
(2)84;
(3)总平均数为65;总方差为37.
【解题思路】(1)由频率直方图小矩形的面积和为1列方程求参数;
(2)由百分位数的定义及直方图求上四分位数;
(3)应用分层抽样的均值和方差公式求总平均数和总方差.
【解答过程】(1)因为每组小矩形的面积之和为1,
所以,则;
(2)成绩落在内的频率为,
落在内的频率为,
设上四分位数为m,由,得,
故上四分位数为84;
(3)成绩在的市民人数为,
成绩在的市民人数为,
故这两组成绩的总平均数为,
由样本方差计算总体方差公式可得总方差为
.
【变式8.1】(24-25高一下·吉林松原·期末)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第80百分位数;求样本平均数;
(2)已知落在区间的样本平均成绩是57,标准差是7,落在区间的样本平均成绩为66,标准差是4,求两组样本成绩合并后的平均数和方差.
【答案】(1),第80百分位数为,样本平均数为74;
(2),.
【解题思路】(1)由频率之和为1即可求a,先依次求出前4组和前5组频率之和得到样本成绩的第80百分位数所在区间即可计算求解,由频率分布直方图的平均数计算公式直接计算即可求平均数;
(2)先依次求出两区间的样本个数、样本平均成绩、方差,再由总体平均数公式和总体方差公式即可计算两组样本成绩合并后的平均数和方差.
【解答过程】(1)由题意,
所以前4组频率之和,
前5组频率之和,
所以样本成绩的第80百分位数在区间内,且为,
样本平均数为;
(2)由题可得落在区间的样本个数为,样本平均成绩是,方差是,
落在区间的样本个数为,样本平均成绩是,方差是,
所以两组样本成绩合并后的平均数为,
两组样本成绩合并后的方差为.
【变式8.2】(24-25高一下·湖北武汉·月考)“数学好玩”是国际著名数学家陈省身赠送给少年数学爱好者们的一句话.某校为了更好地培养学生创新精神和实践能力,特举办数学竞赛活动,在活动中,共有19道题.从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的上四分位数;
(2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【答案】(1);上四分位数为84.
(2)总平均数;总方差.
【解题思路】(1)根据频率之和为1列式即可求解的值;根据频率分布直方图先明确样本成绩的第分位数所在的范围,再结合已知数据即可求解.
(2)先分别求出成绩落在和内的人数,再根据平均数定义和分层随机抽样的方差公式即可求解.
【解答过程】(1)因为频率之和为1,所以,
解得.
成绩落在内的频率为,
落在内的频率为,
设第分位数为,则,
由,得,
所以样本成绩的第分位数为84.
综上,;上四分位数为84.
(2)由图可知,成绩在的人数为,
成绩在的人数为,
故这两组成绩的总平均数,
总方差.
综上,总平均数;总方差.
【变式8.3】(24-25高一下·贵州黔南·期末)2025年7月,黔南州“铁人三项赛”在州府都匀市举行.志愿者的服务工作是比赛成功举办的重要保障,都匀市某单位承办了志愿者选拔的面试工作.现随机抽取100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值.
(2)估计这100名候选者面试成绩的平均数和第60百分位数(保留两位小数).
(3)现从以上各组中用分层随机抽样的方法选取部分担任本市的宣传者.若这100名面试者中第四组面试者的面试成绩的平均数和方差分别为80和15,第五组面试者的面试成绩的平均数和方差分别为90和20,据此估计这次第四组和第五组所有面试者的面试成绩的方差.
【答案】(1)
(2)69.50;71.67
(3)32
【解题思路】(1)根据频率直方图中各小矩形的面积之和为1,列式求解;
(2)根据频率直方图估算平均数公式,百分位数定义列式求解;
(3)根据分层抽样的抽样比公式,结合总体方差运算公式进行求解即可.
【解答过程】(1),解得.
(2)由频率分布直方图易知每组的频率依次为,
所以这100名候选者面试成绩的平均数约为
.
因为,
设这100名候选者面试成绩的第60百分位数为x,则,
则,解得,
故第60百分位数为.
(3)设第四组、第五组面试者的面试成绩的平均数与方差分别为,
且两组频率之比为,
则第四组和第五组所有面试者的面试成绩的平均数为,
第四组和第五组所有面试者的面试成绩的方差为
,
故估计第四组和第五组所有面试者的面试成绩的方差是32.
【题型9 其他统计图表中用样本估计总体】
【例9】(24-25高一上·全国·周测)某校对七年级名同学最喜欢喝的饮料种类情况、八年级名同学零花钱的最主要用途情况、九年级名同学完成家庭作业时间情况进行了全面调查,并分别用扇形统计图、条形统计图、表格来描述整理得到的数据.
九年级同学完成家庭作业时间情况统计表
时间
小时左右
小时左右
小时左右
小时左右
人数
根据以上信息,请回答下列问题:
(1)七年级名同学中最喜欢喝“冰红茶”的人数是多少?
(2)补全八年级名同学中零花钱的最主要用途情况的条形统计图;
(3)九年级名同学中完成家庭作业的平均时间大约是多少小时?(结果保留两位小数)
【答案】(1)(人)
(2)图表见解析
(3)(小时)
【解题思路】(1)利用图中的数据可求得七年级名同学中最喜欢喝“冰红茶”的人数;
(2)计算出八年级名同学中利用零花钱买学习资料的学生人数,即可补全条形图;
(3)利用平均数公式可求得九年级名同学中完成家庭作业的平均时间.
【解答过程】(1)由扇形统计图可知,七年级名同学中最喜欢喝“冰红茶”的人数为
(人).
(2)由题意可知,八年级名同学中利用零花钱买学习资料的学生人数为
,
补全条形统计图如图所示.
(3)由表格中的数据可知,九年级名同学中完成家庭作业的平均时间为
(小时).
【变式9.1】(24-25高一上·全国·课后作业)为选派一名学生参加全市实践活动技能竞赛,A,B两位同学在学校实习基地现场进行加工直径为20 mm的零件的测试,他俩各加工的10个零件的相关数据依次如下图和下表所示(单位:mm).
平均数
方差
完全符合要求的个数
A
20
0.026
2
B
20
5
根据测试得到的有关数据,试解答下列问题:
(1)考虑平均数与完全符合要求的个数,你认为谁的成绩好些;
(2)计算出的大小,考虑平均数与方差,说明谁的成绩好些;
(3)考虑图中折线走势及竞赛中加工零件个数远远超过10个的实际情况,你认为派谁去参赛较合适?请说明你的理由.
【答案】(1)B的成绩好些.
(2)0.008,B的成绩好些
(3)可选派A去参赛,理由见解析
【解题思路】(1)从B同学完全符合要求的个数比A同学完全符合要求的个数多得到答案;
(2)利用方差计算公式得到,与比较后得到结论;
(3)A的成绩后来逐渐稳定,误差小,从而选A去参赛.
【解答过程】(1)因为A、B两位同学成绩的平均数相同,且B同学完全符合要求的个数比A同学完全符合要求的个数多,由此认为B的成绩好些;
(2)∵,
且,
∴.
故在平均数相同的情况下,B的波动性小,
∴B的成绩好些;
(3)从题图中折线图走势可知,尽管A的成绩前面起伏较大,但后来逐渐稳定,误差小,预测A的潜力大,可选派A去参赛.
【变式9.2】(24-25高一上·全国·单元测试)为了了解某中学学生的身高情况,随机对该校男生、女生的身高进行抽样调查,已知抽取的样本中,男生、女生的人数相同,根据所得数据绘制成如图所示的统计图表.
组别
身高(cm)
A
B
C
D
E
根据图表中信息,回答下列问题:
(1)在样本中,男生身高的中位数落在________组(填组别序号),女生身高在B组的有________人;
(2)在样本中,身高在之间的共有________人,身高人数最多的在________组(填组别序号);
(3)已知该校共有男生500人,女生480人,请估计身高在之间的学生约有多少人?
【答案】(1),12
(2)16,
(3)541人
【解题思路】(1)根据中位数的定义得到中位数的位置,根据B组人数占比得到B组人数;
(2)由图知男生有4人,由(1)知女生有12人,相加即可.
(3)根据男生、女生总人数及占比,可以求得所求人数.
【解答过程】(1)∵在样本中,共有男生(人),
∴中位数是第20和第21人的平均数,∴男生身高的中位数落在D组,
女生身高在B组的有(人).
(2)在样本中,身高在之间的共有(人),身高人数最多的在C组.
(3)由于(人),
故估计身高在之间的学生约有541人.
【变式9.3】(24-25高二上·四川成都·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:
(1)分别计算甲、 乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
【答案】(1)甲、 乙两厂提供10个轮胎宽度的平均值分别为195,194.
(2)从平均数上来看:乙厂提供的 10个轮胎中所有标准轮胎宽度高于甲厂提供的 10个轮胎中所有标准轮胎宽度,但乙厂提供的 10个轮胎中所有标准轮胎宽度方差较大,不够稳定.
【解题思路】(1)由折线图提供的数据,利用平均数公式代入计算即可;
(2)分别找出甲乙两厂的所有标准轮胎宽度的数据,再分别求出平均值与方差,即可判断.
【解答过程】(1)由题:甲厂轮胎宽度的平均值为:
;
乙厂轮胎宽度的平均值为:
;
所以甲、 乙两厂提供10个轮胎宽度的平均值分别为195,194.
(2)由题,甲厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
乙厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
从平均数上来看:乙厂提供的 10个轮胎中所有标准轮胎宽度高于甲厂提供的 10个轮胎中所有标准轮胎宽度,但乙厂提供的 10个轮胎中所有标准轮胎宽度方差较大,不够稳定.
一、单选题
1.(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按 分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
【答案】A
【解题思路】利用频率和为1求参数,再估计身高低于170cm的人数.
【解答过程】由图可得,得,
所以估计这100名学生中身高低于170cm的人数为.
故选:A.
2.(24-25高一下·云南曲靖·期末)小冉同学近9次考试的数学成绩如下:72,74,80,83,85,85,93,100,107,请问这组数据的第40百分位数是( )
A.81.5 B.80 C.84 D.83
【答案】D
【解题思路】应用百分位数的定义求数据的第40百分位数.
【解答过程】数学成绩从小到大为,
所以,故数据的第40百分位数是第四个数,为.
故选:D.
3.(24-25高一下·贵州遵义·月考)数据的平均数为5,则的平均数为( )
A.15 B.13 C.11 D.9
【答案】D
【解题思路】利用平均数的定义,先求得的和,即可求解.
【解答过程】因为数据的平均数为5,
所以的和为,
所以的平均数为,
故选:D.
4.(24-25高一下·河北·月考)在统计学中,月度同比是指本月份和上一年同月份相比较的增长率,月度环比是指本月份和上一个月份相比较的增长率.如图是国家统计局发布的2023年全国居民消费价格月度涨跌幅度折线图,则下列说法正确的是( )
A.2023年2月至6月居民的消费价格持续下降
B.2023年7月居民消费价格高于2022年同期
C.2023年4月居民消费价格环比上涨0.1%,同比下降0.1%
D.2023年8月的居民消费价格是全年最高的
【答案】A
【解题思路】由月度同比、月度环比折线图逐个判断即可.
【解答过程】对于A:2月至6月环比增长率分别是,故消费价格持续下降;正确;
对于B:由月度同比图可知2023年7月居民消费价格低于2022年同期;错误;
对于C:2023年4月居民消费价格环比下降0.1%,同比上升0.1%,错误;
对于D:虽然2023年8月的月度环比上涨幅度较大,但仅根据环比数据不能直接得出8月的居民消费价格是全年最高的,因为前面的月份价格也有变化情况,例如1月同比上涨,且后续月份价格变化复杂,不能简单判断8月价格最高,错误;
故选:A.
5.(24-25高一下·福建南平·期末)如图,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态.根据所给图示作出判断,则下列结论正确的是( )
A.图(1)中平均数中位数众数 B.图(2)中平均数众数中位数
C.图(2)中众数平均数中位数 D.图(3)中平均数中位数众数
【答案】D
【解题思路】由频率分步直方图概念,结合中位数,平均数,众数定义结合图形可得答案.
【解答过程】对于图1,平均数中位数众数,故A错误;
对于图2,众数中位数平均数,故BC错误;
对于图3,平均数中位数众数,故D正确.
故选:D.
6.(24-25高一下·贵州遵义·月考)已知样本容量为5的样本平均数为3,方差为,将数据9加入原样本得到样本容量为6的新样本,若新样本的平均数为,方差为,则( )
A. B. C. D.
【答案】B
【解题思路】设原样本为,,,,,根据平均数和方差的计算公式,可得,,再利用公式计算新样本的平均数和方差即可.
【解答过程】设原样本为,,,,,
则:,
.
所以,
.
故选:B.
7.(24-25高一下·浙江宁波·期末)学校为了解全校1800名学生的身体肥胖情况,随机抽取了100名学生的体检数据,将其BMI值分成以下五组:,,,,,得到相应的频率分布直方图,如图所示.则下列说法错误的是( )
A.
B.估计样本的中位数为23
C.估计样本的众数为22
D.估计全校学生BMI值落在区间的人数为36人
【答案】D
【解题思路】对A,根据频率和为1求解即可;对B,根据成绩低于中位数的频率为0.5计算即可;对C,根据频率分布直方图的众数判断即可;对D,计算区间的频率,进而可得人数.
【解答过程】对A,由题意,,解得,故A正确;
对B,区间的频率分别为,
因为,,故中位数位于内.
设中位数为,则,解得,故B正确;
对C,由直方图可得估计这组数据的众数为,故C正确;
对D,由直方图可得的频率为,
故估计全校学生BMI值落在区间的人数为,故D错误.
故选:D.
8.(24-25高一下·山东青岛·期末)抽样调查得到20个样本数据,记作,样本数据的平均数为9,方差5.现去掉一个最大值13和一个最小值5,产生一组新数据,关于这组新数据,下列说法错误的是( )
A.中位数一定不变 B.极差一定变小
C.方差一定变小 D.平均数一定不变
【答案】B
【解题思路】由题可设20个样本数据从小到大排列为,通过计算可逐项判断.
【解答过程】不妨设20个样本数据从小到大排列为,
去掉最小,最大,剩下共18个样本数据,
原样本中位数为,新样本中位数也为,故A正确;
新样本极差为,所以极差有可能与原来相等,故B错误;
因为原样本均值为,所以新样本均值,故D正确;
原样本方差,
新样本方差,
所以新样本方差变小,故C错误;
故选:B.
二、多选题
9.(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
【答案】ABD
【解题思路】根据扇形图及条形图得出5条线路的各个数据,再结合选项分别判断即可.
【解答过程】因为2025年高明线的参与人数是2016年的2倍,则2016年的高明线的参与人数是万人,
对于A:根据扇形图得出万,所以2016年佛山50公里徒步总的参与人数是20万,A选项正确;
2016年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
2025年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
对于B:因为,2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和,B选项正确;
对于C:五条线的参与人数2025年与2016年相比增加人数最少的是高明线,C选项错误;
对于D:南海线的参与人数2025年与2016年相比增长率,顺德线的参与人数2025年与2016年相比增长率,
禅城线的参与人数2025年与2016年相比增长率,三水线的参与人数2025年与2016年相比增长率,
高明线的参与人数2025年与2016年相比增长率,所以五条线的参与人数2025年与2016年相比增长率最高的是南海线,D选项正确;
故选:ABD.
10.(24-25高一下·吉林长春·期末)在某市初三年级举行的一次体育统考考试中,共有500人参加考试.为了解学生的成绩情况,抽取了样本容量为的部分考生成绩,已知所有考生成绩均在,按照,,,,的分组作出如图所示的频率分布直方图、若在样本中,成绩落在区间的人数为32,则由样本估计总体可知下列结论正确的为( )
A. B.估计考生成绩的众数为72
C.估计考生成绩的中位数为71 D.估计该市考生成绩的平均分为70.6
【答案】ACD
【解题思路】根据频率分布直方图的特征先计算,再计算样本数即可得A,由频率分布直方图计算众数、中位数、平均数并估计总体即可判定B、C、D选项.
【解答过程】由频率分布直方图可知,
∴,故A正确;
由频率分布直方图可知众数落在区间上,则考生成绩的众数为75,故B错误;
由于,所以中位数位于区间内,
同时可知考生成绩的中位数为:,故C正确;
由频率分布直方图可知样本中,
考生成绩的平均分为 ,
可估计整体学生的平均分为70.6,故D正确.
故选:ACD.
11.(24-25高一下·河南洛阳·期末)甲、乙、丙、丁四人各掷骰子5次,并记下自己投掷时出现的点数,从而得到四组数据,这四组数据的相关情况如下:
甲:中位数为3,众数为2;
乙:中位数为3,极差为4;
丙:平均数为3,中位数为2;
丁:平均数为2,方差为3.2.
则在投掷过程中可能出现点数6的是( )
A.甲 B.乙 C.丙 D.丁
【答案】ABC
【解题思路】通过取掷骰子的点数,即可得A,B和C正确,再通过检验平均数为2,出现点数6时,方差为,即可求解.
【解答过程】若骰子的点数为,此时中位数为3,众数为2,极差为4,所以甲、乙投掷过程中可能出现点数6,
若骰子的点数为,此时平均数为3,中位数为2,所以丙投掷过程中可能出现点数6,
若掷骰子5次,平均数为2,方差为3.2,不妨设这5次骰子的点数分别为,
则,若,则,
此时方差为,
所以丁在投掷过程中不可能出现点数6,
故选:ABC.
三、填空题
12.(24-25高一下·黑龙江大庆·期末)样本数据5,11,6,8,14,6,10,5,9,8的分位数________.
【答案】7
【解题思路】根据百分位数的概念求解.
【解答过程】样本数据由小到大排序为:5,5,6,6,8,8,9,10,11,14,共10个,
又,则样本数据的分位数为.
故答案为:7.
13.(24-25高一下·北京平谷·期末)已知某校高一年级1000人,为普及航天知识,开展了航天知识竞赛.将成绩(单位:分)分成6组,绘制成频率分布直方图,如图所示:则成绩在分的有________人.
【答案】
【解题思路】先求出成绩在分的频率,再求出人数即可.
【解答过程】因为成绩在分的频率为,
所以成绩在分的有人.
故答案为:.
14.(24-25高一下·湖南衡阳·期末)衡阳市一中高一某班45名学生成立了A、B两个数学兴趣小组,A组25人,B组20人,经过一个月的强化培训后进行了一次测试,在该次测试中,A组的平均成绩为82分,方差为8,B组的平均成绩为86.5分,方差为2,则在这次测试中全班学生成绩的方差为________.
【答案】
【解题思路】利用分层抽样的方差公式计算即可.
【解答过程】设,,,,,,
则全班学生成绩的平均数为,
全班学生成绩的方差为 ,
故答案为:.
四、解答题
15.(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
【答案】(1)表格见解析
(2)作图见解析
(3)504
【解题思路】(1)利用频率、频数和样本容量的关系即可完成此表格;
(2)利用表中数据计算出这个分数段对应的矩形高度即可完成频率分布直方图.
(3)先找出成绩分及以上对应的分数段的频率,再用该频率乘以总人数即可得到.
【解答过程】(1)由频率分布表,可知样本容量为50,
故成绩在[60,70)的频数为,
成绩在[70,80)的频率为,
成绩在[90,100]的频数为,
频率为,
故频率分布表为:
分组
频数
频率
[50,60)
4
0.08
[60,70)
8
0.16
[70,80)
10
0.20
[80,90)
16
0.32
[90,100]
12
0.24
合计
50
1
(2)频率分布直方图如图所示:
(3)样本中成绩在[80,100]的频率为0.32 + 0.24 = 0.56,
所以估计该校获得环保纪念勋章的学生人数为900×0.56 = 504.
16.(24-25高一下·甘肃嘉峪关·期中)某校抽取100名高二学生期中考试的语文成绩,绘制频率分布直方图(如图所示),其中样本数据分组区间为:,,…,,.
(1)求频率分布直方图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的中位数和平均数.(保留小数点后1位)
【答案】(1)
(2)中位数为:;平均数为:
【解题思路】(1)根据给定的频率分布直方图,利用各小矩形面积和为1求出值.
(2)利用频率分布直方图估计中位数和平均数.
【解答过程】(1)由频率分布直方图,得,
所以.
(2)由频率分布直方图,样本数据在的频率为,在的频率为,
因此语文成绩的中位数,则,则,
这100名学生语文成绩的平均数为:
.
17.(24-25高一下·黑龙江双鸭山·月考)随着新能源电动汽车的推广,人们对电动汽车的电池续航能力非常关注,某4S店为了解车主对甲、乙两款电动汽车电池续航能力的满意程度,从该店销售的甲、乙两款车中各随机抽取10名车主对其所使用车辆的电池续航能力的评分(单位:分),并对数据进行整理、描述和分析(评分用x表示,共分为三组:A.,B.,C.),下面给出了部分信息:甲款电动汽车10名车主的评分是:100,95,85,85,80,80,80,80,75,70.乙款电动汽车10名车主的评分在B组的数据是:85,85,85,80,80.抽取的甲、乙两款电动汽车车主的评分统计表如下:
车型
平均数
中位数
众数
甲
83
80
a
乙
83
b
85
抽取的乙款电动汽车车主的评分扇形统计图如图:
根据以上信息,解答下列问题:
(1)上述图表中__________,__________,__________.
(2)根据以上数据,你认为哪款电动汽车的电池续航能力的满意度更好?请说明理由(写出一条理由即可).
(3)该4S店甲款电动汽车的车主有600人,乙款电动汽车的车主有400人.若评分不低于90分为“非常满意”,估计这些车主中对其所使用车辆的电池续航能力“非常满意”的总共有多少人?
【答案】(1)
(2)乙款的满意度更好,理由见解析
(3)200
【解题思路】(1)利有扇形图来统计乙款电动汽车车主的分布情况,从而可得每组各有几个数据,即可得众数,中位数,百分比;
(2)平均数虽然一样,利用众数和中位数可以知道数据越大的满意度越高;
(3)利用样本频率去估计总体中非常满意的人数即可.
【解答过程】(1)甲款电动汽车10名车主的评分数据中,80出现的次数最多,故众数为80,即;
乙款电动汽车车主的评分扇形统计图中A组占,B组占,
C组占,所以;
所以A组有两个最大的数据,C组有三个最大的数据,
而B组的数据有5个:
所以最中间的两个数为85,80,所以中位数为,即.
故,,;
(2)乙款电动汽车的电池续航能力的满意度更好,理由如下:
甲款和乙款的平均数相等,但乙款的众数和中位数都比甲款的大,所以乙款的满意度更好.
(3)甲款电动汽车的车主“非常满意”的有两人,占比为,
乙款电动汽车的车主“非常满意”的占比为,
所以满足题意的总人数约为:(人).
18.(24-25高一下·广东惠州·期末)为了解某小区居民的体育锻炼时间,随机在该小区选取了名住户,将他们上周体育锻炼的时间 (单位: 时) 按照、、、、分成组, 制成如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)根据频率分布直方图估计样本数据的第百分位数;
(3)根据频率分布直方图,用每组数据区间中点值作代表,估计这名住户上周体育锻炼时间的平均值.
【答案】(1)
(2)
(3)小时
【解题思路】(1)在频率分布直方图中,所有条形图的面积之和为,列式可求得实数的值;
(2)设样本数据的第百分位数为,则,利用百分位数的定义可得出关于的等式,解之即可;
(3)将每个矩形底边的中点值乘以对应矩形的面积,再将所得结果全加,即可得出样本的平均数.
【解答过程】(1)在频率分布直方图中,所有条形图的面积之和为,
可得,解得.
(2)前三个矩形的面积之和为,
前四个矩形的面积之和为,
设样本数据的第百分位数为,则,
由百分位数的定义可得,解得.
(3)由频率分布直方图可知,样本的平均数为.
估计这名住户上周体育锻炼时间的平均值为小时.
19.(24-25高一下·安徽合肥·期末)新高考模式下,学生是否选择物理作为高考考试科目对大学专业选择有着非常重要的意义.合肥六中为了解高一年级1800名学生物理科目的学习情况,将他们某次物理测试成绩(满分100分)按照分成6组,制成如图所示的频率分布直方图.
(1)求1800名学生中物理测试成绩在内的频数并补全频率分布直方图.
(2)学校建议,本次物理测试成绩不低于分的学生选择物理为高考考试科目,若学校希望高一年级恰有的学生选择物理为高考考试科目,试求的估计值(结果精确到).
(3)已知落在的学生成绩的平均数为,方差,落在的学生成绩的平均数为,方差,若两组学生成绩的平均数之差不大于6,求落在的学生成绩的方差的最大值.
【答案】(1)图见解析
(2)
(3)
【解题思路】(1)根据频率分布直方图各小矩形面积和为1及频率、频数的关系求解.
(2)根据频率分布直方图求第70百分位数可得;
(3)根据方差的求法,方差转化为,进而可得.
【解答过程】(1)由频率分布直方图可得物理测试成绩在的频率为
,
频数为,
所以1800名学生中物理测试成绩在内的频数为270,补全频率分布直方图如图所示.
(2)易得前两段频率之和为,前三段频率之和,
则有
满足,所以(分)
(3)成绩在的频数为270人,,
成绩在的频数为540人,,
所以的学生成绩的平均值为,
由方差公式知,,
所以该班成绩的方差为:
所以的最大值为.
第 1 页 共 23 页
学科网(北京)股份有限公司
$
第16讲 用样本估计总体
【人教A版】
模块一
总体取值规律的估计
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【题型1 补全、绘制频率分布直方图】
【例1】(24-25高二·上海·课堂例题)从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):,2;,3;,10;,15;,12;,8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在分的学生所占总体的百分比.
【变式1.1】(24-25高一下·辽宁阜新·月考)有一个容量为60的样本(60名学生的数学考试成绩),分组情况如下表:
分组
频数
3
6
12
频率
0.3
(1)补全表中所剩的空格;
(2)画出频率分布直方图和频率分布折线图.
【变式1.2】(24-25高一下·吉林长春·月考)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁)
频数
频率
5
0.05
①
0.20
35
②
30
0.30
10
0.10
总计
100
1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在岁的人数;
(3)现用比例分配的分层随机抽样从、、的样本中共抽取n名志愿者,已知从中抽取了2人,求n的值.
【变式1.3】(24-25高一下·全国·单元测试)为了让学生了解环保知识,增强环保意识,某中学举办了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频数分布表和频数分布直方图,解答下列问题:
分组
频数
频率
50.5~60.5
4
0.08
60.5~70.5
0.16
70.5~80.5
10
80.5~90.5
16
0.32
90.5~100.5
合计
50
(1)填充频数分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5的学生为二等奖,问获得二等奖的学生约为多少人?
【题型2 频率分布直方图的相关计算问题】
【例2】(24-25高一下·江苏连云港·月考)某科研单位对Deepseek的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在50分到100分之间的问卷)中随机抽取了100份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,这批用户问卷的得分不低于80分的份数为( )
A.20 B.30 C.35 D.40
【变式2.1】(24-25高一下·安徽·月考)某厂对一批产品进行抽样检测,如图所示的是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为.若这批产品有200个,估计其中净重大于或等于80克的个数是( )
A.110 B.140 C.150 D.90
【变式2.2】(24-25高三上·天津河东·期末)某校根据学生情况将物理考试成绩进行赋分,目的是为了更好地对新高考改革中不同选科学生的考试成绩进行横向对比,经过对全校300名学生的成绩统计,可得到如图所示的频率分布直方图,则这些同学物理成绩大于等于60分的人数为( )
A.270 B.240 C.180 D.150
【变式2.3】(2025高二下·湖南·学业考试)某中学举行了一次“网络信息安全”知识竞赛,将参赛的500名学生成绩分为6组,绘制了如图所示的频率分布直方图,则成绩在区间内的学生有( )
A.80名 B.100名 C.120名 D.140名
【题型3 条形、折线、扇形统计图】
【例3】(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【变式3.1】(24-25高二下·广东东莞·期中)为弘扬中华优秀传统文化,济南市公开招募“泉润非遗”志愿者.现从所有报名的志愿者中,随机选取300人进行调查,其中青年人、中年人、老年人三个年龄段的比例饼状图如图1所示,各年龄段志愿者的性别百分比等高堆积条形图如图2所示,则下列关于样本数据的分析正确的是( )
A.老年男性志愿者人数为90
B.老年女性志愿者人数大于中年女性志愿者人数
C.青年女性志愿者人数为72
D.中年男性志愿者人数大于青年男性志愿者人数
【变式3.2】(24-25高一下·贵州六盘水·期末)为了研究我市甲、乙两个旅游景点的游客情况,文旅局统计了今年4月到9月甲、乙两个旅游景点的游客人数(单位:万人),得到如图所示的折线图.根据两个景点的游客人数的折线图,下列说法错误的是( )
A.7,8,9月份的总游客人数甲景点比乙景点少
B.乙景点4月到9月的游客人数总体呈上升趋势
C.甲景点4月到9月游客人数的平均值在内
D.甲、乙两景点4月到9月中游客量的最高峰期都在8月
【变式3.3】(24-25高一下·广东佛山·期末)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( )
A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成
C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元
模块二
总体百分位数的估计
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【题型4 百分位数的求解】
【例4】(24-25高一下·新疆阿克苏·期末)某班级的老师随机抽查了该班8名同学周末在家学习的时长(单位:h),所得数据如下:3,4,4,5,6,6,7,8,则这组数据的75%分位数为( )
A.6.5 B.6 C.5.5 D.5
【变式4.1】(24-25高一下·四川眉山·期末)为落实“双碳”目标,某环保组织调研10个国家2024年度的人均碳排放强度(单位:吨/人·年)后,得到数据如下:2,4,5,7,8,9,11,12,13,15.则该组数据的分位数是( )
A.5 B.6 C.7 D.12
【变式4.2】(24-25高一下·黑龙江·期末)2024年巴黎奥运会奖牌榜前8名的金牌数依次为40,40,20,18,16,15,14,13,则这组数据的上四分位数为( )
A.40 B.30 C.15 D.14.5
【变式4.3】(24-25高一下·河南商丘·期末)某校为了加强食堂用餐质量,该校随机调查了名学生,得到这名学生对食堂用餐质量给出的评分数据(评分均在[50,100]内),将所得数据分成五组:,,,,,得到如图所示的频率分布直方图,估计学生对食堂用餐质量的评分的第百分位数为( )
A.82.5 B.81.5 C.87.5 D.85
模块三
总体集中趋势的估计
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平均数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中位数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【注意】1.若x1,x2,…,xn的平均数为,那么的平均数为.
【题型5 众数、中位数、平均数的计算】
【例5】(24-25高一下·山东临沂·月考)数据86,82,78,93,86,84,81,90,85,79,86,85,88,81,87的众数和中位数分别为( )
A.85,86 B.85,85 C.86,85 D.86,86
【变式5.1】(2025·山东聊城·三模)已知数据,9,7,9的中位数和平均数相等,那么的值为( )
A.5 B.7 C.5或9 D.7或11
【变式5.2】(24-25高一下·陕西汉中·期末)某校举办“迎七一”红歌比赛,五位评委给某参赛班级的评分分别为87,87,89,m,90,若这组数据的平均数为88,则这组数据的中位数为( )
A.88 B.87 C.89 D.90
【变式5.3】(24-25高一下·河北邯郸·期末)已知高一三班的某次数学测试中,某学习小组的成绩如下:70,75,94,85,85,90,86,90,85,100,则该小组成绩的平均数、众数、中位数的大小关系是( )
A.众数=中位数<平均数 B.众数<中位数<平均数
C.众数<平均数<中位数 D.众数=平均数<中位数
【题型6 根据频率分布直方图计算众数、中位数、平均数】
【例6】(24-25高一下·天津南开·期末)某人工智能公司为优化新开发的语言模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,图中,则下列结论不正确的( )
A.
B.满意度计分的众数约为75分
C.满意度计分的平均分约为80分
D.满意度计分的第一四分位数约为70分
【变式6.1】(24-25高一下·福建龙岩·期末)某学校为了调查高一年级学生期中物理考试的情况,随机选取了100名学生成绩,绘制了如图所示的频率分布直方图,则( )
A.平均数的估计值为70(注:同一组数据用该组区间的中点值作为代表)
B.第60百分位数估计值为71
C.众数的估计值为75
D.随机选取这100名学生中只有25名学生物理成绩不低于80分
【变式6.2】(24-25高一下·黑龙江哈尔滨·期末)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图所示.
(1)估计此批棉花纤维长度的众数;
(2)估计此批棉花纤维长度的下四分位数和中位数;(保留整数)
(3)估计此批棉花纤维长度的平均数.(保留整数)
【变式6.3】(24-25高一下·吉林长春·期末)某市为了研究高三学生在全市质检中的语文成绩的情况,从全市16000名学生中随机抽取了1600名学生的成绩作为样本(成绩均在内),将所得的成绩分成七组:,,,,,,,得到频率分布直方图如图所示.
(1)求的值,并估计该市语文成绩落在区间内的学生人数;
(2)估计本次考试全市语文成绩的中位数(精确到0.01)和平均数(同一组中的数据用该区间的中点值作代表).
模块四
总体离散程度的估计
1.总体离散程度的估计
(1)方差和标准差
假设一组数据是x1,x2,…,xn,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为.
总体标准差:.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的样本,其中的数据都相等.
【注意】
1.数据x1,x2,…,xn与数据的方差相等,即数据经过平移后方差不变.
2.若x1,x2,…,xn的方差为s2,那么的方差为a2s2.
【题型7 方差、标准差的求解及应用】
【例7】(2025·山东·三模)某班成立了A、B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组平均成绩为130分,方差为115,B组平均成绩为110分,方差为215,则在这次测试中,全班学生的平均成绩和方差为( )
A.120分, 105 B.120分, 265 C.115分, 105 D.115分, 265
【变式7.1】(24-25高一下·河南信阳·期末)数据的平均数为,方差,现在增加两个数据和,则这组新数据的标准差为( )
A. B. C. D.
【变式7.2】(24-25高一下·山东滨州·期末)设一组样本数据的平均数为3,方差为4,则数据,,,,的平均数和方差分别为( )
A.4,14 B.4,16 C.5,14 D.5,16
【变式7.3】(24-25高一下·安徽六安·期末)某中学高一年级有600名男学生,400名女学生,现用分层随机抽样的方法调查了50名高一学生的身高.若样本中男生身高的平均数和方差分别为172和9,女生身高的平均数和方差分别为162和14,则估计高一年级学生的平均身高和方差分别为( )
A.168,35 B.168,20 C.169.6,35 D.169.6,20
【题型8 频率分布直方图中的方差、标准差】
【例8】(24-25高一下·山东济宁·期末)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)求样本成绩的上四分位数;
(3)已知落在的平均成绩是57,方差是7,落在的平均成绩为69,方差是4,求两组成绩的总平均数和总方差.
【变式8.1】(24-25高一下·吉林松原·期末)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第80百分位数;求样本平均数;
(2)已知落在区间的样本平均成绩是57,标准差是7,落在区间的样本平均成绩为66,标准差是4,求两组样本成绩合并后的平均数和方差.
【变式8.2】(24-25高一下·湖北武汉·月考)“数学好玩”是国际著名数学家陈省身赠送给少年数学爱好者们的一句话.某校为了更好地培养学生创新精神和实践能力,特举办数学竞赛活动,在活动中,共有19道题.从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的上四分位数;
(2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【变式8.3】(24-25高一下·贵州黔南·期末)2025年7月,黔南州“铁人三项赛”在州府都匀市举行.志愿者的服务工作是比赛成功举办的重要保障,都匀市某单位承办了志愿者选拔的面试工作.现随机抽取100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值.
(2)估计这100名候选者面试成绩的平均数和第60百分位数(保留两位小数).
(3)现从以上各组中用分层随机抽样的方法选取部分担任本市的宣传者.若这100名面试者中第四组面试者的面试成绩的平均数和方差分别为80和15,第五组面试者的面试成绩的平均数和方差分别为90和20,据此估计这次第四组和第五组所有面试者的面试成绩的方差.
【题型9 其他统计图表中用样本估计总体】
【例9】(24-25高一上·全国·周测)某校对七年级名同学最喜欢喝的饮料种类情况、八年级名同学零花钱的最主要用途情况、九年级名同学完成家庭作业时间情况进行了全面调查,并分别用扇形统计图、条形统计图、表格来描述整理得到的数据.
九年级同学完成家庭作业时间情况统计表
时间
小时左右
小时左右
小时左右
小时左右
人数
根据以上信息,请回答下列问题:
(1)七年级名同学中最喜欢喝“冰红茶”的人数是多少?
(2)补全八年级名同学中零花钱的最主要用途情况的条形统计图;
(3)九年级名同学中完成家庭作业的平均时间大约是多少小时?(结果保留两位小数)
【变式9.1】(24-25高一上·全国·课后作业)为选派一名学生参加全市实践活动技能竞赛,A,B两位同学在学校实习基地现场进行加工直径为20 mm的零件的测试,他俩各加工的10个零件的相关数据依次如下图和下表所示(单位:mm).
平均数
方差
完全符合要求的个数
A
20
0.026
2
B
20
5
根据测试得到的有关数据,试解答下列问题:
(1)考虑平均数与完全符合要求的个数,你认为谁的成绩好些;
(2)计算出的大小,考虑平均数与方差,说明谁的成绩好些;
(3)考虑图中折线走势及竞赛中加工零件个数远远超过10个的实际情况,你认为派谁去参赛较合适?请说明你的理由.
【变式9.2】(24-25高一上·全国·单元测试)为了了解某中学学生的身高情况,随机对该校男生、女生的身高进行抽样调查,已知抽取的样本中,男生、女生的人数相同,根据所得数据绘制成如图所示的统计图表.
组别
身高(cm)
A
B
C
D
E
根据图表中信息,回答下列问题:
(1)在样本中,男生身高的中位数落在________组(填组别序号),女生身高在B组的有________人;
(2)在样本中,身高在之间的共有________人,身高人数最多的在________组(填组别序号);
(3)已知该校共有男生500人,女生480人,请估计身高在之间的学生约有多少人?
【变式9.3】(24-25高二上·四川成都·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:
(1)分别计算甲、 乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
一、单选题
1.(24-25高一下·河南新乡·期末)某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按 分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
2.(24-25高一下·云南曲靖·期末)小冉同学近9次考试的数学成绩如下:72,74,80,83,85,85,93,100,107,请问这组数据的第40百分位数是( )
A.81.5 B.80 C.84 D.83
3.(24-25高一下·贵州遵义·月考)数据的平均数为5,则的平均数为( )
A.15 B.13 C.11 D.9
4.(24-25高一下·河北·月考)在统计学中,月度同比是指本月份和上一年同月份相比较的增长率,月度环比是指本月份和上一个月份相比较的增长率.如图是国家统计局发布的2023年全国居民消费价格月度涨跌幅度折线图,则下列说法正确的是( )
A.2023年2月至6月居民的消费价格持续下降
B.2023年7月居民消费价格高于2022年同期
C.2023年4月居民消费价格环比上涨0.1%,同比下降0.1%
D.2023年8月的居民消费价格是全年最高的
5.(24-25高一下·福建南平·期末)如图,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态.根据所给图示作出判断,则下列结论正确的是( )
A.图(1)中平均数中位数众数 B.图(2)中平均数众数中位数
C.图(2)中众数平均数中位数 D.图(3)中平均数中位数众数
6.(24-25高一下·贵州遵义·月考)已知样本容量为5的样本平均数为3,方差为,将数据9加入原样本得到样本容量为6的新样本,若新样本的平均数为,方差为,则( )
A. B. C. D.
7.(24-25高一下·浙江宁波·期末)学校为了解全校1800名学生的身体肥胖情况,随机抽取了100名学生的体检数据,将其BMI值分成以下五组:,,,,,得到相应的频率分布直方图,如图所示.则下列说法错误的是( )
A.
B.估计样本的中位数为23
C.估计样本的众数为22
D.估计全校学生BMI值落在区间的人数为36人
8.(24-25高一下·山东青岛·期末)抽样调查得到20个样本数据,记作,样本数据的平均数为9,方差5.现去掉一个最大值13和一个最小值5,产生一组新数据,关于这组新数据,下列说法错误的是( )
A.中位数一定不变 B.极差一定变小
C.方差一定变小 D.平均数一定不变
二、多选题
9.(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
10.(24-25高一下·吉林长春·期末)在某市初三年级举行的一次体育统考考试中,共有500人参加考试.为了解学生的成绩情况,抽取了样本容量为的部分考生成绩,已知所有考生成绩均在,按照,,,,的分组作出如图所示的频率分布直方图、若在样本中,成绩落在区间的人数为32,则由样本估计总体可知下列结论正确的为( )
A. B.估计考生成绩的众数为72
C.估计考生成绩的中位数为71 D.估计该市考生成绩的平均分为70.6
11.(24-25高一下·河南洛阳·期末)甲、乙、丙、丁四人各掷骰子5次,并记下自己投掷时出现的点数,从而得到四组数据,这四组数据的相关情况如下:
甲:中位数为3,众数为2;
乙:中位数为3,极差为4;
丙:平均数为3,中位数为2;
丁:平均数为2,方差为3.2.
则在投掷过程中可能出现点数6的是( )
A.甲 B.乙 C.丙 D.丁
三、填空题
12.(24-25高一下·黑龙江大庆·期末)样本数据5,11,6,8,14,6,10,5,9,8的分位数________.
13.(24-25高一下·北京平谷·期末)已知某校高一年级1000人,为普及航天知识,开展了航天知识竞赛.将成绩(单位:分)分成6组,绘制成频率分布直方图,如图所示:则成绩在分的有________人.
14.(24-25高一下·湖南衡阳·期末)衡阳市一中高一某班45名学生成立了A、B两个数学兴趣小组,A组25人,B组20人,经过一个月的强化培训后进行了一次测试,在该次测试中,A组的平均成绩为82分,方差为8,B组的平均成绩为86.5分,方差为2,则在这次测试中全班学生成绩的方差为________.
四、解答题
15.(24-25高一下·河北秦皇岛·期末)某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
16.(24-25高一下·甘肃嘉峪关·期中)某校抽取100名高二学生期中考试的语文成绩,绘制频率分布直方图(如图所示),其中样本数据分组区间为:,,…,,.
(1)求频率分布直方图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的中位数和平均数.(保留小数点后1位)
17.(24-25高一下·黑龙江双鸭山·月考)随着新能源电动汽车的推广,人们对电动汽车的电池续航能力非常关注,某4S店为了解车主对甲、乙两款电动汽车电池续航能力的满意程度,从该店销售的甲、乙两款车中各随机抽取10名车主对其所使用车辆的电池续航能力的评分(单位:分),并对数据进行整理、描述和分析(评分用x表示,共分为三组:A.,B.,C.),下面给出了部分信息:甲款电动汽车10名车主的评分是:100,95,85,85,80,80,80,80,75,70.乙款电动汽车10名车主的评分在B组的数据是:85,85,85,80,80.抽取的甲、乙两款电动汽车车主的评分统计表如下:
车型
平均数
中位数
众数
甲
83
80
a
乙
83
b
85
抽取的乙款电动汽车车主的评分扇形统计图如图:
根据以上信息,解答下列问题:
(1)上述图表中__________,__________,__________.
(2)根据以上数据,你认为哪款电动汽车的电池续航能力的满意度更好?请说明理由(写出一条理由即可).
(3)该4S店甲款电动汽车的车主有600人,乙款电动汽车的车主有400人.若评分不低于90分为“非常满意”,估计这些车主中对其所使用车辆的电池续航能力“非常满意”的总共有多少人?
18.(24-25高一下·广东惠州·期末)为了解某小区居民的体育锻炼时间,随机在该小区选取了名住户,将他们上周体育锻炼的时间 (单位: 时) 按照、、、、分成组, 制成如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)根据频率分布直方图估计样本数据的第百分位数;
(3)根据频率分布直方图,用每组数据区间中点值作代表,估计这名住户上周体育锻炼时间的平均值.
19.(24-25高一下·安徽合肥·期末)新高考模式下,学生是否选择物理作为高考考试科目对大学专业选择有着非常重要的意义.合肥六中为了解高一年级1800名学生物理科目的学习情况,将他们某次物理测试成绩(满分100分)按照分成6组,制成如图所示的频率分布直方图.
(1)求1800名学生中物理测试成绩在内的频数并补全频率分布直方图.
(2)学校建议,本次物理测试成绩不低于分的学生选择物理为高考考试科目,若学校希望高一年级恰有的学生选择物理为高考考试科目,试求的估计值(结果精确到).
(3)已知落在的学生成绩的平均数为,方差,落在的学生成绩的平均数为,方差,若两组学生成绩的平均数之差不大于6,求落在的学生成绩的方差的最大值.
第 1 页 共 23 页
学科网(北京)股份有限公司
$