内容正文:
9.2 用样本估计总体
1.掌握频率分布表的作法以及频率分布直方图的画法.掌握用频率分布直方图估计总体.在问题情境中会用不同的统计图分析样本数据.
2.能从统计图表中获取有价值的信息,估计总体分布的规律.
3.理解百分位数的统计含义.结合实例,能用样本估计百分位数.
4.会求样本数据的众数、中位数、平均数.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
5.理解方差、标准差的含义,会计算方差和标准差.掌握求分层随机抽样总样本的平均数及方差的方法.
频率分布直方图
画频率分布直方图的步骤
(1)求极差:极差为一组数据中 最大值 与 最小值 的差.
(2)决定组距与组数:当样本容量不超过100时,常分成 5~12 组,为了方便起见,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表:一般分四列:分组、 频数累计 、频数、 频率 .其中频数合计应是样本容量,频率合计是 1 .
(5)画频率分布直方图:横轴表示分组,纵轴表示 .小长方形的面积=组距× = 频率 .各小长方形的面积总和等于1.
绘制频率分布直方图的注意点
(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1.
(2)横轴表示样本数据,纵轴表这样每一组的频率可以用该组的组距为底、.
(3)画频率分布直方图的关键是确定矩形的高,一般地,频率分布直方图中两坐标轴上的单位长度不一致.
频率分布直方图具备的性质
(1)因为小长方形的面积=组距×= 频率 ,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小长方形的面积之和等于 1 .
(3)样本容量=.
条形图、折线图、扇形图
(1)条形图
用途:直观描述不同类别或分组数据的频数和频率.
优点:当数据量很大时,它能更直观地反映数据分布的大致情况,并能清晰地表示出各个区间的具体数目.
缺点:会损失数据的部分信息.
(2)折线图
用途:描述数据随时间的变化趋势.
优点:可以表示数量的多少,直观反映数量的增减情况,即变化趋势.
缺点:不能直观反映数据的分布情况.
(3)扇形图
用途:直观描述各类数据占总数的比例.
优点:可以直观地反映出各种情况所占的比例.
缺点:看不出具体数据的多少.
【注意】(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.
(2)扇形图是用整个圆的面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.
(3)在画折线图时,要注意明确横轴、纵轴的实际含义.
百分位数的定义
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按 从小到大 排列原始数据.
第2步,计算i= n×p% .
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 j 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 平均数 .
3.四分位数
(1)中位数相当于是第 50 百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第 25 ,50 ,75 百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第 一 四分位数或 下 四分位数等,第75百分位数也称为第 三 四分位数或 上 四分位数等.
求百分位数的注意事项
(1)求百分位数时,一定要将数据按照从小到大的顺序排列.
(2)计算i=n×p%后要弄清i是整数还是非整数.
由频率分布直方图估计百分位数的方法
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为 a+×(b-a) .
众数、中位数、平均数
1.众数:一组数据中出现 次数 最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在 中间 位置的数(或中间两个数的 平均数 )叫做这组数据的中位数.
3.平均数:如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)叫做这n个数的平均数.
【注意】 (1)一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个(如1,2,2,3,3,4,5,6这组数的众数是2和3),还可以没有(如1,2,3,4,5,6这组数就没有众数).
(2)众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数.
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是看出现次数最多的数.
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
方差、标准差
1.一组数据x1,x2,…,xn的方差和标准差
数据x1,x2,…,xn的方差为=,
标准差为.
2.总体方差和标准差
(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为则称S2=为总体方差,S= 为总体标准差.
(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k( k≤N )个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为f i(i=1,2,…,k),则总体方差为S2=.
3.样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为则称s2= 为样本方差,s= 为样本标准差.
4.标准差的意义
标准差刻画了数据的 离散程度 或 波动幅度 ,标准差越大,数据的离散程度越 大 ;标准差越小,数据的离散程度越 小 .
对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
方差和标准差的计算技巧与性质
(1)方差的计算
①基本公式:s2=2+2+…+].
②简化计算公式:s2=即方差等于原数据平方的平均数减去平均数的平方.
(2)方差和标准差的性质
若把一组数据的每一个数变为原来的k倍并加上或减去常数a,则它的标准差变为原来的k倍,方差变为原来的k2倍,而与a的大小无关.
分层随机抽样的方差
设样本容量为n,平均数为其中两层的个体数量分别为n1,n2,两层的平均数分别为方差分别为则这个样本的方差为
s2= .
题型一 频率分布直方图
1.(2026·辽宁沈阳·二模)某精密仪器厂正在研发一种标准长度为52mm的金属垫片.现随机抽取200个垫片测量其实际长度(单位:mm),按长度分组并绘制出如图所示的频率分布直方图.若规定长度在区间内的垫片为合格品.利用样本频率估计总体概率的方法,则任取一个垫片为合格品的概率为( )
A.0.3 B.0.4 C.0.5 D.0.6
【答案】C
【详解】由得.
所以长度的区间的频率为:.
用频率估计概率,可得任取一个垫片为合格品的概率为.
故C正确.
2.(25-26高一下·全国·单元测试)某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是,样本数据分组为,,,,.
(1)频率分布直方图中的值为____________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1200名,估计新生中可以申请住校的学生有____________名.
【答案】 0.0125 144
【分析】(1)由频率分布直方图各个小矩形的面积和等于1,建立的方程,计算出.
(2)利用频率等于小矩形的面积计算新生上学路上所需时间不少于1小时的频率,利用频数等于频率乘以总体的容量得到所求.
【详解】(1)由频率分布直方图,可得,
所以.
(2)新生上学路上所需时间不少于1小时的频率为,
因为,所以1200名新生中约有144名学生可以申请住校.
故答案为:0.0125;144.
3.(25-26高一上·北京西城·期末)为了解某校高三学生寒假期间每天平均学习的时间(单位:小时),现从该校高三年级随机抽取了部分同学进行调研,在获得这些同学每天平均学习的时间后,将数据按照,,,,分成5组,制成了如图所示的频率分布直方图,则
(1)______;
(2)若样本中每天学习时间在区间上的同学恰有2人,则共抽取了______位同学调研.
【答案】
【分析】(1)根据各组数据频率之和为1即可求出图中a的值;
(2)利用区间内的频率求样本容量.
【详解】(1),解得;
(2)设共抽取了位同学调研,则有,解得.
故答案为:;
4.(25-26高一·全国·假期作业)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知______(结果保留3位小数).若要从身高在,,三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为______.
【答案】 0.030 3
【分析】由频率分布直方图面积可得,由三组之比为可求解第二空.
【详解】由,
解得,
的频率为,的频率为,的频率为,
三组之比为,
所以用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为,
故答案为:,3
5.(2025高三·江苏·专题练习)某校为了解今年春季学期开学第一周,高二年级学生参加学校社团活动的时长,有关部门随机抽查了该校高二年级100名同学,统计他们今年春季学期开学第一周参加学校社团活动的时长,并绘制成如图所示的频率分布直方图.其中这100名同学今年春季学期开学第一周参加学校社团活动的时长(单位:小时)范围是,数据分组为.这100名同学中,今年春季学期开学第一周参加学校社团活动的时长不少于6小时的人数为( )
A.68 B.27
C.66 D.86
【答案】A
【分析】先根据频率分布直方图计算出参加学校社团活动的时长不少于6小时的频率,进而得到参加学校社团活动的时长不少于6小时的人数.
【详解】由图表可知今年春季学期开学第一周参加学校社团活动的时长不少于6小时的频率为
,
故参加学校社团活动的时长不少于6小时的人数为.
故答案为:A
6.(24-25高二下·云南昆明·月考)为调查社区居民对社区工作的满意度,在社区内抽取200名居民进行问卷调查,将收集到的数据分成五组,绘制出以下频率分布直方图,若的频率为0.48,,的值为( )
A.0.017,0.048 B.0.017,0.48 C.0.17,0.048 D.0.17,0.48
【答案】A
【分析】根据已知条件,由频率分布直方图中矩形高度的概念可求出,由频率分布直方图中各组矩形面积之和为1,即可求出.
【详解】由频率分布直方图可知组距为10,则,
又因为,解得.
故选:A
题型二 条形图、折线图、扇形图
7.(25-26高一下·贵州遵义·月考)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中正确的是( )
A.丁险种参保人数超过六成 B.41岁以上参保人数超过总参保人数的五成
C.54周岁以上人群参保的总费用最少 D.人均参保费用不超过5000元
【答案】D
【详解】对于A,由条形图可知丁险种参保比例为,故A错误;
对于B,由扇形图可知,41岁以上参保人数占比为,故B错误;
对于C,由扇形图与折线图可知18-29周岁人群参保人数占比,人均参保费用在元,
而54岁及以上人群参保比例虽只占,但人均参保费用为6000元,所以18-29周岁人群参保的总费用最少,故C错误;
对于D,由扇形图与折线图可知,人均参保费用约,故D正确.
8.(2026·安徽安庆·一模)(多选)某地区2025年2月至10月地方一般公共预算收入累计的统计图表如下(条形图为月累计值,折线图为与上年同月累计值的环比增长率):
月份
2月
3月
4月
5月
6月
7月
8月
9月
10月
累计收入(亿元)
43.88
66.57
83.96
96.87
134.69
150.09
161.05
191.67
213.39
同比增长率(%)
2
2.1
2.1
3
1
4.2
4.8
根据图表,下列说法正确的是( )
A.该地区2025年每月的地方一般公共预算收入一直递增
B.2025年8月该地区的地方一般公共预算收入超过22亿元
C.2025年9月该地区的地方一般公共预算收入比2024年9月高
D.2024年前9个月,该地区地方一般公共预算收入平均数高于20亿元
【答案】CD
【详解】对于A,由图表可知,3月的地方一般公共预算收入为(亿元),
4月的地方一般公共预算收入为(亿元),故A错误;
对于B,8月该地区的地方一般公共预算收入为(亿元),故B错误;
对于C,由图表可知,2025年9月该地区的地方一般公共预算收入为(亿元),
而2025年9月该地区的地方一般公共预算收入累计同比增长,
所以2024年9月该地区的地方一般公共预算收入累计为(亿元),
2025年8月该地区的地方一般公共预算收入累计同比增长,
所以2024年8月该地区的地方一般公共预算收入累计为(亿元),
所以2024年9月该地区的地方一般公共预算收入为(亿元),比2025年9月少,故C正确;
对于D,由C选项可知,2024年9月该地区的地方一般公共预算收入累计为(亿元),
所以2024年前9个月,该地区地方一般公共预算收入平均数为(亿元),故D正确.
9.(25-26高三上·河南信阳·期末)某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业从业者中,“90后”占比不超过
C.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数多
【答案】D
【分析】对于A,不知道“80后”从事技术岗位的人数的比例,故无法比较;由图1可判断B;求出芯片、软件行业中从事技术和设计岗位的“90后”人数占比即可判断C;求出“90后”从事市场岗位的人数占比可判断D.
【详解】对于A,芯片、软件行业从事技术岗位的人中,“90后”人数占比为,
芯片、软件行业从业者中“80后”占总人数的,但不知道从事技术岗位的人数的比例,故无法比较,故A不一定正确;
对于B,由图1知芯片、软件行业从业者中,“90后”占比为,超过,故B错误;
对于C,芯片、软件行业中从事技术和设计岗位的“90后”人数占从事这两个行业总人数的,
没有超过从事这两个行业总人数的,故C错误;
对于D,芯片、软件行业中,“90后”从事市场岗位的人数占比为,
因为,
所以芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事芯片、软件行业的总人数多,故D正确.
故选:D.
10.(2025高三·上海·专题练习)如图所示,下面是出口,上面是进口,哪个进出口贸易总额不对( )
A.从2018年开始后,图表中最后一年增长率最大;
B.从2018年开始后,进出口总额逐年增大;
C.从2018年开始后,进口总额逐年增大;
D.从2018年开始后,图表2020年增长率最小.
【答案】C
【分析】利用图象数据分析选项即可.
【详解】根据图象可以发现:2018年到2019年进口总额是降低的,故C错误.
故选:C
11.(2026高三·全国·专题练习)某高中2024年的高考考生人数是2023年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2023年和2024年高考分数达线情况,得到如图所示扇形统计图:
下列结论正确的是( )
A.该校2024年与2023年的本科达线人数比为6:5
B.该校2024年与2023年的专科达线人数比为6:7
C.2024年该校本科达线人数增加了80%
D.2024年该校不上线的人数有所减少
【答案】C
【分析】根据扇形统计图及各人数的百分比进行计算即可.
【详解】不妨设2023年的高考人数为a,则2024年的高考人数为.
由图可知2023年本科达线人数为,2024年本科达线人数为,
故2024年与2023年的本科达线人数比为9:5,故A不正确;
本科达线人数增加了,故C正确;
2023年专科达线人数为,2024年专科达线人数为,
所以2024年与2023年的专科达线人数比为9:7,故B错误;
2023年不上线人数为,2024年不上线人数也是,不上线的人数无变化,故D错误.
故选:C.
题型三 百分位数
12.(2026·云南·模拟预测)数据9,12,15,16,16,18,20,21的75%分位数为( )
A.20 B.19 C.18 D.16
【答案】B
【详解】将数据9,12,15,16,16,18,20,21从小到大排序为9,12,15,16,16,18,20,21,共8个数据,
由,故该组数据的分位数为第6项与第7项数据的平均值,即.
13.(2026高一·全国·专题练习)样本数据38,133,143,177,209,151,210,223, 252,281,218,309的上四分位数是( )
A.223 B.237 C.237.5 D.252
【答案】C
【分析】将数据从小到大排序,结合上四分位数计算公式即可求解.
【详解】数据从小到大排序:38,133,143,151,177,209,210,218,223, 252,281,309,共12个数,
,则上四分位数是第9个数和第10个数的平均数.
14.(2026·河北保定·一模)已知一组数据从小到大排列为4,6,7,8,,m,,,,,若该组数据的分位数是,则( )
A. B. C. D.
【答案】B
【分析】根据百分位数的定义计算可得.
【详解】因为这组数据共个,所以,因此分位数为第6个数据和第7个数据的平均数,
因为该组数据的分位数为,所以,解得.
15.(2026·安徽安庆·二模)统计某地区2025年上半年的月降水量,数据如下表:
月份
1
2
3
4
5
6
月降水量/mm
58
48
53
46
56
56
则该地区上半年月降水量的分位数为___________.
【答案】56
【详解】将6个降水量数据从小到大排列: 46, 48, 53, 56, 56, 58,则样本容量为.
根据百分位数计算规则,可得
因为不是整数,
所以向上取整为5,因此75%分位数为排序后第5个数据,即56.
16.(25-26高一下·贵州遵义·月考)下面是一组学生某次跳绳活动课半分钟跳绳次数的数据:90,88,110,118,108,116,120,98,则这组数据的第60百分位数为( )
A.116 B.113 C.110 D.108
【答案】C
【分析】根据百分位数的计算公式即可求解.
【详解】将这组数据从小到大排列为:88,90,98,108,110,116,118,120,共8个数据,
因为,根据百分位数的定义可知这组数据的第60百分位数为第5个数据,即110.
17.(24-25高一上·安徽淮北·期末)样本数据的分位数为( )
A. B. C. D.
【答案】A
【分析】直接根据百分位数的定义可得结果.
【详解】将给定样本从小到大排列,得到: ,样本容量 .
计算分位数位置: ,
根据高中百分位数的计算规则,若不是整数,将向上取整,对应位置的数据即为所求分位数。
此处向上取整为,对应排序后第3个数据,为.
所以样本数据的分位数为.
题型四 众数、中位数、平均数、极差
18.(2026·湖北武汉·模拟预测)(多选)现有10个数据为:3,3,3,3,4,4,4,5,5,6,对于该组数据,下列说法中正确的有( )
A.众数是4 B.平均数是4 C.极差是3 D.中位数是4.5
【答案】BC
【详解】10个数据中3出现了4次,4出现了3次,5出现了2次,6出现了1次,
所以次数最多的数据是3,所以众数是3,故A错误;
平均数为,故B正确;
极差为,故C正确;
中位数为,故D错误.
19.(25-26高一下·贵州遵义·月考)若一组数据的,,,的平均数为4,则,,,的平均数为________.
【答案】
【分析】若一组数据的,,,的平均数为,则,,,的平均数为,利用此公式求解.
【详解】设一组数据的,,,的平均数为,则,
则,,,的平均数为.
20.(2026·福建龙岩·一模)已知从小到大排列的一组数据1,2,4,,8,10,若这组数据的第60百分位数与平均数相等,则实数的值为______.
【答案】5
【详解】因为,所以该组数据的第60百分位数为从小到大排列的第4个数据.
由题意知,解得.
21.(25-26高一下·全国·期末)某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用电量/度
120
140
160
180
200
户数
2
3
6
7
2
则这20户家庭该月用电量的众数和中位数分别是( )
A.180,170 B.160,180 C.160,170 D.180,160
【答案】D
【分析】根据表格中的数据,结合众数和中位数的定义与求法,即可求解.
【详解】由表格中的数据,可得用电量为180度的家庭最多,有7户,
所以这20户家庭该月用电量的众数是180;
将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,160,
所以这20户家庭该月用电量的中位数是160.
故选:D.
22.(24-25高一下·贵州黔东南·期末)(多选)凯里市某七天每天的最高气温分别是37,35,34,36,39,36,34(单位℃),则( )
A.该组数据的平均数为36 B.该组数据的极差为5
C.该组数据的第60百分位数为37 D.该组数据的中位数为36
【答案】BD
【分析】根据平均数、极差、百分位数和中位数定义和公式逐一求解即可得解.
【详解】该7个数据从小到大排列为:34,34,35,36,36,37,39,
所以改组数据的平均数为,极差为,中位数为第4个数据36,
因为,所以该组数据的第60百分位数为36.
故AC错误,BD正确.
故选:BD
23.(25-26高一上·辽宁锦州·期末)某校组织了一次航空知识竞赛,甲、乙两个班级各派8名同学代表参赛.两个班级的数学课代表合作,将甲、乙两班所有参赛同学的得分绘制成如图所示的茎叶图,则下列结论正确的是( )
A.甲班参赛同学得分的极差比乙班参赛同学得分的极差大
B.甲班参赛同学得分的中位数比乙班参赛同学得分的中位数高
C.甲班参赛同学得分的平均数为84
D.乙班参赛同学得分的75%分位数为89
【答案】C
【分析】A. 利用极差的定义求解判断; B.利用中位数的定义求解判断; C.利用平均数的定义求解判断; D.利用百分位数的定义求解判断.
【详解】对A,甲班参赛同学得分的极差为,
乙班参赛同学得分的极差为,故A错误;
对B,甲班参赛同学得分的中位数是,
乙班参赛同学得分的中位数是,故错误;
对C,甲班参赛同学得分的平均数为,故正确;
对D,乙班参赛同学得分为71,80,81,82,85,89,90,94,,
取第6个与第7个数的平均数为第75百分位数,即为,故错误.
故选:C.
24.(25-26高一下·贵州遵义·开学考试)(多选)某公司统计其员工的专业素养指标,公司员工年龄分布如下表,则( )
年龄
28
29
30
32
36
40
45
人数
1
3
3
5
4
3
1
A.这组数据的平均数是33.2 B.这组数据的极差是17
C.这组数据的第75百分位数是36 D.这组数据的中位数和众数相同
【答案】BCD
【分析】根据表格一一计算平均数、极差、百分位数、中位数与众数即可.
【详解】对于A,由题意可知该组数据的平均数为
,故A错误;
对于B,该组数据最大值为,最小值为,极差为,故B正确;
对于C,易知,该组数据从小到大排列后,
第15和16个数据都位于36岁年龄组,所以C正确;
对于D,该组数据从小到大排列后,第10和11个数据为32岁,所以中位数为32岁,
众数也是32岁,故D正确.
题型五 方差、标准差
25.(25-26高一下·河北保定·月考)已知样本数据,,,,的平均数为4,方差为2,则样本数据,,,,的平均数和方差分别为________和________.
【答案】 10 18
【分析】根据平均数及方差的计算公式计算即可得解.
【详解】由题意知,
.
所以
.
.
26.(25-26高一下·辽宁铁岭·月考)(多选)某城市连续7天的最低温度(单位:℃)为0,2,5,5,6,7,3,则这组数据的( )
A.极差为7 B.分位数为4
C.平均数为4 D.方差为
【答案】ACD
【详解】将这7个数据从小到大排序为0,2,3,5,5,6,7,则极差为,A正确;
,分位数对应排序后第3个数,为3,B错误;
平均数为,C正确;
方差为,D正确.
27.(2026·广东广州·二模)(多选)为普及法制教育,对50名市民开展了一次法律知识竞赛答题活动,测试成绩统计如表所示,其中两个数据被遮盖.
成绩/分
92
93
95
96
98
99
100
人数
5
7
8
14
13
下列结论正确的是( )
A.众数为99 B.极差为9
C.分位数为96 D.平均数大于中位数
【答案】AC
【详解】根据题意,总共有50名市民,
所以成绩为或的共人,
则99分有14人,众数为99,A正确;
极差为,B错误;
因为,则第13个数分值为96,C正确;
中位数是第25和第26两个数的平均数,由于这两个数都是99,
所以中位数为99,
设成绩为的有个人,
平均数为
,
所以平均数小于中位数,D错误.
28.(25-26高一下·贵州遵义·月考)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
【答案】A
【详解】依题意,在分层随机抽样的方法所抽取的100人中,高一男生有人,高二男生有40人,
记高一男生成绩的平均数和方差分别为和;
高二男生成绩的平均数和方差分别为和,
则样本平均数为,
样本总体方差 .
29.(24-25高一下·江苏无锡·期末)经过简单随机抽样获得的样本数据为,,…,,且数据,,…,的平均数为,方差为,则下列说法正确的是( )
A.;
B.若,则所有的数据都为0;
C.若,则的平均数为6;
D.若,则的方差为12;
【答案】D
【分析】根据方差的定义及性质,平均数的性质逐项进行检验即可判断.
【详解】对于A:,错误;
对于B:数据,,…,的方差时,说明所有的数据,,…,都相等,但不一定为0,错误;
对于C:数据,,…,的平均数为,数据的平均数为,错误;
对于D:数据,,…,的方差为,数据的方差为,正确.
30.(25-26高一下·江西景德镇·月考)已知一组数据由5个正整数组成,下列描述中,能确保这组数据中一定没有出现8的是( )
A.平均数为4,中位数3 B.平均数为4,众数为4
C.平均数为4,方差为3.6 D.中位数为5,方差为3.6
【答案】C
【分析】对于ABD:举反例说明即可;对于C:假设成立,可得,,结合基本不等式分析判断.
【详解】对于选项A:例如1,1,3,7,8,平均数为4,中位数3,故A错误;
对于选项B:例如1,3,4,4,8,平均数为4,众数为4,故B错误;
对于选项D:例如2,5,5,5,8,中位数为5,方差为3.6,故D错误;
对于选项C:假设出现8,设5个正整数为,其平均数为4,方差为3.6,
则,即,
且,可得,
因为,,,,,
当且仅当时,等号成立,
则,
可得,即,显然不成立,
假设不成立,所以一定没有出现8,故C正确.
31.(24-25高一上·安徽淮北·期末)某校为调查高一年级的某次考试的数学情况,选取高一年级甲班和乙班进行调查.若甲班学生数学成绩的平均数为90,方差为3,乙班学生数学成绩的平均数为81,方差为5,且甲乙两班的学生人数之比为,则这两班数学的总成绩平均分和方差分别为( )
A.85.5; B.; C.85.5; D.;
【答案】B
【详解】设两个班级的总人数为,则甲班的学生数为,乙班学生数为,
所以两班数学的总成绩平均分为,
两班数学的方差为.
题型六 利用频率分布直方图估计众数、中位数、平均数、百分位数
32.(2025高一·全国·专题练习)(多选)某校对名学生的数学竞赛成绩进行统计,分成,,,,五组,得到如图所示的频率分布直方图,则下列说法中正确的是( )
A.
B.估计该校学生竞赛成绩的众数为
C.该校学生竞赛成绩的中位数大于
D.估计该校学生竞赛成绩的平均数落在内
【答案】ABD
【分析】根据数据的频率分布直方图估计数据的数字特征.
【详解】由于组距为,所以有,得,故A正确.
竞赛成绩在内的学生最多,可以将该区间的中点值作为众数的估计值,故B正确.
,两组的频率之和为,的频率为,所以中位数一定落在内,小于,故C错误.
,落在内,故D正确.
故选:ABD.
33.(24-25高一下·吉林长春·期末)(多选)在某市初三年级举行的一次体育统考考试中,共有500人参加考试.为了解学生的成绩情况,抽取了样本容量为的部分考生成绩,已知所有考生成绩均在,按照,,,,的分组作出如图所示的频率分布直方图、若在样本中,成绩落在区间的人数为32,则由样本估计总体可知下列结论正确的为( )
A. B.估计考生成绩的众数为72
C.估计考生成绩的中位数为71 D.估计该市考生成绩的平均分为70.6
【答案】ACD
【分析】根据频率分布直方图的特征先计算,再计算样本数即可得A,由频率分布直方图计算众数、中位数、平均数并估计总体即可判定B、C、D选项.
【详解】由频率分布直方图可知,
∴,故A正确;
由频率分布直方图可知众数落在区间上,则考生成绩的众数为75,故B错误;
由于,所以中位数位于区间内,
同时可知考生成绩的中位数为:,故C正确;
由频率分布直方图可知样本中,
考生成绩的平均分为,
可估计整体学生的平均分为70.6,故D正确.
故选:ACD.
34.(24-25高一下·安徽安庆·期末)(多选)将某工厂新生产的10000件产品的质量大小统计如下图所示,则( )
A.质量在区间的产品有2000件 B.质量在区间的频率为0.2
C.这10000件产品的质量的中位数大于1.15 D.这10000件产品的质量的众数为1.175
【答案】BD
【分析】根据矩形面积即可求解AB,根据中位数和众数的计算即可求解CD.
【详解】依题意,因为,故A错误;
,B正确;
前三块小矩形的面积依次为0.05,0.2,0.28,而,
故这10000件产品质量的中位数小于1.15,故C错误;
众数为,故D正确;
故选:BD.
35.(25-26高二上·贵州·月考)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值与样本成绩的平均数、中位数;
(2)若落在的平均成绩是57,方差是2,落在的平均成绩为69,方差是5,求这两组成绩的总平均数和总方差.
参考公式:其中为总样本平均数.
【答案】(1),平均数74,中位数为75
(2)总平均数,总方差
【分析】(1)利用频率之和为结合频率分布直方图列式求出,根据平均数、中位数的计算公式计算即可;
(2)先利用频率分布直方图求出和的市民人数,再根据平均数和方差公式计算求解即可.
【详解】(1)由频率之和为结合频率分布直方图可得,解得,
样本成绩的平均数约为.
由于区间,,的频率分别为.
因为,
的频率为,故中位数位于内,
设中位数为x,则,解得x=75.
(2)由频率分布直方图知,成绩在的市民人数为,
成绩在的市民人数为,
所以总平均数,
总方差.
36.(25-26高一下·全国·单元测试)如图是某地某公司1000名员工的月收入的直方图.根据直方图估计:
(1)该公司月收入在1000元到1500元之间的人数;
(2)该公司员工的月平均收入;
(3)该公司员工收入的众数;
(4)该公司员工月收入的中位数;
(5)该公司员工月收入的第90分位数.
【答案】(1)100
(2)2400
(3)2500元
(4)2400元.
(5)3333
【分析】(1)先计算出该公司月收入在1000元到1500元之间的频率,即可求解;
(2)将每个矩形底边的中点值乘以对应矩形的面积,再将所得的积全部相加可得出该公司员工月收入的平均数;
(3)由众数的定义求解;
(4)由中位数的定义求解;
(5)由百分位数的定义求解.
【详解】(1)根据频率分布直方图知,满足条件的频率为:
所以满足条件的人数为:(人).
(2)据题意该公司员工的平均月收入为:
(元)
(3)根据频率分布直方图知,最高矩形(由两个频率相同的矩形构成)的底边中点的横坐标为2500,即公司员工月收入的众数为2500元.
(4)根据频率分布直方图知,中位数介于2000元至2500元之间,故可设中位数为,则由,即公司员工月收入的中位数为2400元.
(5)根据频率分布直方图知,公司员工月收入小于3000元的百分比为,公司员工月收入小于3500元的百分比为(
所以公司员工月收入的第90分位数是.
37.(25-26高一上·安徽·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均不低于分)分成六组:、、、,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)试估计样本成绩的平均数(同一组数据用该组数据的中间值代替)和中位数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩合并后的平均数和方差.
【答案】(1)
(2)平均数为,中位数为
(3),
【分析】(1)利用频率分布直方图中所有直方图的面积之和为可求出的值;
(2)将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全部相加可得样本的平均数;设中位数为,根据中位数的定义可得出关于的等式,即可解出的值;
(3)利用总体的平均数和方差公式可求得和的值.
【详解】(1)由题意得,解得.
(2)平均数为
设中位数为,
因为成绩落在内的频率为,
落在内的频率为,
所以,则,解得,故中位数为75.
(3)由题意得,成绩在有人,成绩在有人,
则这两组成绩的总平均数为,
总方差为.
1.(25-26高三下·重庆渝中·月考)样本数据4,16,5,27,6,30,11,21的第25百分位数为( )
A.27 B.24
C.5 D.
【答案】D
【分析】先将样本数据按从小到大的顺序排列,再根据百分位数的定义计算.
【详解】根据题意,将样本数据按从小到大顺序排列为4,5,6,11,16, 21,27, 30,
由于,所以该组数据的第25百分位数为第2个数据与第3个数据的平均值,即.
2.(2026·江西吉安·一模)某市连续8天的AQI(空气质量指数)分别为,则这组数据的上四分位数为( )
A.32 B.33 C.48 D.49
【答案】D
【分析】上四分位数即第75百分位数,将已知数据按从小到大的顺序排列后,根据百分位数的计算步骤先计算,再计算上四分位数即可.
【详解】将按从小到大的顺序排列为,
因为,6为整数,所以上四分位数即从小到大排列中的第6与第7个数据的平均数,即.
3.(2026·河南开封·模拟预测)随着电视剧《沉默的荣耀》的热播,剧中人物原型吴石将军的故居——位于福州市仓山区螺洲镇,其成为游客追寻先烈足迹、缅怀革命精神的热门“红色打卡地”.其中连续10日的游客人数依次为872,963,742,682,1322,1244,674,548,884,993,则这组数据的中位数为( )
A.872 B.878 C.884 D.1283
【答案】B
【详解】将这10个数据从小到大排列,依次为548,674,682,742,872,884,963,993,1244,1322,
所以这组数据的中位数为.
4.(2026·山东烟台·一模)直播带货已经成为助力乡村振兴的重要方式之一.某村统计了一合作社最近天通过直播带货销售农产品的日销售额(单位:万元),并绘制成右侧的频率分布直方图,则的第百分位数为( )
A. B. C. D.
【答案】D
【分析】根据频率和为可解得,再根据百分位数的定义及公式求解.
【详解】设销售额的第百分位数为,
由已知,解得,
又,
,
所以,
且,
解得,
即销售额的第百分位数为.
5.(2026·湖南·模拟预测)国家能源集团研发的“擎源”大模型用于预测关键节点电价,研究人员利用模型对某节点连续8个小时的实际与预测电价数据进行记录,并利用上述数据绘制成实际值与预测值对比的折线图(两条折线):
观察图表与数据,下列结论不能直接从中得出的是( )
A.实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值
B.这8小时内,预测值与实际值的差异(两个值的差的绝对值)平均在10元/MWh左右
C.模型对所有“价格下跌时段”(如第5-6小时)的预测都出现了滞后性(即预测反应慢于实际变化)
D.模型的预测精度较高,趋势与实际基本一致,对电网调度有重要参考价值
【答案】C
【详解】由图可知:实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值,A正确;
对于B,差异平均值为,B正确;
由图可知两折线的趋势基本一致,且误差较小,故精确度高,D正确;
对于C,没有足够的理由说明预测变化慢于实际变化,C错误.
6.(25-26高一上·贵州遵义·期末)年月日,国家统计局发布了“年全国专利密集型产业增加值数据公告”. 年全国专利密集型产业增加值总量为千亿元,其内部构成用雷达图表示如图,以下说法正确的是:( )
A.医药医疗产业在年全国专利密集型产业增加值的构成中规模最小
B.信息通信技术服务业在年全国专利密集型产业增加值的构成中规模最大
C.新装备制造业在年全国专利密集型产业增加值的构成中占比大于
D.新装备制造业在年全国专利密集型产业增加值的构成中占比小于
【答案】D
【分析】根据雷达图的数值及各项占比分析判断各个选项可得.
【详解】对A:雷达图中环保产业的点离中心最近,说明其规模最小,而不是医药医疗产业,故A错误;
对于B:雷达图中新装备制造业的点离中心最远,说明其规模最大,而不是信息通信技术服务业,故B错误;
年全国专利密集型产业增加值总量为千亿元,新装备制造业增加值约为千亿元,
所以占比为,所以C错误,D正确.
故选:D.
7.(25-26高一下·贵州遵义·开学考试)(多选)某校为了鼓励同学们利用课余时间阅读,开展了读书周活动.如图是某班甲、乙两名同学在一周内每天阅读时间的折线图,根据该折线图,下列结论正确的是( )
A.甲同学阅读时间更加稳定
B.乙同学的平均阅读时间等于甲同学的平均阅读时间
C.乙同学阅读时间的极差为20
D.甲同学阅读时间的75%分位数为25
【答案】BD
【详解】甲同学阅读时间从小到大排列为,
乙同学阅读时间从小到大排列为,
则甲同学的平均阅读时间为,
乙同学的平均阅读时间为,
故乙同学的平均阅读时间等于甲同学的平均阅读时间,B正确;
甲同学的阅读时间的方差为
乙同学的阅读时间的方差为,
因为,所以乙同学阅读时间更加稳定,故A错误;
乙同学阅读时间的极差为,故C错误;
因为,所以甲同学阅读时间的75%分位数为第个数,故D正确.
8.(2026·山东东营·一模)(多选)一组样本数据, 其平均数、方差、第一四分位数、极差分别记为,由这组数据得到一组新样本数据,其中 ,其平均数、方差、第一四分位数、极差分别记为,则( )
A. B.
C. D.
【答案】AC
【分析】不妨设,再利用平均数定义、方差性质、百分位数定义与极差定义逐项计算并判断即可.
【详解】不妨设,则;
对A:,故A正确;
对B:由方差性质可得,故B错误;
对C:若为整数,则,
;
若不为整数,则,其中表示不大于的最大整数,
,故C正确;
对D:,,故D错误.
9.(25-26高一上·江西南昌·期末)(多选)一体育比赛,7个评委打分,相对之前的分数,去掉一个最高分,去掉一个最低分后,下列说法正确的是( )
A.中位数一定不变 B.平均数一定不变
C.方差不变或变小 D.极差不变或变小
【答案】ACD
【分析】根据平均数、中位数、方差、极差定义理解及求法判断各项的正误.
【详解】设个原始分分数为,去掉一个最高分,去掉一个最低分后有效分为,
原始分的中位数为,有效分的中位数也为,故A正确,
原始分的平均数,有效分的平均数,
则,
又具体值不知,故平均数变化不确定,故B错误,
去掉一个最高分,去掉一个最低分后数据更加集中,数据的离散程度会减小,故方差变小,
当时,方差不变,故C正确,
原始分的极差,有效分的极差,,故极差变小或不变,故D正确.
故选:ACD.
10.(25-26高一上·江西赣州·期末)(多选)下列说法正确的是( )
A.若一组数据为,则其平均数、中位数相同
B.若甲、乙、丙三种物品数量比为,现用分层随机抽样方法抽取甲物品8个,则样本容量为40
C.分层随机抽样中仅有甲乙两层样本,若甲层样本均值为5,乙层样本均值为10,总样本均值为8,则甲层样本量占总样本量的比例为
D.若一组数据的极差为6,方差为2,则数据的极差和方差均为18
【答案】ACD
【分析】选项A,计算平均数和中位数即可;选项B,利用分层抽样方法分析即可;选项C,根据分层抽样均值计算方法计算即可;选项D,利用方差与极差的定义和性质分析即可.
【详解】选项A,数据的平均数为:,
数据从小到大排序为:,中位数为第三个数即为,
故A选项正确;
选项B,由甲、乙、丙三种物品数量比为,
所以分层抽样时,抽甲物品所占比例为:,
设样本容量为,则有,
故B选项不正确;
选项C,设甲层样本量占总样本量的比例为,
则乙层样本量占总样本量的比例为,
由题意得:,解得:,
故C选项正确;
选项D,若数据的最大一个数为,
最小一个数为,则极差为,
此时数据的最大一个数为,
最小一个数为,
则极差为,
又若数据的方差为2,
则数据的方差为:,
故D选项正确;
故选:ACD.
11.(2026·湖北·一模)已知名同学的跳远成绩(单位:)排序后如下:,,,,,,,,,,则这组数据的第百分位数是________.
【答案】4.05
【详解】因为,
故第百分位数为第个数和第个数的平均数即为.
12.(25-26高一上·江西南昌·期末)某单位为了解职工体重情况,采用分层随机抽样的方法从800名职工中抽取了一个容量为80的样本.其中,男性平均体重为64千克,方差为151;女性平均体重为56千克,方差为159,男、女人数之比为,则估计全体单位职工体重的方差为___________.
【答案】169
【分析】先求出平均体重,然后根据方差公式可求方差.
【详解】依题意,单位职工平均体重为(千克),则单位职工体重的方差为.
故答案为:169
13.(25-26高一下·甘肃·月考)某高校承办了地铁站的志愿者选拔面试工作,现随机抽取了200名候选人的面试成绩(成绩均在内)并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值,并估计这200名候选者面试成绩的平均数(同一组中的数据用该组区间的中点值为代表);
(2)现从第四组和第五组中用分层随机抽样的方法选取20人的成绩,若这20人中来自第四组候选者的面试成绩的平均数和方差分别为80和6.5,来自第五组候选者的测试成绩的平均数和方差分别为90和3.5,据此估计这次第四组和第五组所有参与测试的候选者的成绩的方差.
【答案】(1),平均数为69.5
(2)21.9
【分析】(1)根据频率分布直方图中所有小矩形面积和为1,可得a值,根据频率分布直方图中平均数的求法,代入数据,即可得答案.
(2)根据第四组和第五组的频率之比,可得合并后的平均数,根据合并后的方差的公式,代入求解,即可得答案.
【详解】(1)由题意知,解得.
估计这200名候选者面试成绩的平均数,
即估计这200名候选者面试成绩的平均数为69.5.
(2)设第四组、第五组候选者的测试成绩的平均数和方差分别为,,,,
则,,,,
且这两组的频率之比为4:1,则这两组的平均数为,
所以第四组和第五组所有参与测试的候选者的测试成绩的方差为:
所以第四组和第五组所有参与测试的候选者的成绩的方差为21.9.
14.(25-26高一上·山西忻州·期末)某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了100名学生的成绩作为样本进行统计,将其成绩(满分:100分)分成,,…,六组,得到如图所示频率分布直方图.
(1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若根据这次成绩,学校准备给成绩较高的前20%的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数;
(3)若落在中的样本数据的平均数是54,方差是6,落在中的样本数据的平均数是66,方差是3,求这两组数据的总平均数和方差.
【答案】(1),平均数74;
(2)86;
(3),.
【分析】(1)利用频率分布直方图各小矩形面积和为1求的值;用该组区间的中点值代表同组数据计算样本数据的平均数.
(2)利用频率分布直方图估计第分位数即可.
(3)利用分层抽样的平均数公式、方差公式分别求出和.
【详解】(1)由频率分布直方图,得,解得;
平均数为.
(2)设“获得该荣誉证书的最低分数”为,由分数介于的频率为、
分数介于的频率为,得获得该荣誉证书的最低分数介于之间,
则有,解得,所以获得该荣誉证书的最低分数为86.
(3)由落在中的样本数据的平均数是54,方差是6,落在中的样本数据的平均数是66,方差是3,
所以这两组数据的总平均数为,
方差为.
15.(25-26高一上·江西南昌·期末)某奶茶店统计了300名顾客的单次消费金额(单位:元),并将所有数据按照,,,,分成5组,得到如图所示的频率分布直方图.
(1)求的值;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(2)估计这300名顾客的单次消费金额的平均数;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若频率分布直方图中第一组单次消费金额的方差为1,第二组单次消费金额的方差为6,估计第一组与第二组所有顾客单次消费金额的方差.
附:若数据,,,的平均数为,方差为,数据,,,的平均数为,方差为,将这两组数据混合在一起得到一组新的数据,设新数据的平均数为,则新数据
的方差为.
【答案】(1)
(2)
(3)21
【分析】(1)根据频率分布直方图中各组频率之和为1求出;
(2)根据平均数公式结合频率分布直方图计算即可;
(3)根据方差公式进行计算即可.
【详解】(1)由题意可得,
解得.
(2)估计这300名顾客的单次消费金额的平均数为.
(3)因为第一组的频率为,第二组的频率为,
所以第一组与第二组所有顾客单次消费金额的平均数为,
为第一组数据所占比例,即,同理,
所以估计第一组与第二组所有顾客单次消费金额的方差.
1 / 1
学科网(北京)股份有限公司
$
9.2 用样本估计总体
1.掌握频率分布表的作法以及频率分布直方图的画法.掌握用频率分布直方图估计总体.在问题情境中会用不同的统计图分析样本数据.
2.能从统计图表中获取有价值的信息,估计总体分布的规律.
3.理解百分位数的统计含义.结合实例,能用样本估计百分位数.
4.会求样本数据的众数、中位数、平均数.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.
5.理解方差、标准差的含义,会计算方差和标准差.掌握求分层随机抽样总样本的平均数及方差的方法.
频率分布直方图
画频率分布直方图的步骤
(1)求极差:极差为一组数据中 最大值 与 最小值 的差.
(2)决定组距与组数:当样本容量不超过100时,常分成 5~12 组,为了方便起见,一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表:一般分四列:分组、 频数累计 、频数、 频率 .其中频数合计应是样本容量,频率合计是 1 .
(5)画频率分布直方图:横轴表示分组,纵轴表示 .小长方形的面积=组距× = 频率 .各小长方形的面积总和等于1.
绘制频率分布直方图的注意点
(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1.
(2)横轴表示样本数据,纵轴表这样每一组的频率可以用该组的组距为底、.
(3)画频率分布直方图的关键是确定矩形的高,一般地,频率分布直方图中两坐标轴上的单位长度不一致.
频率分布直方图具备的性质
(1)因为小长方形的面积=组距×= 频率 ,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小长方形的面积之和等于 1 .
(3)样本容量=.
条形图、折线图、扇形图
(1)条形图
用途:直观描述不同类别或分组数据的频数和频率.
优点:当数据量很大时,它能更直观地反映数据分布的大致情况,并能清晰地表示出各个区间的具体数目.
缺点:会损失数据的部分信息.
(2)折线图
用途:描述数据随时间的变化趋势.
优点:可以表示数量的多少,直观反映数量的增减情况,即变化趋势.
缺点:不能直观反映数据的分布情况.
(3)扇形图
用途:直观描述各类数据占总数的比例.
优点:可以直观地反映出各种情况所占的比例.
缺点:看不出具体数据的多少.
【注意】(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.
(2)扇形图是用整个圆的面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.
(3)在画折线图时,要注意明确横轴、纵轴的实际含义.
百分位数的定义
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按 从小到大 排列原始数据.
第2步,计算i= n×p% .
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 j 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 平均数 .
3.四分位数
(1)中位数相当于是第 50 百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第 25 ,50 ,75 百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第 一 四分位数或 下 四分位数等,第75百分位数也称为第 三 四分位数或 上 四分位数等.
求百分位数的注意事项
(1)求百分位数时,一定要将数据按照从小到大的顺序排列.
(2)计算i=n×p%后要弄清i是整数还是非整数.
由频率分布直方图估计百分位数的方法
(1)确定百分位数所在的区间[a,b).
(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为 a+×(b-a) .
众数、中位数、平均数
1.众数:一组数据中出现 次数 最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在 中间 位置的数(或中间两个数的 平均数 )叫做这组数据的中位数.
3.平均数:如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)叫做这n个数的平均数.
【注意】 (1)一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个(如1,2,2,3,3,4,5,6这组数的众数是2和3),还可以没有(如1,2,3,4,5,6这组数就没有众数).
(2)众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数.
平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总数是奇数还是偶数而定;众数是看出现次数最多的数.
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
方差、标准差
1.一组数据x1,x2,…,xn的方差和标准差
数据x1,x2,…,xn的方差为=,
标准差为.
2.总体方差和标准差
(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为则称S2=为总体方差,S= 为总体标准差.
(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k( k≤N )个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为f i(i=1,2,…,k),则总体方差为S2=.
3.样本方差和标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为则称s2= 为样本方差,s= 为样本标准差.
4.标准差的意义
标准差刻画了数据的 离散程度 或 波动幅度 ,标准差越大,数据的离散程度越 大 ;标准差越小,数据的离散程度越 小 .
对方差与标准差概念的理解
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.
(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
方差和标准差的计算技巧与性质
(1)方差的计算
①基本公式:s2=2+2+…+].
②简化计算公式:s2=即方差等于原数据平方的平均数减去平均数的平方.
(2)方差和标准差的性质
若把一组数据的每一个数变为原来的k倍并加上或减去常数a,则它的标准差变为原来的k倍,方差变为原来的k2倍,而与a的大小无关.
分层随机抽样的方差
设样本容量为n,平均数为其中两层的个体数量分别为n1,n2,两层的平均数分别为方差分别为则这个样本的方差为
s2= .
题型一 频率分布直方图
1.(2026·辽宁沈阳·二模)某精密仪器厂正在研发一种标准长度为52mm的金属垫片.现随机抽取200个垫片测量其实际长度(单位:mm),按长度分组并绘制出如图所示的频率分布直方图.若规定长度在区间内的垫片为合格品.利用样本频率估计总体概率的方法,则任取一个垫片为合格品的概率为( )
A.0.3 B.0.4 C.0.5 D.0.6
2.(25-26高一下·全国·单元测试)某中学随机抽取部分高一学生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是,样本数据分组为,,,,.
(1)频率分布直方图中的值为____________;
(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1200名,估计新生中可以申请住校的学生有____________名.
3.(25-26高一上·北京西城·期末)为了解某校高三学生寒假期间每天平均学习的时间(单位:小时),现从该校高三年级随机抽取了部分同学进行调研,在获得这些同学每天平均学习的时间后,将数据按照,,,,分成5组,制成了如图所示的频率分布直方图,则
(1)______;
(2)若样本中每天学习时间在区间上的同学恰有2人,则共抽取了______位同学调研.
4.(25-26高一·全国·假期作业)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知______(结果保留3位小数).若要从身高在,,三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为______.
5.(2025高三·江苏·专题练习)某校为了解今年春季学期开学第一周,高二年级学生参加学校社团活动的时长,有关部门随机抽查了该校高二年级100名同学,统计他们今年春季学期开学第一周参加学校社团活动的时长,并绘制成如图所示的频率分布直方图.其中这100名同学今年春季学期开学第一周参加学校社团活动的时长(单位:小时)范围是,数据分组为.这100名同学中,今年春季学期开学第一周参加学校社团活动的时长不少于6小时的人数为( )
A.68 B.27
C.66 D.86
6.(24-25高二下·云南昆明·月考)为调查社区居民对社区工作的满意度,在社区内抽取200名居民进行问卷调查,将收集到的数据分成五组,绘制出以下频率分布直方图,若的频率为0.48,,的值为( )
A.0.017,0.048 B.0.017,0.48 C.0.17,0.048 D.0.17,0.48
题型二 条形图、折线图、扇形图
7.(25-26高一下·贵州遵义·月考)某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中正确的是( )
A.丁险种参保人数超过六成 B.41岁以上参保人数超过总参保人数的五成
C.54周岁以上人群参保的总费用最少 D.人均参保费用不超过5000元
8.(2026·安徽安庆·一模)(多选)某地区2025年2月至10月地方一般公共预算收入累计的统计图表如下(条形图为月累计值,折线图为与上年同月累计值的环比增长率):
月份
2月
3月
4月
5月
6月
7月
8月
9月
10月
累计收入(亿元)
43.88
66.57
83.96
96.87
134.69
150.09
161.05
191.67
213.39
同比增长率(%)
2
2.1
2.1
3
1
4.2
4.8
根据图表,下列说法正确的是( )
A.该地区2025年每月的地方一般公共预算收入一直递增
B.2025年8月该地区的地方一般公共预算收入超过22亿元
C.2025年9月该地区的地方一般公共预算收入比2024年9月高
D.2024年前9个月,该地区地方一般公共预算收入平均数高于20亿元
9.(25-26高三上·河南信阳·期末)某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业从业者中,“90后”占比不超过
C.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数多
10.(2025高三·上海·专题练习)如图所示,下面是出口,上面是进口,哪个进出口贸易总额不对( )
A.从2018年开始后,图表中最后一年增长率最大;
B.从2018年开始后,进出口总额逐年增大;
C.从2018年开始后,进口总额逐年增大;
D.从2018年开始后,图表2020年增长率最小.
11.(2026高三·全国·专题练习)某高中2024年的高考考生人数是2023年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2023年和2024年高考分数达线情况,得到如图所示扇形统计图:
下列结论正确的是( )
A.该校2024年与2023年的本科达线人数比为6:5
B.该校2024年与2023年的专科达线人数比为6:7
C.2024年该校本科达线人数增加了80%
D.2024年该校不上线的人数有所减少
题型三 百分位数
12.(2026·云南·模拟预测)数据9,12,15,16,16,18,20,21的75%分位数为( )
A.20 B.19 C.18 D.16
13.(2026高一·全国·专题练习)样本数据38,133,143,177,209,151,210,223, 252,281,218,309的上四分位数是( )
A.223 B.237 C.237.5 D.252
14.(2026·河北保定·一模)已知一组数据从小到大排列为4,6,7,8,,m,,,,,若该组数据的分位数是,则( )
A. B. C. D.
15.(2026·安徽安庆·二模)统计某地区2025年上半年的月降水量,数据如下表:
月份
1
2
3
4
5
6
月降水量/mm
58
48
53
46
56
56
则该地区上半年月降水量的分位数为___________.
16.(25-26高一下·贵州遵义·月考)下面是一组学生某次跳绳活动课半分钟跳绳次数的数据:90,88,110,118,108,116,120,98,则这组数据的第60百分位数为( )
A.116 B.113 C.110 D.108
17.(24-25高一上·安徽淮北·期末)样本数据的分位数为( )
A. B. C. D.
题型四 众数、中位数、平均数、极差
18.(2026·湖北武汉·模拟预测)(多选)现有10个数据为:3,3,3,3,4,4,4,5,5,6,对于该组数据,下列说法中正确的有( )
A.众数是4 B.平均数是4 C.极差是3 D.中位数是4.5
19.(25-26高一下·贵州遵义·月考)若一组数据的,,,的平均数为4,则,,,的平均数为________.
20.(2026·福建龙岩·一模)已知从小到大排列的一组数据1,2,4,,8,10,若这组数据的第60百分位数与平均数相等,则实数的值为______.
21.(25-26高一下·全国·期末)某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用电量/度
120
140
160
180
200
户数
2
3
6
7
2
则这20户家庭该月用电量的众数和中位数分别是( )
A.180,170 B.160,180 C.160,170 D.180,160
22.(24-25高一下·贵州黔东南·期末)(多选)凯里市某七天每天的最高气温分别是37,35,34,36,39,36,34(单位℃),则( )
A.该组数据的平均数为36 B.该组数据的极差为5
C.该组数据的第60百分位数为37 D.该组数据的中位数为36
23.(25-26高一上·辽宁锦州·期末)某校组织了一次航空知识竞赛,甲、乙两个班级各派8名同学代表参赛.两个班级的数学课代表合作,将甲、乙两班所有参赛同学的得分绘制成如图所示的茎叶图,则下列结论正确的是( )
A.甲班参赛同学得分的极差比乙班参赛同学得分的极差大
B.甲班参赛同学得分的中位数比乙班参赛同学得分的中位数高
C.甲班参赛同学得分的平均数为84
D.乙班参赛同学得分的75%分位数为89
24.(25-26高一下·贵州遵义·开学考试)(多选)某公司统计其员工的专业素养指标,公司员工年龄分布如下表,则( )
年龄
28
29
30
32
36
40
45
人数
1
3
3
5
4
3
1
A.这组数据的平均数是33.2 B.这组数据的极差是17
C.这组数据的第75百分位数是36 D.这组数据的中位数和众数相同
题型五 方差、标准差
25.(25-26高一下·河北保定·月考)已知样本数据,,,,的平均数为4,方差为2,则样本数据,,,,的平均数和方差分别为________和________.
26.(25-26高一下·辽宁铁岭·月考)(多选)某城市连续7天的最低温度(单位:℃)为0,2,5,5,6,7,3,则这组数据的( )
A.极差为7 B.分位数为4
C.平均数为4 D.方差为
27.(2026·广东广州·二模)(多选)为普及法制教育,对50名市民开展了一次法律知识竞赛答题活动,测试成绩统计如表所示,其中两个数据被遮盖.
成绩/分
92
93
95
96
98
99
100
人数
5
7
8
14
13
下列结论正确的是( )
A.众数为99 B.极差为9
C.分位数为96 D.平均数大于中位数
28.(25-26高一下·贵州遵义·月考)引体向上是中小学体质健康测试男生的项目,主要测试学生上肢力量.在对某高中1000名高一、高二年级男生的引体向上成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名学生中高一年级男生有600人,且抽取的样本中高一男生成绩的平均数和方差分别为5.5和6.74,高二男生成绩的平均数和方差分别为6.5和5.34,则总体方差( )
(附:)
A.6.42 B.6.18 C.5.96 D.5.84
29.(24-25高一下·江苏无锡·期末)经过简单随机抽样获得的样本数据为,,…,,且数据,,…,的平均数为,方差为,则下列说法正确的是( )
A.;
B.若,则所有的数据都为0;
C.若,则的平均数为6;
D.若,则的方差为12;
30.(25-26高一下·江西景德镇·月考)已知一组数据由5个正整数组成,下列描述中,能确保这组数据中一定没有出现8的是( )
A.平均数为4,中位数3 B.平均数为4,众数为4
C.平均数为4,方差为3.6 D.中位数为5,方差为3.6
31.(24-25高一上·安徽淮北·期末)某校为调查高一年级的某次考试的数学情况,选取高一年级甲班和乙班进行调查.若甲班学生数学成绩的平均数为90,方差为3,乙班学生数学成绩的平均数为81,方差为5,且甲乙两班的学生人数之比为,则这两班数学的总成绩平均分和方差分别为( )
A.85.5; B.; C.85.5; D.;
题型六 利用频率分布直方图估计众数、中位数、平均数、百分位数
32.(2025高一·全国·专题练习)(多选)某校对名学生的数学竞赛成绩进行统计,分成,,,,五组,得到如图所示的频率分布直方图,则下列说法中正确的是( )
A.
B.估计该校学生竞赛成绩的众数为
C.该校学生竞赛成绩的中位数大于
D.估计该校学生竞赛成绩的平均数落在内
33.(24-25高一下·吉林长春·期末)(多选)在某市初三年级举行的一次体育统考考试中,共有500人参加考试.为了解学生的成绩情况,抽取了样本容量为的部分考生成绩,已知所有考生成绩均在,按照,,,,的分组作出如图所示的频率分布直方图、若在样本中,成绩落在区间的人数为32,则由样本估计总体可知下列结论正确的为( )
A. B.估计考生成绩的众数为72
C.估计考生成绩的中位数为71 D.估计该市考生成绩的平均分为70.6
34.(24-25高一下·安徽安庆·期末)(多选)将某工厂新生产的10000件产品的质量大小统计如下图所示,则( )
A.质量在区间的产品有2000件 B.质量在区间的频率为0.2
C.这10000件产品的质量的中位数大于1.15 D.这10000件产品的质量的众数为1.175
35.(25-26高二上·贵州·月考)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值与样本成绩的平均数、中位数;
(2)若落在的平均成绩是57,方差是2,落在的平均成绩为69,方差是5,求这两组成绩的总平均数和总方差.
参考公式:其中为总样本平均数.
36.(25-26高一下·全国·单元测试)如图是某地某公司1000名员工的月收入的直方图.根据直方图估计:
(1)该公司月收入在1000元到1500元之间的人数;
(2)该公司员工的月平均收入;
(3)该公司员工收入的众数;
(4)该公司员工月收入的中位数;
(5)该公司员工月收入的第90分位数.
37.(25-26高一上·安徽·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均不低于分)分成六组:、、、,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)试估计样本成绩的平均数(同一组数据用该组数据的中间值代替)和中位数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩合并后的平均数和方差.
1.(25-26高三下·重庆渝中·月考)样本数据4,16,5,27,6,30,11,21的第25百分位数为( )
A.27 B.24
C.5 D.
2.(2026·江西吉安·一模)某市连续8天的AQI(空气质量指数)分别为,则这组数据的上四分位数为( )
A.32 B.33 C.48 D.49
3.(2026·河南开封·模拟预测)随着电视剧《沉默的荣耀》的热播,剧中人物原型吴石将军的故居——位于福州市仓山区螺洲镇,其成为游客追寻先烈足迹、缅怀革命精神的热门“红色打卡地”.其中连续10日的游客人数依次为872,963,742,682,1322,1244,674,548,884,993,则这组数据的中位数为( )
A.872 B.878 C.884 D.1283
4.(2026·山东烟台·一模)直播带货已经成为助力乡村振兴的重要方式之一.某村统计了一合作社最近天通过直播带货销售农产品的日销售额(单位:万元),并绘制成右侧的频率分布直方图,则的第百分位数为( )
A. B. C. D.
5.(2026·湖南·模拟预测)国家能源集团研发的“擎源”大模型用于预测关键节点电价,研究人员利用模型对某节点连续8个小时的实际与预测电价数据进行记录,并利用上述数据绘制成实际值与预测值对比的折线图(两条折线):
观察图表与数据,下列结论不能直接从中得出的是( )
A.实际电价与预测电价的变化趋势一致,均在下午时段(第5小时左右)达到峰值
B.这8小时内,预测值与实际值的差异(两个值的差的绝对值)平均在10元/MWh左右
C.模型对所有“价格下跌时段”(如第5-6小时)的预测都出现了滞后性(即预测反应慢于实际变化)
D.模型的预测精度较高,趋势与实际基本一致,对电网调度有重要参考价值
6.(25-26高一上·贵州遵义·期末)年月日,国家统计局发布了“年全国专利密集型产业增加值数据公告”. 年全国专利密集型产业增加值总量为千亿元,其内部构成用雷达图表示如图,以下说法正确的是:( )
A.医药医疗产业在年全国专利密集型产业增加值的构成中规模最小
B.信息通信技术服务业在年全国专利密集型产业增加值的构成中规模最大
C.新装备制造业在年全国专利密集型产业增加值的构成中占比大于
D.新装备制造业在年全国专利密集型产业增加值的构成中占比小于
7.(25-26高一下·贵州遵义·开学考试)(多选)某校为了鼓励同学们利用课余时间阅读,开展了读书周活动.如图是某班甲、乙两名同学在一周内每天阅读时间的折线图,根据该折线图,下列结论正确的是( )
A.甲同学阅读时间更加稳定
B.乙同学的平均阅读时间等于甲同学的平均阅读时间
C.乙同学阅读时间的极差为20
D.甲同学阅读时间的75%分位数为25
8.(2026·山东东营·一模)(多选)一组样本数据, 其平均数、方差、第一四分位数、极差分别记为,由这组数据得到一组新样本数据,其中 ,其平均数、方差、第一四分位数、极差分别记为,则( )
A. B.
C. D.
9.(25-26高一上·江西南昌·期末)(多选)一体育比赛,7个评委打分,相对之前的分数,去掉一个最高分,去掉一个最低分后,下列说法正确的是( )
A.中位数一定不变 B.平均数一定不变
C.方差不变或变小 D.极差不变或变小
10.(25-26高一上·江西赣州·期末)(多选)下列说法正确的是( )
A.若一组数据为,则其平均数、中位数相同
B.若甲、乙、丙三种物品数量比为,现用分层随机抽样方法抽取甲物品8个,则样本容量为40
C.分层随机抽样中仅有甲乙两层样本,若甲层样本均值为5,乙层样本均值为10,总样本均值为8,则甲层样本量占总样本量的比例为
D.若一组数据的极差为6,方差为2,则数据的极差和方差均为18
11.(2026·湖北·一模)已知名同学的跳远成绩(单位:)排序后如下:,,,,,,,,,,则这组数据的第百分位数是________.
12.(25-26高一上·江西南昌·期末)某单位为了解职工体重情况,采用分层随机抽样的方法从800名职工中抽取了一个容量为80的样本.其中,男性平均体重为64千克,方差为151;女性平均体重为56千克,方差为159,男、女人数之比为,则估计全体单位职工体重的方差为___________.
13.(25-26高一下·甘肃·月考)某高校承办了地铁站的志愿者选拔面试工作,现随机抽取了200名候选人的面试成绩(成绩均在内)并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值,并估计这200名候选者面试成绩的平均数(同一组中的数据用该组区间的中点值为代表);
(2)现从第四组和第五组中用分层随机抽样的方法选取20人的成绩,若这20人中来自第四组候选者的面试成绩的平均数和方差分别为80和6.5,来自第五组候选者的测试成绩的平均数和方差分别为90和3.5,据此估计这次第四组和第五组所有参与测试的候选者的成绩的方差.
14.(25-26高一上·山西忻州·期末)某中学举行了一次环保知识竞赛,为了了解本次竞赛的情况,从中抽取了100名学生的成绩作为样本进行统计,将其成绩(满分:100分)分成,,…,六组,得到如图所示频率分布直方图.
(1)求图中的值,并估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若根据这次成绩,学校准备给成绩较高的前20%的学生颁发“环保小达人”荣誉证书,估计获得该荣誉证书的最低分数;
(3)若落在中的样本数据的平均数是54,方差是6,落在中的样本数据的平均数是66,方差是3,求这两组数据的总平均数和方差.
15.(25-26高一上·江西南昌·期末)某奶茶店统计了300名顾客的单次消费金额(单位:元),并将所有数据按照,,,,分成5组,得到如图所示的频率分布直方图.
(1)求的值;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(2)估计这300名顾客的单次消费金额的平均数;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若频率分布直方图中第一组单次消费金额的方差为1,第二组单次消费金额的方差为6,估计第一组与第二组所有顾客单次消费金额的方差.
附:若数据,,,的平均数为,方差为,数据,,,的平均数为,方差为,将这两组数据混合在一起得到一组新的数据,设新数据的平均数为,则新数据
的方差为.
1 / 1
学科网(北京)股份有限公司
$