内容正文:
9.2 用样本估计总体
目录
题型1:频率分布直方图的完善及有关计算 5
题型2:根据统计图解决实际问题 6
题型3:总体百分位数的计算 9
题型4:平均数、中位数、众数的计算及应用 9
题型5:频率分布直方图中的数字特征 11
题型6:方差与标准差的计算及应用 13
1.
制作频率分布表、画频率分布直方图的步骤
(1) 求极差:极差为一组数据中最大值与最小值的差;
(2)
决定组距与组数:组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数也越多.当样本容量不超过100时,常分成5~12组,且组距=.为方便起见,一般取等长组距,并且组距应力求“取整”;
(3) 将数据分组:通常对组内数值所在左闭右开区间,最后一组左右都取闭区间;
(4)
列频率分布表:计算各小组的频率,第i组的频率=.作出频率分布表;
(5)
画频率分布直方图:以横轴表示分组的数据,纵轴表示的值,分别画出各小长方形.
2. 频率分布直方图的特点
(1)
各小长方形的面积表示相应各组的频率,即小长方形的面积=组距×=频率.
(2) 各小长方形的面积之比等于频率之比,也等于各小长方形的高度之比.
(3) 各小长方形的面积的总和等于1.
3. 统计图
除了频率分布直方图之外,我们还学过条形图、扇形图、折线图、频数分布直方图等.
(1) 不同的统计图在表示数据上有不同的特点.例如,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,扇形图主要用于直观描述各类数据占总数的比例,折线图主要用于描述数据随时间的变化趋势.
(2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续性数据.
4. 总体百分位数的估计
(1) 第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2) 计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3) 四分位数
常用的分位数有第25百分位数、第50百分位数(中位数)、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
5. 总体集中趋势的估计
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
(1) 平均数、中位数、众数
名称
定义
特点
平均数
如果个数,那么叫做这个数的平均数.
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
把一组数据按从小到大的顺序排列,处在中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响。中位数可能在所给的数据中,也可能不在所给的数据中。当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势。
众数
一组数据中重复出现次数最多的数据(即频率最大值对应的数据样本)叫做这组数据的众数.
众数体现了样本数据的最大集中点,只能传递数据中的信息的很少一部分,当一组数据中有不少数据重复出现时,众数往往更能反映问题。
(2) 求平均数的方法:
1
定义法:已知为个数据,那么这个数的平均数为。
2
新数据法:如果一组数的平均数为,则一组数的平均数为.
3
加权平均数法:样本中,数据有个,有个,有个,则 .
4
频率法:若取值为的频率分别为,则其平均数.
(3) 频率分布直方图中的平均数、中位数和众数
①平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
③众数:众数是最高小矩形底边的中点所对应的数据.
6. 总体离散程度的估计
(1) 平均距离、方差、标准差
假设一组数据是用表示这组数据的平均值.那么这组数据到的“平均距离”为,这组数据的方差,这组数据的标准差.
提醒 方差的简化计算公式:
(2) 方差相关结论
数据的方差为,则数据的方差为.
(3) 分层随机抽样的方差
设样本中不同层的平均数分别为为,方差分别为,相应的权重分别为,则这个样本的方差为,其中为样本平均数.
(4) 总体离散程度的估计
极差:极差越大,数据的波动范围越大;
方差和标准差:在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
题型1:频率分布直方图的完善及有关计算
【例1.1】 某校根据学生情况将物理考试成绩进行赋分,目的是为了更好地对新高考改革中不同选科学生的考试成绩进行横向对比,经过对全校300名学生的成绩统计,可得到如图所示的频率分布直方图,则这些同学物理成绩大于等于80分的人数为( )
A.60 B.90 C.120 D.150
【例1.2】
为调查社区居民对社区工作的满意度,在社区内抽取名居民进行问卷调查,将收集到的数据分成五组,绘制出如下频率分布直方图,若的频率为,的值为( )
A., B., C., D.,
【例1.3】 某校高三年级共800名学生,将其期中考试的数学成绩进行适当分组后,得到频率分布直方图如图所示.若要从这800人中按分数从高到低录取72人组成数学兴趣小组,则录取分数线估计为( )
A.105分 B.108分 C.110分 D.112.5分
【例1.4】 某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
题型2:根据统计图解决实际问题
【例2.1】
随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从年月到该地旅游的游客中随机抽取部分游客进行调查,得到各年龄段游客的人数比例和各年龄段中自助游的比例,如图,则下列说法错误的是( )
A.若调查的游客中青年人有人,则一共调查了人
B.估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的
C.用分层随机抽样的方法对所调查游客进行抽样,若老年人有人,则中年人有人
D.估计年月到该地旅游且选择自助游的游客中青年人不超过一半
【例2.2】 某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中正确的是( )
A.丁险种参保人数超过六成 B.41岁以上参保人数超过总参保人数的五成
C.54周岁以上人群参保的总费用最少 D.人均参保费用不超过5000元
【例2.3】
班长统计了去年月“书香校园”活动中全班同学的课外阅读数量(单位:本),并绘制了如图所示的折线统计图,下列说法不正确的是( )
A.阅读数量最大的是8月份
B.阅读数量最小的是1月份
C.阅读数量最大的月份比最小的月份多55本
D.每月阅读数量超过40的有6个月
【例2.4】 某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的25%
C.芯片、软件行业从业者中,“90后”占比不超过50%
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数少
【例2.5】 某生活超市2025年第一季度各区域营业收入占比和净利润占比统计如下表所示:
生鲜区
熟食区
乳制品区
日用品区
其他区
营业收入占比
48.6%
15.8%
20.1%
10.8%
4.7%
净利润占比
65.8%
-4.3%
16.5%
20.2%
1.8%
已知该生活超市本季度的总营业利润率为32.5%(营业利润率是净利润占营业收入的百分比),下列结论不正确的是( )
A.本季度此生活超市的营业净利润超过一半来自生鲜区
B.本季度此生活超市营业利润率最高的是日用品区
C.本季度此生活超市生鲜区的营业利润率超过40%
D.本季度此生活超市营业收入最低的是熟食区
题型3:总体百分位数的计算
【例3.1】 某同学记录了当地4月最后8天每天的最低气温(单位:℃),分别为12,14,12,16,12,11,15,17,则该组数据的第70百分位数为( )
A.12 B.14 C.15 D.16
【例3.2】 某同学记录了自己升入高三以来8次的数学考试成绩,分别为125,117,129,132,115,119,126,130,则该同学这8次的数学考试成绩的第40百分位数为( )
A.119 B.122 C.125 D.132
【例3.3】
某市某月天的空气质量指数如下:则这组数据的第百分位数是( )
A. B. C. D.
【例3.4】
已知一组数据:中的最小数据为9,且第75百分位数是14,则的不同取值可能有( )
A.8个 B.6个 C.4个 D.1个
题型4:平均数、中位数、众数的计算及应用
【例4.1】 某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用电量/度
120
140
160
180
200
户数
2
3
6
7
2
则这20户家庭该月用电量的众数和中位数分别是( )
A.180,170 B.160,180 C.160,170 D.180,160
【例4.2】
(多选)已知一组数据为,且这组数据的众数为8,那么下列选项正确的是( )
A.中位数是8 B.平均数是6
C. D.
【例4.3】 高二(1)班有40名学生,其中男生有16名,已知男生平均体重为68.4kg,总平均体重为60.1kg,则女生的平均体重约为( )
A.55.8kg B.54.6kg C.52.4kg D.51.8kg
【例4.4】
已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
【例4.5】 如表是某公司员工月收入的资料.
月收入/元
45000
18000
10000
5500
5000
3400
3300
1000
人数
1
1
1
3
6
1
11
1
能够反映该公司全体员工月收入水平的统计量是( )
A.平均数和众数 B.平均数和中位数
C.中位数和众数 D.平均数和方差
【例4.6】
已知,,…,的平均数为3,则,,…,的平均数为( )
A.5 B.7 C.17 D.25
【例4.7】 已知在某市委宣传部举办的中小学“红心向党”主题演讲比赛中,某选手共得9位评委的原始评分,若去掉一个最高分和一个最低分,得到7个有效评分,则这7个有效评分与9个原始评分相比,一定不变的数字特征是( )
A.中位数 B.平均数 C.方差 D.极差
题型5:频率分布直方图中的数字特征
【例5.1】 某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,
下列说法中正确的是( )
A. B.评分的众数估值为70
C.评分的第25百分位数估值为67.5 D.评分的平均数估值为76
【例5.2】 为进一步弘扬中华优秀传统文化,提升诗词爱好者的素养和创作水平,形成浓厚的国学和诗词学习氛围,2024年9月19日,首届“中华诗韵·风雅平凉”彦军杯诗词大赛决赛成功举行.为了解参赛者对此次活动的满意度,某研究性学习小组用问卷调查的方式随机调查了n名参赛者,该小组将收集到的参赛者满意度分值数据(满分100分)统计如下表所示:
分数
频数
5
10
20
b
35
频率
0.05
a
0.20
0.30
0.35
(1)分别求a,b,n的值,并在图中画出频率分布直方图;
(2)估计这n名参赛者满意度分值的中位数.
【例5.3】 一家品牌连锁公司旗下共有100所加盟店.公司在年底对所有加盟店本年度营销总额(单位:百万元)进行统计,制作频率分布表如下:
分组
频数
频率
10
0.1
x
0.15
20
0.2
30
y
15
0.15
5
0.05
5
0.05
合计
100
1.00
(1)请求出频率分布表中x,y的值,并画出频率分布直方图;
(2)请估计这100所加盟店去年销售总额的平均数(同一组中的数据,用该组区间的中点值作代表);
(3)为了评选本年度优秀加盟店,公司将依据营销总额制定评选标准,按照“不超过的加盟店获评优秀加盟店称号”的要求,请根据频率分布直方图,为该公司提出本年度“评选标准”建议.
【例5.4】
第二届全国城市生活垃圾分类宣传周的主题为“践行新时尚分类志愿行”.某中学高三年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求,的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
题型6:方差与标准差的计算及应用
【例6.1】
某校在一次考试后,对两班的数学成绩进行分析.已知班有人,平均成绩为分,方差为;班有人,平均成绩为分,方差为.则两班全部名同学数学成绩的方差是( )
A. B. C. D.
【例6.2】 一数学学习小组有5名同学,他们的历次数学考试成绩都比较稳定,且每次测试5人成绩的方差均为6左右.某次数学测试他们中的甲同学因故没能参加考试,其余四位同学的数学成绩分别为111分,114分,117分,118分.如果甲同学参加这次考试,利用以往的经验(方差为6)估计其成绩为( )
A.112分 B.113分 C.115分 D.119分
【例6.3】
甲、乙两人6次模拟考试英语成绩(不含听力)的折线统计图如图所示,甲、乙两人成绩的平均数分别记作,标准差分别记作,则( )
A. B.
C. D.
【例6.4】
已知数据的平均数,方差,若把剔除,则剩余这9个数的方差为 .
【例6.5】
(多选)设样本数据的平均数为,方差为,设,样本数据的平均数为,方差为,则( )
A. B.
C. D.
【例6.6】 (多选)在某年的中国足球超级联赛上,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;乙队每场比赛平均失球数是2.1,全年失球个数的标准差是0.4.下列说法中正确的是( )
A.平均说来甲队比乙队防守技术好 B.甲队比乙队技术水平更稳定
C.甲队有时表现很差,有时表现又非常好 D.乙队很少不失球
【例6.7】
某地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为,三所学校共有数学强基学生48人,在一次统一考试中,所有学生的成绩平均分为117,方差为22.5,已知甲、乙两所学校的数学强基小组学生的学均分分别为118和114,方差分别为15和21,则丙学校的学生成绩的方差是__________.
【例6.8】 某班20位女同学平均分为甲、乙两组,她们的美学鉴赏课考试成绩如下(单位:分):
甲组:65,90,85,75,65,70,75,90,95,80
乙组:85,95,75,70,85,80,85,65,90,85
(1)试分别计算两组数据的极差和方差;
(2)试根据(1)中的计算结果,判断哪一组的成绩较稳定?
(
1
)
学科网(北京)股份有限公司
$
9.2 用样本估计总体
目录
题型1:频率分布直方图的完善及有关计算 5
题型2:根据统计图解决实际问题 9
题型3:总体百分位数的计算 13
题型4:平均数、中位数、众数的计算及应用 15
题型5:频率分布直方图中的数字特征 19
题型6:方差与标准差的计算及应用 24
1.
制作频率分布表、画频率分布直方图的步骤
(1) 求极差:极差为一组数据中最大值与最小值的差;
(2)
决定组距与组数:组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数也越多.当样本容量不超过100时,常分成5~12组,且组距=.为方便起见,一般取等长组距,并且组距应力求“取整”;
(3) 将数据分组:通常对组内数值所在左闭右开区间,最后一组左右都取闭区间;
(4)
列频率分布表:计算各小组的频率,第i组的频率=.作出频率分布表;
(5)
画频率分布直方图:以横轴表示分组的数据,纵轴表示的值,分别画出各小长方形.
2. 频率分布直方图的特点
(1)
各小长方形的面积表示相应各组的频率,即小长方形的面积=组距×=频率.
(2) 各小长方形的面积之比等于频率之比,也等于各小长方形的高度之比.
(3) 各小长方形的面积的总和等于1.
3. 统计图
除了频率分布直方图之外,我们还学过条形图、扇形图、折线图、频数分布直方图等.
(1) 不同的统计图在表示数据上有不同的特点.例如,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,扇形图主要用于直观描述各类数据占总数的比例,折线图主要用于描述数据随时间的变化趋势.
(2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续性数据.
4. 总体百分位数的估计
(1) 第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2) 计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3) 四分位数
常用的分位数有第25百分位数、第50百分位数(中位数)、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
5. 总体集中趋势的估计
一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
(1) 平均数、中位数、众数
名称
定义
特点
平均数
如果个数,那么叫做这个数的平均数.
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
把一组数据按从小到大的顺序排列,处在中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响。中位数可能在所给的数据中,也可能不在所给的数据中。当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势。
众数
一组数据中重复出现次数最多的数据(即频率最大值对应的数据样本)叫做这组数据的众数.
众数体现了样本数据的最大集中点,只能传递数据中的信息的很少一部分,当一组数据中有不少数据重复出现时,众数往往更能反映问题。
(2) 求平均数的方法:
1
定义法:已知为个数据,那么这个数的平均数为。
2
新数据法:如果一组数的平均数为,则一组数的平均数为.
3
加权平均数法:样本中,数据有个,有个,有个,则 .
4
频率法:若取值为的频率分别为,则其平均数.
(3) 频率分布直方图中的平均数、中位数和众数
①平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
③众数:众数是最高小矩形底边的中点所对应的数据.
6. 总体离散程度的估计
(1) 平均距离、方差、标准差
假设一组数据是用表示这组数据的平均值.那么这组数据到的“平均距离”为,这组数据的方差,这组数据的标准差.
提醒 方差的简化计算公式:
(2) 方差相关结论
数据的方差为,则数据的方差为.
(3) 分层随机抽样的方差
设样本中不同层的平均数分别为为,方差分别为,相应的权重分别为,则这个样本的方差为,其中为样本平均数.
(4) 总体离散程度的估计
极差:极差越大,数据的波动范围越大;
方差和标准差:在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
题型1:频率分布直方图的完善及有关计算
【例1.1】 某校根据学生情况将物理考试成绩进行赋分,目的是为了更好地对新高考改革中不同选科学生的考试成绩进行横向对比,经过对全校300名学生的成绩统计,可得到如图所示的频率分布直方图,则这些同学物理成绩大于等于80分的人数为( )
A.60 B.90 C.120 D.150
【答案】B
【难度】0.85
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【详解】由频率分布直方图的性质可得,,
解得.
这些同学物理成绩大于等于80分的人数为.
【例1.2】
为调查社区居民对社区工作的满意度,在社区内抽取名居民进行问卷调查,将收集到的数据分成五组,绘制出如下频率分布直方图,若的频率为,的值为( )
A., B., C., D.,
【答案】A
【难度】0.84
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、补全频率分布直方图
【分析】根据频率分布直方图的性质计算即可求解.
【详解】已知的频率为,组距为,因此,解得.
又因为所有组频率和为,因此,
代入,计算得 ,则,
因此,.
【例1.3】 某校高三年级共800名学生,将其期中考试的数学成绩进行适当分组后,得到频率分布直方图如图所示.若要从这800人中按分数从高到低录取72人组成数学兴趣小组,则录取分数线估计为( )
A.105分 B.108分 C.110分 D.112.5分
【答案】B
【难度】0.85
【知识点】频率分布直方图的实际应用、总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】方法一:根据频率之和为1得到方程,求出,从而得到取分数线在区间内,设录取分数线为分,得到方程,解得;
方法二:求出分数不低于110分的人数为,排除C,D;分数在内的人数大于120,估计分数不低于105分的人数大于,排除A,得到答案.
【详解】方法一:因为,
解得,分数在内的人数为,
分数在内的人数为,
由于,故录取分数线在区间内.
设录取分数线为分,则,解得;
方法二:排除法,
分数不低于110分的人数为,排除C,D.
分数在内的人数是分数在内的人数的三倍以上,
即分数在内的人数大于120,
因此估计分数不低于105分的人数大于,排除A.
故选:B.
【例1.4】 某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组
频数
频率
[50,60)
4
0.08
[60,70)
0.16
[70,80)
10
[80,90)
16
0.32
[90,100]
合计
50
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
【答案】(1)表格见解析
(2)作图见解析
(3)504
【难度】0.85
【知识点】补全频率分布表、补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)利用频率、频数和样本容量的关系即可完成此表格;
(2)利用表中数据计算出这个分数段对应的矩形高度即可完成频率分布直方图.
(3)先找出成绩分及以上对应的分数段的频率,再用该频率乘以总人数即可得到.
【详解】(1)由频率分布表,可知样本容量为50,
故成绩在[60,70)的频数为,
成绩在[70,80)的频率为,
成绩在[90,100]的频数为,
频率为,
故频率分布表为:
分组
频数
频率
[50,60)
4
0.08
[60,70)
8
0.16
[70,80)
10
0.20
[80,90)
16
0.32
[90,100]
12
0.24
合计
50
1
(2)频率分布直方图如图所示:
(3)样本中成绩在[80,100]的频率为0.32 + 0.24 = 0.56,
所以估计该校获得环保纪念勋章的学生人数为900×0.56 = 504.
题型2:根据统计图解决实际问题
【例2.1】
随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从年月到该地旅游的游客中随机抽取部分游客进行调查,得到各年龄段游客的人数比例和各年龄段中自助游的比例,如图,则下列说法错误的是( )
A.若调查的游客中青年人有人,则一共调查了人
B.估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的
C.用分层随机抽样的方法对所调查游客进行抽样,若老年人有人,则中年人有人
D.估计年月到该地旅游且选择自助游的游客中青年人不超过一半
【答案】D
【难度】0.72
【知识点】抽样比、样本总量、各层总数、总体容量的计算、根据条形统计图解决实际问题、根据扇形统计图解决实际问题
【详解】设年月到该地旅游的游客总人数为.
由题意,游客中老年人、中年人、青年人的人数分别为,
其中选择自助游的老年人、中年人、青年人的人数分别为.
对于A,,解得,即一共调查的游客人数是人,故A正确;
对于B,估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的,故B正确;
对于C,设中年人应抽取人,依题意得,解得,即中年人应抽取人,故C正确;
对于D,因为年月到该地旅游且选择自助游的游客的人数为,其中青年人的人数为,所以选择自助游的游客中青年人超过一半,故D错误.
【例2.2】 某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中正确的是( )
A.丁险种参保人数超过六成 B.41岁以上参保人数超过总参保人数的五成
C.54周岁以上人群参保的总费用最少 D.人均参保费用不超过5000元
【答案】D
【难度】0.75
【知识点】根据条形统计图解决实际问题、根据折线统计图解决实际问题、根据扇形统计图解决实际问题
【详解】对于A,由条形图可知丁险种参保比例为,故A错误;
对于B,由扇形图可知,41岁以上参保人数占比为,故B错误;
对于C,由扇形图与折线图可知18-29周岁人群参保人数占比,人均参保费用在元,
而54岁及以上人群参保比例虽只占,但人均参保费用为6000元,所以18-29周岁人群参保的总费用最少,故C错误;
对于D,由扇形图与折线图可知,人均参保费用约,故D正确.
【例2.3】
班长统计了去年月“书香校园”活动中全班同学的课外阅读数量(单位:本),并绘制了如图所示的折线统计图,下列说法不正确的是( )
A.阅读数量最大的是8月份
B.阅读数量最小的是1月份
C.阅读数量最大的月份比最小的月份多55本
D.每月阅读数量超过40的有6个月
【答案】B
【难度】0.95
【知识点】根据折线统计图解决实际问题
【详解】由图知阅读数量最大的是8月份,为83本;阅读数量最小的是6月份,为28本,故A正确,B错误.
阅读数量最大的月份比最小的月份多本,故C正确;
每月阅读数量超过40的有2,3,4,5,7,8共6个月,故D正确.
【例2.4】 某机构对我国若干大型科技公司调查统计后,得到了芯片、软件两个行业从业者的年龄分布的饼图(图1)和“90后”从事这两个行业岗位的分布雷达图(图2),则下列说法中一定正确的是( )
A.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
B.芯片、软件行业中从事技术和设计岗位的“90后”人数和超过从事这两个行业总人数的25%
C.芯片、软件行业从业者中,“90后”占比不超过50%
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”从事这两个行业的总人数少
【答案】B
【难度】0.65
【知识点】根据扇形统计图解决实际问题、雷达图的应用
【分析】根据饼形图和“90后”从事这两个行业岗位的分布雷达图的数据进行分析,逐项判断即可.
【详解】对于A,芯片、软件行业从事技术岗位的人中,“90后”人数占比为,占芯片、软件行业从业者的,
而芯片、软件行业从业者中“80后”占总人数的,但不知道从事技术岗位人数的比例,
故无法确定两者人数的多少,所以选项A不一定正确;
对于B,芯片、软件行业中从事技术、设计岗位的“90后”人数占比为,
所以超过从事这两个行业总人数的,所以选项B正确;
对于C,从饼图可看出芯片、软件行业从业者中,“90后”占比为,超过,所以选项C不正确;
对于D,芯片、软件行业中,“90后”从事市场岗位的人数占比为,
占芯片、软件行业从业者的,“80前”占比,所以选项D错误.
故选:B.
【例2.5】 某生活超市2025年第一季度各区域营业收入占比和净利润占比统计如下表所示:
生鲜区
熟食区
乳制品区
日用品区
其他区
营业收入占比
48.6%
15.8%
20.1%
10.8%
4.7%
净利润占比
65.8%
-4.3%
16.5%
20.2%
1.8%
已知该生活超市本季度的总营业利润率为32.5%(营业利润率是净利润占营业收入的百分比),下列结论不正确的是( )
A.本季度此生活超市的营业净利润超过一半来自生鲜区
B.本季度此生活超市营业利润率最高的是日用品区
C.本季度此生活超市生鲜区的营业利润率超过40%
D.本季度此生活超市营业收入最低的是熟食区
【答案】D
【难度】0.65
【知识点】根据频率分布表解决实际问题
【分析】根据表中数据以及营业利润率的概念逐项进行分析并判断.
【详解】生鲜区的净利润占比,故A正确.
生鲜区的营业利润率为,故C正确.
熟食区的营业利润率为;
乳制品区的营业利润率为;
其他区的营业利润率为;
日用品区的营业利润率为,最高,故B正确.
由题中数据知,其他区的营业收入占比4.7%为最低的,故D错误.
故选:D
题型3:总体百分位数的计算
【例3.1】 某同学记录了当地4月最后8天每天的最低气温(单位:℃),分别为12,14,12,16,12,11,15,17,则该组数据的第70百分位数为( )
A.12 B.14 C.15 D.16
【答案】C
【难度】0.82
【知识点】总体百分位数的估计
【详解】解:数据整理为11,12,12,12,14,15,16,17,
又,则该组数据的第70百分位数为第6个数15.
【例3.2】 某同学记录了自己升入高三以来8次的数学考试成绩,分别为125,117,129,132,115,119,126,130,则该同学这8次的数学考试成绩的第40百分位数为( )
A.119 B.122 C.125 D.132
【答案】C
【难度】0.85
【知识点】总体百分位数的估计
【分析】由百分位数的计算公式即可求解.
【详解】从小到大排序:115,117,119,125,126,129,130,132,
,
所以第40百分位数为第四个数,即125.
故选:C
【例3.3】
某市某月天的空气质量指数如下:则这组数据的第百分位数是( )
A. B. C. D.
【答案】B
【难度】0.65
【知识点】总体百分位数的估计
【详解】已知数据升序排列为:,样本量为,
第百分位数的位置为:,
为整数时,第百分位数取第和第项数据的平均值,
第百分位数为:.
【例3.4】
已知一组数据:中的最小数据为9,且第75百分位数是14,则的不同取值可能有( )
A.8个 B.6个 C.4个 D.1个
【答案】B
【难度】0.62
【知识点】总体百分位数的估计
【分析】根据数据中最小数据为,得到,再由百分位数的计算方法,求得,进而得到的可能取值的个数,即可求解.
【详解】因为数据中最小数据为,可得且,
将7个数据从小到大排序,
因为,则该组数据的第75百分位数为第6个数据,可得,
所以,则的可能取值有,共6个.
题型4:平均数、中位数、众数的计算及应用
【例4.1】 某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用电量/度
120
140
160
180
200
户数
2
3
6
7
2
则这20户家庭该月用电量的众数和中位数分别是( )
A.180,170 B.160,180 C.160,170 D.180,160
【答案】D
【难度】0.7
【知识点】计算几个数的众数、计算几个数的中位数
【分析】根据表格中的数据,结合众数和中位数的定义与求法,即可求解.
【详解】由表格中的数据,可得用电量为180度的家庭最多,有7户,
所以这20户家庭该月用电量的众数是180;
将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,160,
所以这20户家庭该月用电量的中位数是160.
故选:D.
【例4.2】
(多选)已知一组数据为,且这组数据的众数为8,那么下列选项正确的是( )
A.中位数是8 B.平均数是6
C. D.
【答案】ABD
【难度】0.85
【知识点】根据众数计算参数、计算几个数的中位数、计算几个数的平均数
【分析】借助众数定义可得,再利用中位数与平均数定义计算即可得.
【详解】由这组数据的众数为8,故,则这组数据为,
则这组数据中位数是8,平均数为,
故A、B、D正确,C错误.
【例4.3】 高二(1)班有40名学生,其中男生有16名,已知男生平均体重为68.4kg,总平均体重为60.1kg,则女生的平均体重约为( )
A.55.8kg B.54.6kg C.52.4kg D.51.8kg
【答案】B
【难度】0.94
【知识点】计算几个数的平均数、根据平均数求参数
【分析】设女生的平均体重为,根据平均数的计算公式列式求解即可.
【详解】由题意可知:高二(1)班有24名女生,有16名男生,
设女生的平均体重为,则,解得.
故选:B.
【例4.4】
已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
【答案】9.5
【难度】0.75
【知识点】抽样比、样本总量、各层总数、总体容量的计算、计算几个数的平均数、根据平均数求参数
【分析】由题干中的比例,根据平均数的计算公式建立方程,可得答案.
【详解】根据题意,不妨设抽取的样本容量分别为,,,
设三条流水线的样本平均数分别为,总体样本平均数为,
则
根据样本平均数公式可得,
解得,所以流水线1的样本平均数为9.5.
【例4.5】 如表是某公司员工月收入的资料.
月收入/元
45000
18000
10000
5500
5000
3400
3300
1000
人数
1
1
1
3
6
1
11
1
能够反映该公司全体员工月收入水平的统计量是( )
A.平均数和众数 B.平均数和中位数
C.中位数和众数 D.平均数和方差
【答案】C
【难度】0.85
【知识点】计算几个数的平均数、用中位数的代表意义解决实际问题、计算几个数的中位数、计算几个数的众数
【分析】求出数据的众数和中位数,再与25名员工的收入进行比较即可.
【详解】公司共有员工1+1+1+3+6+1+11+1=25人,
该公司员工月收入的众数为3300元,在25名员工中有13人这此数据之上,
因此众数能够反映该公司全体员工月收入水平;
月收入由小到大排列,3400为第13个数,因此该公司员工月收入的中位数为3400元;
在25名员工中在此数据及以上的有13人,则中位数也能够反映该公司全体员工月收入水平,
而25名员工月收入的平均数元
受极端数据45000、18000等影响,平均数偏离多数人的收入水平,而方差是表征数据波动大小的量,
所以能够反映该公司全体员工月收入水平的统计量是中位数和众数.
故选:C
【例4.6】
已知,,…,的平均数为3,则,,…,的平均数为( )
A.5 B.7 C.17 D.25
【答案】C
【难度】0.85
【知识点】平均数的和差倍分性质
【详解】,所以,,…,的平均数为
.
【例4.7】 已知在某市委宣传部举办的中小学“红心向党”主题演讲比赛中,某选手共得9位评委的原始评分,若去掉一个最高分和一个最低分,得到7个有效评分,则这7个有效评分与9个原始评分相比,一定不变的数字特征是( )
A.中位数 B.平均数 C.方差 D.极差
【答案】A
【难度】0.65
【知识点】用方差、标准差说明数据的波动程度、计算几个数据的极差、方差、标准差、计算几个数的平均数、计算几个数的中位数
【分析】理解中位数、平均数、方差、极差的概念即可求解.
【详解】设将原始评分按从小到大排列为,
则去掉一个最高分和一个最低分后,与原始评分相比,
新的极差为,由于,所以,通常情况下极差会变小,故不一定不变;
数据波动不变(当且仅当所有的数相等)或变小,即方差不变或变小;
平均数可能发生变化;
唯一不变的是中位数,即中间的数不变.
故选:A.
题型5:频率分布直方图中的数字特征
【例5.1】 某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,
下列说法中正确的是( )
A. B.评分的众数估值为70
C.评分的第25百分位数估值为67.5 D.评分的平均数估值为76
【答案】C
【难度】0.85
【知识点】根据频率分布直方图计算众数、总体百分位数的估计、由频率分布直方图估计平均数、补全频率分布直方图
【分析】根据频率分布直方图中所有小矩形的面积之和为得到方程,求出,再根据平均数、百分位数及众数的计算规则计算可得.
【详解】由题意:,
解得,A错误,
所以平均数为,故D错误;
众数为,故B错误;
因为,第百分位数估计为,故C正确;
故选:C
【例5.2】 为进一步弘扬中华优秀传统文化,提升诗词爱好者的素养和创作水平,形成浓厚的国学和诗词学习氛围,2024年9月19日,首届“中华诗韵·风雅平凉”彦军杯诗词大赛决赛成功举行.为了解参赛者对此次活动的满意度,某研究性学习小组用问卷调查的方式随机调查了n名参赛者,该小组将收集到的参赛者满意度分值数据(满分100分)统计如下表所示:
分数
频数
5
10
20
b
35
频率
0.05
a
0.20
0.30
0.35
(1)分别求a,b,n的值,并在图中画出频率分布直方图;
(2)估计这n名参赛者满意度分值的中位数.
【答案】(1),,,作图见解析
(2)85分
【难度】0.85
【知识点】由频率分布直方图估计中位数、由频率分布直方图计算频率、频数、样本容量、总体容量、绘制频率分布直方图
【分析】(1)根据各组频率之和为1即可求得的值;结合频数、频率的关系即可求得,b的值,并作图;
(2)由频率分布直方图结合中位数的含义求值即可.
【详解】(1)由,解得,
,
.
由题表,可得每组的依次为0.005,0.010,0.020,0.030,0.035,
所以频率分布直方图如图所示:
(2)由题意,故中位数位于内,
设中位数为x,则,
由,解得,
所以估计这n名参赛者满意度分值的中位数为85分.
【例5.3】 一家品牌连锁公司旗下共有100所加盟店.公司在年底对所有加盟店本年度营销总额(单位:百万元)进行统计,制作频率分布表如下:
分组
频数
频率
10
0.1
x
0.15
20
0.2
30
y
15
0.15
5
0.05
5
0.05
合计
100
1.00
(1)请求出频率分布表中x,y的值,并画出频率分布直方图;
(2)请估计这100所加盟店去年销售总额的平均数(同一组中的数据,用该组区间的中点值作代表);
(3)为了评选本年度优秀加盟店,公司将依据营销总额制定评选标准,按照“不超过的加盟店获评优秀加盟店称号”的要求,请根据频率分布直方图,为该公司提出本年度“评选标准”建议.
【答案】(1),频率分布直方图见解析.
(2)
(3)选取本年度营销总额大于百万元的加盟店获评优秀加盟店称号.
【难度】0.85
【知识点】总体百分位数的估计、由频率分布直方图估计平均数、频率分布直方图的实际应用、绘制频率分布直方图
【分析】(1)根据频率与频数的关系,即可求解,再把频率除以组距即可画出频率分布直方图.
(2)根据平均数计算公式即可求解.
(3)根据百分位数公式即可求解.
【详解】(1),频率分布直方图如图所示,
(2),
故这100所加盟店去年销售总额的平均数为18.2.
(3)第40百分位数为,故应选取本年度营销总额大于百万元的加盟店获评优秀加盟店称号.
【例5.4】
第二届全国城市生活垃圾分类宣传周的主题为“践行新时尚分类志愿行”.某中学高三年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求,的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
【答案】(1),
(2)78分
【难度】0.85
【知识点】总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)根据频率的性质即可求解,
(2)求解80%分位数即可得解.
【详解】(1)由第1组频数的平方等于第2组、第4组频数之积,即,则;
又,解得;
(2)由于成绩在内的频率为,在内的频率为,
故80%分位数位于,设为m,则,解得;
故学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为78分.
题型6:方差与标准差的计算及应用
【例6.1】
某校在一次考试后,对两班的数学成绩进行分析.已知班有人,平均成绩为分,方差为;班有人,平均成绩为分,方差为.则两班全部名同学数学成绩的方差是( )
A. B. C. D.
【答案】C
【难度】0.85
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【详解】两班全部名同学数学成绩的平均数为,
方差.
【例6.2】 一数学学习小组有5名同学,他们的历次数学考试成绩都比较稳定,且每次测试5人成绩的方差均为6左右.某次数学测试他们中的甲同学因故没能参加考试,其余四位同学的数学成绩分别为111分,114分,117分,118分.如果甲同学参加这次考试,利用以往的经验(方差为6)估计其成绩为( )
A.112分 B.113分 C.115分 D.119分
【答案】C
【难度】0.85
【知识点】根据方差、标准差求参数、计算几个数的平均数
【分析】根据题意,设甲的分数为,求得五位同学本次考试成绩的平均数,然后再由方差的公式代入计算,即可得到结果.
【详解】设甲的分数为,
则这五位同学本次考试成绩的平均数为:,
所以这五位同学本次考试成绩的方差为:
,解得,
所以甲的分数为.
故选:C
【例6.3】
甲、乙两人6次模拟考试英语成绩(不含听力)的折线统计图如图所示,甲、乙两人成绩的平均数分别记作,标准差分别记作,则( )
A. B.
C. D.
【答案】A
【难度】0.85
【知识点】用方差、标准差说明数据的波动程度、用平均数的代表意义解决实际问题
【分析】根据折线统计图,结合均值、方差的实际含义判断及的大小.
【详解】由统计图可知甲的总成绩比乙的总成绩要高,所以,
又甲的成绩分布比乙均匀,所以,
故选:A
【例6.4】
已知数据的平均数,方差,若把剔除,则剩余这9个数的方差为 .
【答案】
【难度】0.85
【知识点】计算几个数据的方差
【分析】计算剩余这9个数的方差即可.
【详解】由数据的平均数,方差,
所以,
若把剔除,则剩余这9个数的平均数为,所以,
所以,
所以
【例6.5】
(多选)设样本数据的平均数为,方差为,设,样本数据的平均数为,方差为,则( )
A. B.
C. D.
【答案】ACD
【难度】0.65
【知识点】各数据同时乘除同一数对方差的影响、各数据同时加减同一数对方差的影响、平均数的和差倍分性质
【分析】利用均值的性质判断A,利用方差的性质判断B,再结合题意判断C,D即可.
【详解】对于A,因为,所以,化简得,故A正确,
对于B,因为,所以由方差的性质得,故B错误,
对于C,由题意得,
由均值的性质得,得到,
则,故C正确,
对于D,由方差的性质得,则,
由题意得
,故D正确.
故选:ACD
【例6.6】 (多选)在某年的中国足球超级联赛上,甲队每场比赛平均失球数是1.5,全年比赛失球个数的标准差为1.1;乙队每场比赛平均失球数是2.1,全年失球个数的标准差是0.4.下列说法中正确的是( )
A.平均说来甲队比乙队防守技术好 B.甲队比乙队技术水平更稳定
C.甲队有时表现很差,有时表现又非常好 D.乙队很少不失球
【答案】ACD
【难度】0.85
【知识点】用方差、标准差说明数据的波动程度、用平均数的代表意义解决实际问题
【分析】平均数反映数据的集中趋势,标准差反映数据的离散程度(波动大小),通过分析两队的平均失球数和失球个数的标准差来判断各选项的正确性.
【详解】对于A,由甲队每场比赛平均失球数是1.5,乙队每场比赛平均失球数是2.1,
说明甲队每场比赛平均失球数比乙队每场比赛平均失球数少,
所以平均说来甲队比乙队防守技术好,故A正确;
对于B、C,甲队全年比赛失球个数的标准差为1.1,
乙队全年失球个数的标准差是0.4,
说明甲队全年比赛失球个数的标准差较大,
所以甲队的表现时好时坏,起伏较大,故B错误,C正确;
对于D,乙队的平均失球数多,全年失球个数的标准差很小,
说明乙队的表现较稳定,经常失球,故D正确.
故选:ACD
【例6.7】
某地区甲、乙、丙三所学科基地学校的数学强基小组人数之比为,三所学校共有数学强基学生48人,在一次统一考试中,所有学生的成绩平均分为117,方差为22.5,已知甲、乙两所学校的数学强基小组学生的学均分分别为118和114,方差分别为15和21,则丙学校的学生成绩的方差是__________.
【答案】18
【难度】0.65
【知识点】根据方差、标准差求参数
【分析】计算各校人数,标记平均值和方差,确定,,计算得到答案.
【详解】甲、乙、丙三所学科基地学校的数学强基小组人数之比为,
三所学校共有数学强基学生48人,
甲校的数学强基小组人数24;
乙校的数学强基小组人数为16;
丙校的数学强基小组人数8,
把甲校的数学强基小组学生的平均分记为,方差记为;
把乙校的数学强基小组学生的平均分记为,方差记为;
把丙校的数学强基小组学生的平均分记为,方差记为;
把所有学生的平均分记为,方差记为.
根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,
可得,即,解得,
,
即,解得.
故答案为:18.
【例6.8】 某班20位女同学平均分为甲、乙两组,她们的美学鉴赏课考试成绩如下(单位:分):
甲组:65,90,85,75,65,70,75,90,95,80
乙组:85,95,75,70,85,80,85,65,90,85
(1)试分别计算两组数据的极差和方差;
(2)试根据(1)中的计算结果,判断哪一组的成绩较稳定?
【答案】(1)甲组数据的极差为30(分),方差为104;乙组数据的极差为30(分),方差为75.25
(2)乙组的成绩较稳定.
【难度】0.65
【知识点】计算几个数的平均数、用方差、标准差说明数据的波动程度、计算几个数据的极差、方差、标准差
【分析】(1)根据公式直接求极差、平均数、方差即可;
(2)根据(1)的结果可得答案.
【详解】(1)甲组最高分为95分,最低分为65分,极差为,
平均数为,
方差为
,
乙组最高分为95分,最低分为65分,极差为,
平均数为,
方差为
;
(2)由于甲乙两组极差相同,但乙组的方差小于甲组的方差,因此乙组的成绩较稳定.
(
1
)
学科网(北京)股份有限公司
$