内容正文:
第14章 统计
14.4.3 用频率分布直方图估计总体分布 14.4.4 百分位数
苏教版 必修第二册
【课标要求】
1.结合实例,能用频率分布直方图估计总体分布.
2.能用样本估计百分位数,理解百分位数的统计含义.
要点深化·核心知识提炼
知识点一 频率分布直方图求数字特征
1.众数是最高的矩形的底边的中点值.
2.中位数左右两侧直方图的面积相等.
3.平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.
知识点二 百分位数
1.k百分位数的定义
一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有k%的数据小于或等于pk,且至少有(100-k)%的数据大于或等于pk.
2.计算有n个数据的大样本的k百分位数的一般步骤
第1步,将所有数值按从小到大的顺序排列;
第2步,计算n·;
第3步,如果结果为整数,那么k百分位数位于第n·位和下一位数之间,通常取这两个位置上数值的平均数为k百分位数;
第4步,如果n·不是整数,那么将其向上取整(即其整数部分加上1),在该位置上的数值即为k百分位数.
3.常用的四分位数有25百分位数,50百分位数(即中位数)和75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中25百分位数称为下四分位数,75百分位数称为上四分位数.
自主诊断
判断正误.(正确的画√,错误的画×)
(1)总体分布的估计只能通过频率分布直方图实现.( )
(2)百分位数一定是样本数据中的某个值.( )
(3)在频率分布直方图中,组距越大,估计总体分布的精度越高.( )
(4)用频率分布直方图估计百分位数时,必须已知每组数据的具体数值.
( )
×
×
×
×
题型分析·能力素养提升
【题型一】用频率分布直方图估计总体分布
例1 [链接教材例10]某校为了提高学生对体育运动的兴趣,举办了一场体育知识答题比赛活动,共有1 000名学生参加了此次答题活动.为了解本次比赛的成绩,
从中抽取了100名学生的得分(得分均为整数,满分为100分)进行统计,所有学生的得分都不低于60分,将这100名学生的得分进行分组,第一组[60,70),第二组[70,80),第三组[80,90),第四组[90,100](单位:分),得到如图的频率分布直方图.
(1)求图中m的值,并估计此次竞赛活动学生得分的中位数;
(2)根据频率分布直方图,估计此次竞赛活动得分的平均值.若对得分不低于平均值的同学进行奖励,请估计参赛的学生中有多少名学生获奖.(以每组中点作为该组数据的代表)
解 (1)由频率分布直方图知,(m+0.03+0.04+0.02)×10=1,解得m=0.01,
设此次竞赛活动学生得分的中位数为x0,因数据落在[60,80)内的频率为0.4,落在[60,90)内的频率为0.8,从而可得80<x0<90,由(x0-80)×0.04=0.1,得x0=82.5,所以估计此次竞赛活动学生得分的中位数为82.5.
(2)由频率分布直方图及(1)知,数据落在[60,70),[70,80),[80,90),[90,100]的频率分别为0.1,0.3,0.4,0.2,
=65×0.1+75×0.3+85×0.4+95×0.2=82,
所以此次竞赛活动学生得分不低于82的频率为0.2+0.4=0.52,
则1 000×0.52=520,
所以估计此次竞赛活动得分的平均值为82,在参赛的1 000名学生中估计有520名学生获奖.
题后反思 利用频率分布直方图求出的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.
跟踪训练1
在某地区高一年级第一学期期末举行的一次质量检测中,某学科共有2 000人参加考试.为了解学生在本次考试中该学科的成绩情况,从中抽取了n名学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,成绩均在区间[50,100]内,按照[50,60),[60,70),[70,80),[80,90),
[90,100]的分组作出如图所示的频率分布直方图.
已知成绩落在区间[50,60)内的人数为16,则下列结
论中错误的是( )
A.m=0.016
B.n=1 000
C.估计全体学生该学科成绩的平均分约为70.6分,众数约为75
D.若成绩低于60分为不及格,估计全体学生中不及格的人数约为320
B
解析 由题意,得(m+0.030+0.040+0.010+0.004)×10=1,解得m=0.016,所以[50,60)组的频率为0.16,所以=0.16,解得n=100,故A正确,B错误; =55×0.16+65×0.30+75×0.40+85×0.10+95×0.04=70.6,众数是最高矩形的底边的中点值,即75,故C正确;不及格的频率为0.16,所以估计总体中不及格的学生人数约为0.16×2 000=320,故D正确.故选B.
【题型二】百分位数的计算
例2 [链接教材例11]从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的25,75,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,则依照这个样本的数据,请给出该公司珍珠等级的划分标准.
解 (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则25百分位数是=8.15,
75百分位数是=8.75,
95百分位数是第12个数据,为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则15百分位数是第2个数据,为7.9,即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的25百分位数是8.15 g,50百分位数为8.5 g,95百分位数是9.9 g,所以质量小于8.15 g的珍珠为次品,质量大于或等于8.15 g且小于8.5 g的珍珠为合格品,质量大于或等于8.5 g且小于9.9 g的珍珠为优等品,质量大于或等于9.9 g的珍珠为特优品.
规律方法 计算百分位数时,一是注意是多少百分位数;二是注意是否按从小到大的顺序排序;三是注意是否有相同的数据.
跟踪训练2
某中学高一年级新生有712人,其中男生326人,女生386人,现在想了解男生的身高状况,从中抽取23个样本,得到的数据如下(单位: cm):
173 174 166 172 170 166 165 168
164 173 172 173 175 168 170 172
176 175 168 173 167 170 175
问题:
(1)请估计高一年级男生的25,50,75百分位数.
(2)如果要减小估计误差,可以怎么做?
解 将样本数据由小到大排列为164,165,166,166,167,168,168,168,170,170,170,172,172,172,173,173,173,173,174,175,175,175,176.
(1)因为23×25%=5.75,所以25百分位数为第6项数据168;
因为23×50%=11.5,所以50百分位数为第12项数据172;
因为23×75%=17.25,所以75百分位数为第18项数据173.
(2)扩大抽取的样本量.
【题型三】百分位数的综合应用
例3 某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式.
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值.
(3)根据(2)中求得的数据计算用电量的75百分位数.
解 (1)当0≤x≤200时,y=0.5x;
当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;
当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为y=
(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,结合频率分布直方图可知,
解得a=0.001 5,b=0.002.
(3)设75百分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量低于400千瓦时的占80%,
所以75百分位数m在[300,400)内,
所以0.6+(m-300)×0.002=0.75,
解得m=375,即用电量的75百分位数为375千瓦时.
规律方法 由频率分布直方图求百分位数的常用方法
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)一般采用方程的思想,设出p百分位数,根据其意义列出方程并求解.
跟踪训练3
如图是根据某班学生在一次体能素质测试中的成绩画出的频率分布直方图,则该班学生成绩的80百分位数为( )
A.75 B.77.5 C.78 D.78.5
D
解析 因为(0.016+0.03+0.04)×10=0.86>0.8,所以80百分位数位于区间[70,80)内,
设其为x,则(0.016+0.03)×10+(x-70)×0.04=0.8,
解得x=78.5,所以80百分位数为78.5.故选D.
$