内容正文:
9.2.2 总体百分位数的估计
第九章 统计
复习回顾
前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断.
接下来的问题是,如何利用这些信息,为政府决策服务呢?下面我们对此进行讨论.
新知探究
问题1 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据上节课中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
根据市政府的要求:确定居民用户月均用水量标准,要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.
(1)我们首先把100个样本数据按从小到大排序.
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 19.4 16.8 17.0 17.9 18.3 20.5 21.6 22.2 24.3 22.4 24.5 25.6 28.0
可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
(2)由数据可得,第80个和第81个数据分别为13.6和13.8.
下面我们通过样本数据对a的值进行估计.
新知探究
称此数13.7为这组数据的第80百分位数或80%分位数
(3)一般地,我们取这两个数的平均数
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.
由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问題中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.
概念生成
百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
注意:求百分位数时,一定要将数据按照从小到大的顺序排列.
概念生成
计算一组n个数据的第p百分位数步骤
我们在初中学过的中位数,相当于是第50百分位数.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为
第j项数据;
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数.
概念生成
四分位数
常见的分位数:第25百分位数,第50百分位数(中位数),第75百分位数.
这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
25%
第一四分位数
或下四分位数
50%
75%
中位数
第三四分位数
或上四分位数
第25百分位数也称为第一四分位数或下四分位数.
第75百分位数也称为第三四分位数或上四分位数.
第1百分位数,第5百分位数,第95百分位数,第99百分位数也常用.
学以致用
题型一
百分位数的概念
例1 (多选)下列表述正确的是( )
A. 第p百分位数可以有单位
B. 一个总体的四分位数有4个
C. 样本容量越大,第p百分位数估计总体就越准确
D. 班主任老师说“90%的同学能考取本科院校”,这里的90%是第90百分位数
《三维设计》P90例2
AC
学以致用
题型一
百分位数的概念
例2 (1)15%分位数的含义是( B )
A. 总体中任何一个数小于它的可能性是15%
B. 总体中任何一个数小于或等于它的可能性是15%
C. 总体中任何一个数大于它的可能性是15%
D. 总体中任何一个数大于或等于它的可能性是15%
B
(2)已知2 026个互不相同的实数,记其上四分位数为a,中位数为b,第75百分位数为c,则( C )
A. a<b<c B. b<a<c C. b<a=c D. a=c<b
C
《三维设计》P90训练1
学以致用
题型二
样本数据中的百分位数
例3 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,75,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量.
《三维设计》P90例2
将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
学以致用
题型二
样本数据中的百分位数
例4 (1)某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:421,399,445,359,415,443,367,454,368,375,392,400,423,405,412,427,414,423,430,388,430,357,434,445,451,则估计该品种小麦亩产的第80百分位数为 ,第95百分位数为 ;
438.5
451
(2)已知按从小到大顺序排列的两组数据:甲组:27,30,37,m,40,50;乙组:24,n,33,44,48,52,若这两组数据的第30百分位数、第50百分位数都分别对应相等,则 =______.
《三维设计》P91训练2
357,359,367,368,375,388,392,399,400,405,412,414,
415,421,423,423,427,430,430,434,443,445,445,451,454.
典例分析
例5 根据下列频率分布表和频率分布直方图,估计月均用水量的样本数据的80%和95%分位数.
题型三
统计图表中的百分位数
学以致用
题型二
样本数据中的百分位数
方法1 月均用水量在13.2t以下的居民用户所占比例为23%+32%+13%+9%=77%.
在16.2t以下的居民用户所占的比例为77%+9%=86%.
因此,80%分位数一定位于[13.2,16.2)内.
由13.2+3× =14.2,
类似地,由22.2+3×=22.95,
可以估计月均用水量的样本数据的95%分位数约为22.95.
例5 估计月均用水量的样本数据的80%和95%分位数.
可以估计月均用水量的样本数据的80%分位数约为14.2.
典例分析
题型三
统计图表中的百分位数
设80%分位数为m,
则0.77+(m-13.2)×0.030=0.80,即m=14.2.
同理95%分位数一定位于[22.2,25.2)内.
设95%分位数为n,
则0.94+(n-22.2)×0.013=0.95,
即n=22.97.
方法2 月均用水量在13.2t以下的居民用户所占比例为0.23+0.32+0.13+0.09=0.77.
在16.2t以下的居民用户所占的比例为0.77+0.09=0.86.
例5 估计月均用水量的样本数据的80%和95%分位数.
因此,80%分位数一定位于[13.2,16.2)内.
典例分析
题型三
统计图表中的百分位数
例6 某市政府为了节约生活用水,计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m,使得86%的居民生活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其某年的月均用水量(单位:吨),通过数据分析得到如图所
示的频率分布直方图.
(1)求a,m的值;
(2)如果我们称m为这组数据的86%分位
数,那么这组数据的50%分位数是多少?
《三维设计》P91例3
变式 计算月均用水量的20%分位数.
典例分析
题型三
统计图表中的百分位数
例7 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的
第50百分位数和第75百分位数吗?
《三维设计》P91训练3
课堂小结
①按从小到大排列原始数据.
②计算i=n×p%.
③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数.
2.用原始数据求百分位数
3.用频率分布表、频率分布直方图估算百分位数
1.百分位数定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
$