内容正文:
人教A版19必修第二册
9.2.2 总体百分位数的估计
第九章 统计
学习目标
1
2
3
掌握求一组数据的百分位的基本步骤
结合实例,能用样本估计百分位数,培养数学运算的核心素养
理解百分位数的统计含义,能通过样本的百分位数估计总体的百分位数,培养数据分析的核心素养.
复习回顾
前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断.
接下来的问题是,如何利用这些信息,为政府决策服务呢?下面我们对此进行讨论.
新知探究
问题1 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
根据市政府的要求:确定居民用户月均用水量标准,要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.
下面我们通过样本数据对a的值进行估计.
(1)我们首先把100个样本数据按从小到大排序.
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 19.4 16.8 17.0 17.9 18.3 20.5 21.6 22.2 24.3 22.4 24.5 25.6 28.0
可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.
(2)由数据可得,第80个和第81个数据分别为13.6和13.8.
新知探究
称此数13.7为这组数据的第80百分位数或80%分位数
(3)一般地,我们取这两个数的平均数
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右. 由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策何題中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.
概念生成
百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
注意:求百分位数时,一定要将数据按照从小到大的顺序排列.
可以通过下面的步骤计算一组n个数据的第p百分位数:
我们在初中学过的中位数,相当于是第50百分位数.
第1步:按从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据
若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数.
概念生成
四分位数
常见的分位数:第25百分位数,第50百分位数(中位数),第75百分位数.
这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
25%
第一四分位数或下四分位数
50%
75%
中位数
第三四分位数或上四分位数
第25百分位数也称为第一四分位数或下四分位数.
第75百分位数也称为第三四分位数或上四分位数.
像第1百分位数,第5百分位数,第95百分位数,第99百分位数也常用.
学以致用
教材P204
解:将100户居民的月均用水量按小到大的顺序排列如下:
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
由于100×60%=60.
∴第60百分位数为第60个和第61个数据的平均数,即
因此居民用户月均用水量标准应定为8.0合适.
1. 在居民用户月均用水量标准制定的问题中,根据教科书中的调查数据,如果要让60%的居民不超出标准,居民用户月均用水量标准定为多少合适?
典例分析
例2 根据9.1.2节问题3中27名女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
解:
把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0 172.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知
样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.
据此估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0
162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0
155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
学以致用
教材P204
解:把23名男生的样本数据按从小到大排序,结果如下:
164.0 165.0 165.0 166.0 167.0 168.0 168.0 168.0 170.0 170.0 170.0 172.0
172.0 172.0 173.0 173.0 173.0 173.0 174.0 175.0 175.0 175.0 176.0
由23×25%=5.75,23×50%=11.5,23×75%=17.25,可知样本数据的第25,50,75百分位数为第6,12,18项数据,分别为168.0,172.0,173.0.
据此可以估计树人中学高一年级男生的第25,50,75百分位数分别约为168.0,172.0,173.0.
通过增加样本量,可以减少估计的误差.
2. 根据9.1.2节问题3中男生的样本数据,请你估计树人中学高一年级男生的第25,50,75百分位数. 如果要减少估计的误差,你觉得应该怎么做?
典例分析
例3 根据下列频率分布表和频率分布直方图,估计月均用水量的样本数据的80%和95%分位数.
分析:有些情况下,我们只能获得整理好的统计表或统计图与原始数据相比,它们损失了一些信息。例如由上表中可以知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
典例分析
解:
由频率分布表可知,月均用水量在13.2t以下的居民用户所占比例为
在16.2t以下的居民用户所占比例为
∴80%分位数一定位于[13.2,16.2)内.由
可以估计月均用水量的样本数据的80%分位数约为14.2
分组 频数 频率
[1.2,4.2) 23 0.23
[4.2,7.2) 32 0.32
[7.2,10.2) 13 0.13
[10.2,13.2) 9 0.09
[13.2,16.2) 9 0.09
[16.2,19.2) 5 0.05
[19.2,22.2) 3 0.03
[22.2,25.2) 4 0.04
[25.2,28.2] 2 0.02
合计 100 1.00
类似地,由
可以估计月均用水量的样本数据的95%分位数约为22.95
典例解析
变式 根据下图估计月均用水量的样本数据的80%和95%分位数.
先算各组的频率,解题步骤如上
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
设80%分位数为m,则
0.77+(m-13.2)×0.030=0.80,解得
m=14.2.
设95%分位数为n,则
0.94+(n-22.2)×0.013=0.95,解得
n=22.97.
0.32
0.13
0.09
0.09
0.05
0.03
0.04
0.23
0.02
能力提升
题型一
百分位数的概念
例题
1. 已知15个不同数据的第25百分位数是9,则下列说法正确的是( )
A. 这15个数据中一定有4个数小于9
B. 把这15个数据从小到大排列后,9是第4个数据
C. 把这15个数据从小到大排列后,9是第4个数据和第5个数据的平均数
D. 把这15个数据从小到大排列后,9是第3个数据和第4个数据的平均数
[解析] 因为15个不同数据的第25百分位数是9,所以根据百分位数的概念可知,把这15个数据从小到大排列后,只能确定9是第4个数据,其他14个数据的值无法确定.故选B.
B
能力提升
题型一
百分位数的概念
例题
2.(多选题)已知100个数据的第55百分位数是75,则下列说法正确的是( )
A. 这100个数据中至少有55个数小于或等于75
B. 把这100个数据从小到大排列后,第55个数据是75
C. 把这100个数据从小到大排列后,第55个数据与第56个数据的平均数是75
D. 把这100个数据从小到大排列后,第55个数据与第54个数据的平均数是75
[解析] 由百分位数的概念可判断A正确;
把这100个数据从小到大排列后,第55个数据不一定是75,B错误;
把这100个数据从小到大排列后,第55个数据与第56个数据的平均数是75,C正确,D错误.故选 .
AC
方法总结
百分位数的特点
能力提升
(1)第0百分位数、第100百分位数分别是数据中最小的数、最大的数.
(2)一组数据的第 百分位数可能在这组数据中,也可能不在这组数据中.
(3)一组数据的某些百分位数可能是同一个数.
能力提升
题型二
样本数据中的百分位数
C
例题
3. 根据某地区气象局发布的气象数据,未来十天内该地区每天的最高温度(单
位: )分别为31,29,24,27,26,25,24,26,26,23,则这组数据的第4
0百分位数为( )
A. 27 B. 26.5 C. 25.5 D. 25
[解析] 先将这些数据按照从小到大进行排序,
可得23,24,24,25,26,26,26,27,29,31,
又 ,
所以该组数据的第40百分位数为排序后的第4个数和第5个数的平均数,
即 ,故选C.
能力提升
题型二
样本数据中的百分位数
A
例题
4 .“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的
指标,常用区间 内的一个数来表示,该数越接近10表示满意程度越高.
现随机抽取7位小区居民,他们的幸福感指数分别为5,6,7,8,9,5,4,
则这组数据的第60百分位数是( )
A. 7 B. 7.5 C. 8 D. 9
[解析] 将该组数据从小到大排列为4,5,5,6,7,8,9,
且 ,
所以第60百分位数是排序后的第5个数,即7.故选A.
能力提升
题型三
统计图表中的百分位数
例题
5. 为了解学生周末的学习时间(单位:小时),高一年级某班班主任对本班40名学生某周末的学习时间进行了调查,将所得数据整理绘制出如图所示的频率分布直方图.
(1)求该班学生周末的学习时间不少于20小时的人数;
[解析] 由题图可知,该班学生周末的学习时间不少于20小时的频率为
,
则该班学生周末的学习时间不少于20小时的人数为 .
能力提升
题型三
统计图表中的百分位数
[解析] 周末学习时间在5小时以下的频率为 ,
周末学习时间在10小时以下的频率为 ,
所以 分位数在区间 内,
所以 ,
则这40名学生周末学习时间的 分位数为8.75.
例题
5.(2)估计这40名学生周末学习时间的 分位数;
(3)如果用该班学生周末的学习时间作为样本去推断该校高一年级全体学生周末的学习时间,这样推断是否合理?说明理由.
[解析] 不合理,样本的选取只选在高一某班,不具有代表性.
方法总结
统计图表中的百分位数的计算
能力提升
1.找出百分位数所在的区间 .
2.设组距为 ,计算可得第 百分位数等于
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再利用比例列式求解.
课堂小结
①按从小到大排列原始数据.
②计算i=n×p%.
③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均数.
2.用原始数据求百分位数
3.用频率分布表、频率分布直方图估算百分位数
1.百分位数定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
主讲:
人教A版2019必修第二册
感谢聆听
$$