内容正文:
人教2019A版必修 第二册
第九章 统 计
9.2.2 总体百分位数的估计
教学目标
1.理解百分位数的统计含义.
2.会根据样本数据,求出第p百分位数.
3.能用频率分布表、频率分布直方图估计百分位数.
1.画频率分布直方图的步骤
复习引入
(1)求极差;
(2)决定组距和组数:
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
2.频率分布直方图的性质
(1)矩形的面积=相应组的频率
(2)各小矩形的面积之和=1.
(3)
(4)各矩形的面积之比=频率之比,
=各矩形的高度之比=频数之比.
在问题1中,频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,并由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断,接下来的问题是,如何利用这些信息,为政府决策服务呢?下面我们对此进行讨论.
复习引入
大部分
问题2: 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3
2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7
3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9
5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5
5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8
6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9
8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2
10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6
13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9
18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
首先,把100个样本数据按从小到大排序,
80%
得到第80个和81个数据分别为13.6和13.8.可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分。
把100个样本数据按从小到大排序,得到第80个和81个数据分别为13.6和13.8.
一般地,我们取这两个数的平均数(13.6+13.8)÷2=13.7
并称此数为这组数据的第80百分位数, 或80%分位数.
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.
新知探究
第p百分位数:
1.定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
常用的分位数
常用的分位数还有第25百分位数,第75百分位数.
这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等,
第1百分位数第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.
25%
第一四分位数
(下四分位数)
50%
75%
中位数
第三四分位数
(上四分位数)
中位数:相当于是第50百分位数.
有70%的同学数学测试成绩在小于或等于85分.
班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
概念辨析
不是.是指能够考取本科院校的同学占同学总数的百分比.
例2.根据下面女生的身高的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
解:把27名女生的样本数据按从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的25,50,75 百分位数为第7, 14,21项数据,分别为155.5,161,164.据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
1.下列一组数据的第25百分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0 C.4.4 D.2.5
解:把该组数据按照由小到大排列,可得:
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
由i=10×25%=2.5,
不是整数,则第3个数据3.2,是第25百分位数.
2.以下数据为参加数学竞赛决赛的15人的成绩:
78, 70, 72, 86, 88, 79, 80, 81, 94, 84, 56, 98, 83, 90 ,91.
则这15人成绩的第80百分位数是( )
A.90 B.90.5 C.91 D.91.5
解:把成绩按从小到大的顺序排列为:
56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,
因为15×80%=12,所以这15人成绩的第80百分位数是=90.5.
例3.根据下表或下图,估计月均用水量的样本数据的80%和95%分位数.
分析:统计表或统计图,与原始数据相比,它们损失了一些信息,例如由上表中可以知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
解:由表可知,月均用水量在13.2t以下的居民用户所占比例为
23%+32%+13%+9%=77%.
则 13.2+3× =14.2,
(小于80%)
(大于80%)
在16.2t以下的居民用户所占的比例为77%+9%=86%.
因此,80%分位数一定位于[13.2,16.2)内
类似地,由22.2+3× =22.95,
可以估计月均用水量的样本数据的95%分位数
约为22.95.
可以估计月均用水量的样本数据的80%分位数
约为14.2.
练习:
在本节问题中,如果要让60%的居民用户不超出标准,居民用户的月均用水量标准定为多少合适?
频率累计
60%分位数一定位于[7.2,10.2)内
设样本数据的60%分位数为x
则0.55 +(x-7.2)×0.043=0.6
解得x=
1.某市教育局为了解疫情期间网络教学学生学习情况,从该市随机抽取了1000名高中学生,对他们每天的平均学习时间进行问卷调查,根据所得信息制作了如图所示的频率分布直方图,根据此图,估计该市高中学生每天的平均学习时间的60%分位数为 小时.
2.某市“环境保护宣传”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图,但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为_______;
(2)由频率分布直方图估计志愿者年龄的95%分位数为________岁.
解:(1)设[25,30)年龄组对应小矩形的高度为h,
由(0.01+h+0.07+0.06+0.02)×5=1,解得h=0.04.
2.某市“环境保护宣传”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图,但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为_______;
(2)由频率分布直方图估计志愿者年龄的95%分位数为________岁.
(2)由图可知年龄小于40岁的频率为1-0.02×5=0.9,
∴志愿者年龄的95%分位数在[40,45)内,
∴志愿者年龄的95%分位数为
1.百分位数:组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.求一组数据的百分位数步骤:
①按照从小到大排列原始数据;
②计算i=n×p%;
③若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.由样本数据的频率分布直方图计算第p百分位数
小结:
样本数据的第p百分位数估计总体的第p百分位数
3.由样本数据的频率分布直方图计算第p百分位数
第1步:计算各组数据的频率(即计算各小长方形的面积);
第2步:确定第p百分位数在区间[a,b)内;
第3步:应用方程的思想方法,设出百分位数,解方程可得
a
b
x
$