内容正文:
9.2.2 总体百分位数的估计
授课人:张发松 学 校:昆明市呈贡区第一中学
1
学习目标
1.通过类比中位数的定义和意义,能用自己的语言说出百分位数的一般定义,能准确解释“第p百分位数”在具体情境中的实际含义(即至少有p%比例的数据不超过它、至少有(1-p%)比例的数据不低于它).
2.给定一组原始数据,能独立完成百分位数的计算(排序→计算索引→定位取值).
3. 给定一幅频率分布直方图,能运用“面积累计法”准确估计指定的百分位数(第25、第50、第75、第80百分位数等),能阐述估计的原理和步骤.
4.通过“制定用水阶梯价格标准”等真实决策情境,理解百分位数作为一种“位置度量”在现实决策中的独特价值.
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
2
内容解析
核心问题:如何找到一个“分界值”,使不超过它的数据恰好占整体的一定比例?
第一层——从“二分”到“多分”:位置度量的推广。 中位数将数据分成前后两半:至少50%的数据不超过它,至少50%的数据不低于它。百分位数是这一思想的自然推广:第p百分位数将数据按比例分割,至少有p%的数据不超过它,至少有(100-p)%的数据不低于它。这一推广体现了数学中“从特殊到一般”的思想方法——将二分法的一般化,获得更精细的位置描述工具。
第二层——百分位数刻画了数据分布的“门槛值”。 如果说频率分布直方图给出了分布的“整体画像”,百分位数则为这幅画像标出了关键“刻度”。第10、第25、第50、第75、第90百分位数分别标记了分布的五个关键门槛——这些门槛在现实世界中对应着“低收入线”“下四分位”“中位”“上四分位”“高收入线”等具有明确政策含义的数值。百分位数的本质是在排序数据中寻找“分割点”,使分布信息由图像转化为可直接用于决策的数值。
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
3
内容解析
第三层——“至少p%”的定义蕴含着统计的“保守性”思维。 百分位数的定义中使用的是“至少”而非“恰好”,这一措辞看似技术性细节,实则蕴含深刻的统计思想:当数据量较大或存在重复值时,“恰好p%”往往无法实现,使用“至少”确保了百分位数定义的普适性和唯一性。这种处理方式体现了统计学在面对现实数据时的务实态度——不追求绝对的精确切割,而追求逻辑上站得住脚的界定,这一思维方式对学生而言是全新的,也是本节数学本质的重要一面。
百分位数是位置量数,不受极端值影响,适合描述偏态分布的位置特征,统计中分位数分层、等级划定、阈值设定的通用数学模型。百分位数是可直接用于政策制定、标准划定、等级评价、阈值管控的量化工具,是统计知识从“数据分析”走向“现实决策”的关键桥梁
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
4
问题1:体育老师统计了100名学生身高的频率分布直方图。现在,体育老师想选拔“身高位于前20%”的学生进入篮球队训练。怎么确定这个“门槛”身高?
追问1:如何理解“身高位于前20%”的学生进入篮球队训练?
就是要寻找一个数
80%
20%
【环节一】创设情境唤醒经验
问题2:如果该市政府希望使的居民用户生活用水费支出不受影响,根据节中户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
追问1:如何理解使的居民用户生活用水支出不受影响?
就是要寻找一个数,使全市居民用户月均用水量中不超过的占80%,
大于等于的占20%.
80%
20%
下面我们通过样本数据对的值进行估计.
【环节一】创设情境——唤醒经验
即:寻求一个数,使全市居民用户月均用水量中
不超过的占,大于的占.
① 把100个样本数据从小到大排序
第个 1 2 3 4 5 ... 80 81 ... 97 98 99 100
数据 1.3 1.3 1.8 2.0 2.0 ... 13.6 13.8 ... 24.3 24.5 25.6 28.0
② 得到第80和第81个数据分别是13.6和13.8
③ 取这两数的平均数
总体数据的
第百分位数约
【环节二】概念建构——本质深挖——百分位数是什么、怎么算
百分位数的定义:
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
注意:直观来说,一组数的第位百分位数指按从小到大顺序排列后,处于位置的数.
【环节二】概念建构——本质深挖——百分位数是什么、怎么算
百分位数不是单一数值计算,是数据有序排序后的比例分层阈值,双向约束保证了数据划分的公平性与严谨性.
问题3:你能概括一下求百分位数的步骤吗?
第1步:按从小到大排列原始数据.
第2步:计算.
第3步:
若不是整数,而大于i的比邻整数为,则第百分位数为第项数据;
若是整数,则第百分位数是第项与第项数据的平均数.
【环节二】概念建构——本质深挖——百分位数是什么、怎么算
例1 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
解:(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,12×50%=6,12×95%=11.4,
则第25百分位数是 ,第50百分位数是 ,
第95百分位数是第12个数据,为9.9.
【环节三】算法建模——从原始数据计算百分位数
常用的分位数还有第25百分位数,第75百分位数.
这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等,
第1百分位数、第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.
25%
第一四分位数
(下四分位数)
50%
75%
中位数
第三四分位数
(上四分位数)
中位数:相当于是第50百分位数.
【环节二】概念建构——本质深挖——百分位数是什么、怎么算
根据9.1.2节问题3中女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
女生:
例2
【环节三】算法建模——从原始数据计算百分位数
例2
解:把27名女生的样本数据从小到大排序,可得
148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0
158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0
163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0
可知样本数据的第百分位数为第项数据,分别为.
据此估计树人中学高一年级女生的第百分位数分别约为和.
【环节三】算法建模——从原始数据计算百分位数
估计树人中学高一年级女生的第25,50,75百分位数.
例3.根据下表或下图,估计月均用水量的样本数据的80%和95%分位数.
分析:统计表或统计图,与原始数据相比,它们损失了一些信息,例如由上表中可以知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.
【环节三】算法建模——从频率分布直方图估计百分位数
解:由表可知,月均用水量在13.2t以下的居民用户所占比例为
23%+32%+13%+9%=77%.
则 13.2+3× =14.2,
(小于80%)
(大于80%)
在16.2t以下的居民用户所占的比例为77%+9%=86%.
因此,80%分位数一定位于[13.2,16.2)内
类似地,由22.2+3× =22.95,
可以估计月均用水量的样本数据的95%分位数约为22.95.
可以估计月均用水量的样本数据的80%分位数 约为14.2
【环节三】算法建模——从频率分布直方图估计百分位数
线性插值
由样本数据的频率分布直方图计算第百分位数
第1步:计算各组数据的频率(即计算各小长方形的面积);
第2步:确定第百分位数所在的区间,即且;
第3步:线性插值估计:在该组内,按还需补充的频率占该组频率的比例,确定在该组区间内的对应位置.
利用面积比宽之比,则第百分位数为.
【环节三】算法建模——从频率分布直方图估计百分位数
或应用方程的思想方法,设出百分位数,解方程可得
1、某中学举行电脑知识竞赛,用简单随机抽样的方法从中抽取了部分参赛学生的成绩,进行整理后分成五组,绘制成的频率分布直方图如图所示.
估计参赛学生的成绩的分位数.
0.3
0.4
0.15
0.1
0.05
x
x-50
解:由图得,从左到右的第一、二、三、四、五小组的频率分别是.
成绩在分以下的学生所占比例为
所以分位数一定位于内.
设第百分位数为,则有
解得
所以估计参赛学生的成绩的分位数为
【环节三】算法建模——从频率分布直方图估计百分位数
本节课你学习到了什么?
(知识?方法?思想?)
【环节五】课堂小结——回顾提炼,升华认知
18
2.用原始数据求百分位数
3.用频率分布表、频率分布直方图估算百分位数
1.百分位数定义
【环节五】课堂小结——回顾提炼,升华认知
1.教材198-199页——练习2,3(作业本);
情境引入:
课后作业
2.教材第 189 页习题9.1第6、7、8 题(作业本);
感谢大家的聆听
授课人:张发松 学 校:昆明市呈贡区第一中学
21
$