内容正文:
第六章 数据的分析
6.2.2 四分位数及箱线图
32999
1.理解四分位数的概念,掌握四分位数的计算方法。
2.理解箱线图的构成及其意义,能够绘制和解读箱线图。
3.能够通过四分位数和箱线图分析数据的分布特征。
学 习 目 标
32999
情境:如图是某地 10 月份,一个月的天气情况,请问该如何描述该地 10 月份的天气分布情况?除了平均数和中位数,还有哪些统计量可以帮助我们分析数据?
情 景 导 入
32999
在百分位数中,25 % 分位数、50 % 分位数、75 % 分位数是三个最常用的百分位数,它们把一组数据分为个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,记为 m25,m50,m75,统称四分位数。
百分位数
m75:75 % 分位数(上四分位数)
m50:50 % 分位数(中位数)
m25:25 % 分位数(下四分位数)
四分位数
知 识 梳 理
32999
问题1:某市 10 月16 — 31日每日的最高气温 (单位:℃) 依次如下:
23,25,23,20,19,20,24,25,21,23,19,24,24,19,20,19
求这组数据的四分位数 m25,m50,m75。
解:将这 16 个数据由小到大排序:
19,19,19,19,20,20,20,21,23,23,23,24,24,24,25,25
中位数即 50 % 分位数,因此 m50 = = 22 (℃);
整组数据的下四分位数为 m25 = = 19.5 (℃);
整组数据的上四分位数为 m75 = = 24 (℃);
问 题 探 究
32999
问题2:老师根据问题 1 中数据,绘制了如图所示的统计图。
23,25,23,20,19,20,24,25,21,23,19,24,24,19,20,19
你能读懂这个统计图吗? 图中出现了5 条横线,分别对应 5 个数据,它们是怎样的数据? 你认为这个统计图是如何画出的?
最小值
最大值
m25 (下四分位数)
m50 (中位数)
m75 (上四分位数)
问 题 探 究
32999
如图所示的这种统计图叫作箱线图。箱线图有时也画成横图的形式。
知 识 梳 理
32999
(1)在图 1 的直方图中,数据的分布有什么特点? 图 2 的箱线图是否也反映了数据的这种特征?
(2)读取箱线图时,你可以借鉴之前学习统计图的哪些经验?
问题3:为反映某次全班学生 1 min 跳绳次数的整体情况,小颖和小亮分别画出了图1 和图2。
图1
图2
问 题 探 究
32999
(1)图1直方图中数据主要集中在130 - 140跳绳次数区间内,两端的数据较少,呈现中间多、两边少的分布特征;图2的箱线图也反映了这种数据中间多、两边少的特征;
(2)读取箱线图时,可以借鉴条形图通过长度比较数据离散程度的经验,以及折线图观察数据分布范围和集中趋势变化的经验 。
图1
图2
问 题 探 究
32999
1.能直观展示数据分布特征:通过箱线图的箱子,可以直观地看出数据的集中趋势(中位数)、离散程度(四分位距和全距)以及数据的偏态性(箱子上下部分的长短)。
2.能识别异常值:箱线图能清晰地标记出异常值,超出须的范围的点即为异常值,便于分析数据中是否存在特殊情况。
3.数据信息简洁明了:相比于大量原始数据,箱线图用几个关键数值(最小值、下四分位数、中位数、上四分位数、最大值 )就能概括数据的主要特征,便于不同数据集之间的比较。
思考:你认为箱线图在表示数据方面有什么特点?
问 题 探 究
32999
练一练1:如图是同一班级学生两次 1 min 跳绳成绩的箱线图。该班学生第二次跳绳成绩有什么变化?你是如何得出结论的?
(1)整体水平提升:第二次跳绳的最小值(130 > 115)、中位数(153 > 136)、最大值(181 > 162)均显著大于第一次,说明低水平、中等水平、高水平学生的跳绳成绩都有进步;
(2)中间 50% 数据上移:第二次的箱体(m25 ~ m75 之间的距离,代表中间 50% 学生的成绩范围)从“132~144”上移到“146~160”,说明大部分学生的跳绳成绩都有提升。
当 堂 检 测
32999
练一练2:下图是某次知识竞赛中,八 (1) 班和八 (2) 班每名学生的得分情况的箱线图,则如何判断两个班的得分情况,请与同伴进行交流。
分析箱线图数据可知:
1. 平均分:八 (2) 班的平均得分高于八 (1) 班,说明八 (2) 班整体成绩更好;
2. 中位数:八 (2) 班中位数高于八 (1) 班,意味着八 (2) 班 “中间段学生”成绩更突出;
3. 众数:八 (2) 班众数相对更高,多数学生成绩更集中于中高分段;
4. 离散程度:八 (1) 班数据更分散,有较低的异常值拉低整体水平;八 (2) 班数据更集中,成绩相对稳定;
综上,八(2)班整体成绩更优秀,且成绩分布更集中、更稳定;八(1)班成绩两极分化较明显,存在低分拖尾现象,整体稳定性弱于八(2)班。
当 堂 检 测
32999
四分位数
箱线图
箱线图
最小值
最大值
m25 (下四分位数)
m50 (中位数)
m75 (上四分位数)
课 堂 总 结
32999
$