内容正文:
第六章 数据的分析
6.2.2 四分位数及箱线图
学 习 目 标
1.理解四分位数的概念,掌握四分位数的计算方法。
2.理解箱线图的构成及其意义,能够绘制和解读箱线图。
3.能够通过四分位数和箱线图分析数据的分布特征。
周一 周二 周三 周四 周五 周六 周日
1
15~24℃ 2
16~21℃ 3
15~19℃ 4
14~20℃ 5
15~19℃ 6
15~19℃
7
15~22℃
14
18~24℃ 8
16~20℃ 9
14~21℃ 10
16~23℃ 11
17~19℃ 12
16~20℃ 13
16~22℃
15 16
17~27℃ 16~23℃ 17
16~25℃ 18
17~23℃ 19
17~20℃ 20
17~19℃
21
15~20℃
28
10~24℃ 22
廉
14~24℃
29
14~19℃ 23
12~25℃ 24
15~21℃ 25
17~23℃ 26
16~19℃ 27
兼 △
11~24℃
30
15~20℃ 31
16~19℃ 色块表示当日天气:
多云 晴 阴 雨
情境:如图是某地10月份, 一个月
的天气情况,请问该如何描述该地 10月份的天气分布情况?除了平均 数和中位数,还有哪些统计量可以 帮助我们分析数据?
情景导入
在百分位数中,25%分位数、50%分位数、75%分位数是三个最常用
的百分位数,它们把一组数据分为个数相等的四部分,因此分别称为下 四分位数、中位数和上四分位数,记为m₂5,m₅0,m75 , 统称四分位数。
百
m75:75% 分位数 (上四分位数)
M50:50% 分位数 (中位数)
m₂5:25% 分位数 (下四分位数)
知识梳理
分 位 数
四分位数
问 题 探 究
问题1:某市10月16 31日每日的最高气温(单位:℃)依次如下:
23,25,23,20,19,20,24,25,21,23,19,24,24,19,20,19
求这组数据的四分位数 m₂5,M₅0,m75。
解:将这16个数据由小到大排序:
19,19,19,19, ,20,20, ,23,23,24,
中位数即50%分位数,因此 (℃);
整组数据的下四分位数为
整组数据的上四分位数为
(上四分位数)
(中位数)
(下四分位数)
,24,25,25
问题探究
问题2: 老师根据问题1中数据,绘制了如图所示的统计图。 23,25,23,20,19,20,24,25,21,23,19,24,24,19,20,19
你能读懂这个统计图吗?图中出现了5条横线,分别对应5个数据,它们是
最大值
25
24 m75(上四分 位
数)
2.2 m₅0(中位数)
195 m25 (下四分位
数)
最小值
怎样的数据?你认为这个统计图是如何画出的?
19
知识梳理
如图所示的这种统计图叫作箱线图。箱线图有时也画成横图的形式。
最小值 下四分位数 中位数 上四分位数 最大值
图 1
(1)在图1的直方图中,数据的分布有什么特点?图2的箱线图是否也 反映了数据的这种特征?
(2)读取箱线图时,你可以借鉴之前学习统计图的哪些经验?
问题探究
问题3: 为反映某次全班学生1 min 跳绳次数的整体情况,小颖和小亮分别
115 132136 144 162 1min 跳绳次数
图2
画 出 了 图 1 和 图 2 。
115120125130135140145150155160165 1min 跳绳次数
图 1
(1)图1直方图中数据主要集中在130-140跳绳次数区间内,两端的数据较少, 呈现中间多、两边少的分布特征;图2的箱线图也反映了这种数据中间多、两边 少的特征;
(2)读取箱线图时,可以借鉴条形图通过长度比较数据离散程度的经验,以及 折线图观察数据分布范围和集中趋势变化的经验。
问题探究
图2
问题探究
思考:你认为箱线图在表示数据方面有什么特点?
1.能直观展示数据分布特征: 通过箱线图的箱子,可以直观地看出数据 的集中趋势(中位数)、离散程度(四分位距和全距)以及数据的偏态 性(箱子上下部分的长短)。
2.能识别异常值:箱线图能清晰地标记出异常值,超出须的范围的点即
为异常值,便于分析数据中是否存在特殊情况。
3.数据信息简洁明了: 相比于大量原始数据,箱线图用几个关键数值
(最小值、下四分位数、中位数、上四分位数、最大值)就能概括数
据的主要特征,便于不同数据集之间的比较。
(1)整体水平提升:第二次跳绳的最小值(
130>115)、中位数(153>136)、最大值(
181>162)均显著大于第一次,说明低水平、
中等水平、高水平学生的跳绳成绩都有进步;
(2)中间50%数据上移: 第二次的箱体 (m₂5
~m75 之间的距离,代表中间50%学生的成绩
范围) 从“132~144”上移到“146~160”,说 明大部分学生的跳绳成绩都有提升。
当堂检测
练一练1: 如图是同一班级学生两次1 min 跳绳成绩的箱线图。该班学生
第二次跳绳成绩有什么变化?你是如何得出结论的?
190-
181
170
160
153
150
146
144
140-
136
130
120-
-115
110
第一次跳绳 第二次跳绳
1 min跳绳次数
180
130
160-
132
162
分析箱线图数据可知:
1.平均分:八(2)班的平均得分高于八(1)班,说明八(2)班整体
成绩更好;
2.中位数:八(2)班中位数高于八(1)班,意味着八(2)班“中
间段学生”成绩更突出;
3.众数:八(2)班众数相对更高,多数学生成绩更集中于中高分
段 ;
4.离散程度: 八(1)班数据更分散,有较低的异常值拉低整体水
平;八(2)班数据更集中,成绩相对稳定;
综上,八(2)班整体成绩更优秀,且成绩分布更集中、更 稳定;八(1)班成绩两极分化较明显,存在低分拖尾现象,整
体稳定性弱于八(2)班。
当堂检测
练一练2: 下图是某次知识竞赛中,八(1)班和八(2)班每名学生的得分情况
的箱线图,则如何判断两个班的得分情况,请与同伴进行交流。
100 □八(1)班□八(2)班
90
80
70
66 064
50
40
30
20
10 ●52 051
●33
030
0
X77.18181818 78
74.25
-71
84.75
82.75
795 ×79.68181818
095
60
91
89
81
170-
最大值
160-
→ m₇5(上四分位数)
→m₅0 (中位数)
m₂5 (下四分位数)
120·
最小值
110
四分位数
箱线图
箱线图
课堂总结
150-
140-
130-
1 min跳绳次数
144
132
-162
115
$