内容正文:
20.4 四分位数和箱线图
第一课时 四分位数
第二十章 数据的初步分析
沪科版 · 新教材 · 八年级下册
学 习 目 标
1
2
3
用数学眼光观察:能从实际用水、成绩、薪资等生活统计情境中,发现单组数据分布不均匀的问题,感知中位数单一指标无法完整刻画数据分布,直观认识四分位数的现实意义。
用数学思维思考:类比中位数的排序、定位求解方法,推理归纳第 25、50、75 百分位数(四分位数)的计算规则;能区分数据总数奇偶时四分位数的不同取法,建立分位数定位逻辑。
用数学语言表达:规范说出、、的统计含义;准确书写四分位数计算步骤,能口述箱线图五个关键点(最小值、、中位数、、最大值)的意义。
知识回顾
数据的初步分析
平均数
中位数
众数
离差平方和
方差
加权平均数
数据平均水平特征数
数据稳定性特征数
刻画一组数据集中趋势的统计量
3
知识回顾
1. 什么是中位数?
将一组数据从小到大(或从大到小)排列后,位于中间位置的数值。
2. 计算步骤
数据个数 n 为奇数
中位数是最中间的那个数,位置为 直接取中间项。
数据个数 n 为偶数
中位数是中间两个数的平均值,即第 和( +1 )个数的平均数
中位数是位于一组由小到大排列的数据里50%位置上的数据,优点是计算简单,受极端值影响较小.
但仅有中位数,还不能完整地反映数据的分布.
新知导入
某市举办“中华优秀传统文化知识”竞赛,甲、乙两县各选派15名选手参赛。两组选手的最终成绩如下,你能直观判断出哪个县的选手表现更出色吗?
甲
69,70,70,71,72,75,78,80,82,83,87,88,88,93,97
乙
70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
中位数相同
考虑把数据分成四等份,看更细致分布
——四分位数
探究新知
探究点1
百分位数与四分位数定义
议一议
某市举办“中华优秀传统文化知识”竞赛,来自甲、乙两个县的各15名选手竞赛成绩(单位:分)按照从低到高排序如下:
(1)分别指出甲、乙两个县选手竞赛成绩的中位数;
中位数
甲:69,70,70,71,72,75,78,80,82,83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
∴甲县选手竞赛成绩的中位数是80.
乙县选手竞赛成绩的中位数是80.
∵每个队都是15名选手,
∴n=15为奇数,中位数为第8个数。
探究新知
探究点1
百分位数与四分位数定义
议一议
某市举办“中华优秀传统文化知识”竞赛,来自甲、乙两个县的各15名选手竞赛成绩(单位:分)按照从低到高排序如下:
甲:69,70,70,71,72,75,78,80,82,83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
(2)如何进一步分析这两个县选手成绩的平均水平?
比较平均数
从平均水平来看,两个县选手水平相当.
探究新知
探究点1
百分位数与四分位数定义
议一议
某市举办“中华优秀传统文化知识”竞赛,来自甲、乙两个县的各15名选手竞赛成绩(单位:分)按照从低到高排序如下:
甲:69,70,70,71,72,75,78,80,82,83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
(3)中位数和平均数能否反映两个县选手成绩的差异?
但看不清差距,不能反映两个县选手成绩的分布差异.
平均数也接近,中位数都是 80 分,说明整体水平相当,
(4)两个县各自选手成绩大于80 分的情况如何? 小于80 分的呢?
甲县选手大于80 分的成绩普遍比乙县的高,
甲县小于80 分的成绩普遍比乙县的低.
议一议
某市举办“中华优秀传统文化知识”竞赛,来自甲、乙两个县的各15名选手竞赛成绩(单位:分)按照从低到高排序如下:
甲:69,70,70,71,72,75,78,80,82,83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
探究新知
探究点1
百分位数与四分位数定义
(6)继续比较,数据需要如何再划分?
把大于80 分的成绩分为个数相等的两部分
把小于80 分的成绩分为个数相等的两部分
至少有50%的甲县(或乙县)选手的成绩不大于80 分,
至少有50%的甲县(或乙县)选手的成绩不小于80 分.
(5)如果用百分数表示,中位数能反映数据怎样的分布?
但中位数不能完整地反映数据的分布
中位数是一组由小到大排列的数据里50%位置上的数据
议一议
某市举办“中华优秀传统文化知识”竞赛,来自甲、乙两个县的各15名选手竞赛成绩(单位:分)按照从低到高排序如下:
甲:69,70,70,71,72,75,78,80,82,83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
探究新知
探究点1
百分位数与四分位数定义
(7)将一组数据从小到大排列后,类比求中位数的方法,怎样将该组数据四等分?
数据四等分
每等份的数量占整个数据的25%
位于整个数据第一个25%处的数
第百分位数
位于整个数据第二个25%处的数
第0百分位数
位于整个数据第三个25%处的数称
第百分位数
称为
称为
称为
议一议
探究新知
探究点1
百分位数与四分位数定义
69,70,70,71,72,75,78,80,82,83,87,88,88,93,97;
甲县15名选手竞赛成绩(单位:分)按照从低到高排序如下
(8)该组数据第百分位数是多少?
15×25%=3.75
找位置
要寻找一个数a,使不大于a分的至少占25%
取整
从小到大排序,第四位
第百分位数=71
定数据
从小到大排序,第四位数是71
(9)该组数据第百分位数是多少?
下结论
15×75%=11.25
从小到大排序,第12位是88
∴ 第百分位数=88
要寻找一个数a,使不小于a分的至少占75%
百分位数
归一归
探究新知
探究点1
百分位数与四分位数定义
1.百分位数的含义
(1)第百分位数表示:
一组有n个升序排列数据中,处于k%位置的数据称第k百分位数,记为
(2)第百分位数含义:
至少有n×数据≤,至少个数据≥。
2. 百分位数的确定方法
(1)将数据从小到大排列,记为x1,x2,…,xn.
(2)计算指数 i = n×k%.
(3)若 i 不是整数,记 j 为大于 i 的最小整数,则第 k百分位数为第 j 个据 xj ,若 i 是整数,则第 k 百分位数为第 i 个和第(i+1)个数据的平均数 .
探究新知
探究点1
百分位数与四分位数定义
议一议
(10)把这组数据四等分,需要哪三个百分位数?
25%、50%、75% 这三个位置的数。
乙县15名选手竞赛成绩(单位:分)按照从低到高排序如下
70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
第 25 百分位数
第一四分位数
记
第 50 百分位数
第二四分位数
记
中位数80
第 75 百分位数
第三四分位数
记
将全部数据平均分成四段,每段占 25% 数据。
75
83
百分位数
四分位数
表示
数值
合称四分位数
探究新知
探究点1
百分位数与四分位数定义
归一归
整组数据
中位数
50%
第25百分位数
第75百分位数
m25,m50,m75把这组数据分成个数相等的四部分,因此分别称为第一四分位数(Q1)、第二四分位数(Q2)和第三四分位数(Q3),统称四分位数.
记为m25()
称为第一四分位数
记为m75()
称为第三四分位数
记为m50 ()
称为第二四分位数
前半部分数据的中位数
后半部分数据的中位数
四分位数定义
14
某市举办“中华优秀传统文化知识”竞赛,来自甲、乙两个县的各15名选手竞赛成绩(单位:分)按照从低到高排序如下:
甲:69,70,70,71,72,75,78,80,82,83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,81,83,83,85,92,94.
探究新知
探究点2
四分位数计算步骤
议一议
(1)计算甲、乙两个县的各15名选手竞赛成绩的四分位数
县 m25(Q1)/分 m50(Q2)/分 m75(Q3)/分
甲
乙
71
80
88
75
80
83
(2)根据四分位数比较甲、乙两个县的各15名选手竞赛成绩
甲县至少有25%的选手成绩大于或等于88分,
乙县至少有25%的选手成绩大于或等于83分.
甲县至少有25%的选手成绩小于或等于71分,
乙县至少有 25%的选手成绩小于或等于 75 分.
探究新知
归一归
求 n 个数据的四分位数的方法:取中位数法
(1)先将这组数据从小到大排列;
(2)计算中位数即 50% 分位数m50:
①当n为偶数时,m50为第 个数和第( +1)个数的平均数;
②当n为奇数时,m50为第 个数.
(3)计算下四分位数m25、上四分位数m75:
①当n为偶数时,中位数将这组数据分为数量相等的两组数据,
每组有 个数,m25为前个数据的中位数,m75为后 个数据的中位数;
②当n为奇数时,中位数将这组数据分为数量相等的两组数据,
每组有个数,m25为前 个数据的中位数,m75为后 个数据的中位数.
探究点2
四分位数计算步骤
探究新知
探究点2
四分位数计算步骤
归一归
求 n 个数据的四分位数的方法:计算法
(1)先将这组数据从小到大排列;
(2)计算 i=n×p%
(p=25,50,75 分别对应下四分位数、中位数、上四分位数)
①若 i 是整数,第 i 个数和第(i+1)个数的平均数为 p% 分位数;
②若 i 不是整数,设 i0 为大于 i 的最小整数,第 i0 个数为 p%分位数.
公式:定位值
,位置,取单个数据
,位置与,两数平均
小技巧
探究新知
探究点3
四分位数的统计意义
议一议
(1)代表什么?
表示至少 25% 数据≤,至少 75% 数据≥;
表示至少 75% 数据≤,至少 25% 数据≥;
叫四分位距,反映中间 50% 数据的波动大小
(3)有什么意义:
m25满足小于或等于m25的至少占25%,大于或等于m25 的至少占75%;
m75满足小于或等于m75的至少占75%,大于或等于m75的至少占25%.
(2) 代表什么?
整组数据
探究新知
探究点3
四分位数的统计意义
议一议
四分位数与之前统计量对比
统计量 侧重 是否受极端值影响
平均数 整体平均水平 是
中位数() 中间位置水平 否
四分位数(、) 分段分布、中间半数波动 否
方差 全部数据波动 是
例1.求下列各组数据的四分位数.
(1)11,10,12,19,13,11,6,4,17,9,13,17,15;
解 (1)将这 13 个数据从小到大排列,得
4,6,9,10,11,11,12,13,13,15,17,17,19.
因为数据的个数是奇数,所以中位数 m50 = 12.
13×25% = 3.25,13×75% = 9.75.
第 25 百分位数 m25 是第4个数10,
第 75 百分位数 m75 是第 10 个数15.
因此,该组数据的四分位数分别为 10,12,15.
(2)11,10,12,19,13,11,6,4,17,9,13,17.
典例分析
例1.求下列各组数据的四分位数.
(1)11,10,12,19,13,11,6,4,17,9,13,17,15;
(2)11,10,12,19,13,11,6,4,17,9,13,17.
(2)将这 12 个数据从小到大排列,得
4,6,9,10,11,11,12,13,13,17,17,19.
12×50% = 6,中位数 m50 是第6,7个数的平均数 .
12×25% = 3,12×75% = 9.
第 25 百分位数 m25 是第3,4个数的平均数 ,
第 75 百分位数 m75 是第 9,10 个数的平均数 .
因此,该组数据的四分位数分别为9.5,11.5,15.
典例分析
典例分析
例2.某小组8名同学的数学测试成绩如下:85,92,78,95,88,85,90,98.
(1)求这组数据的平均数、中位数和众数;
(2)求这组数据的第一四分位数(Q1)、第三四分位数(Q3).
解:(1) 将数据按从小到大的顺序排列:
78,85,85,88,90,92,95,98.
平均数:
(78+85+85+88+90+92+95+98)÷8
=88.875.
中位数: = 89.
众数: 85.
(2)第一四分位数相当于是前半部分数据的中位数,
前半部分数据为:78,85,85,88.
∴.Q1==85.
2第三四分位数相当于是后半部分数据的中位数,
后半部分数据为: 90,92,95,98
∴.Q3==93.5.
新知巩固
1. 求下列各组数据的四分位数:
(1)75,85,87,95,99,100,101,105,113,115,125;
(2)96,104,112,138,93,96,107,92,93,95,100,100,96,118,115,118.
教材P155页
解 (1)将这 11 个数据从小到大排列,得
75,85,87,95,99,100,101,105,113,115,125;
∵数据的个数是奇数,∴中位数 m50 = 100.
11×25% = 2.75,11×75% = 8.25.
第 25 百分位数 m25 是第 3 个数87,
第 75 百分位数 m75 是第 9个数113.
∴,该组数据的四分位数分别为87,100,113.
新知巩固
1. 求下列各组数据的四分位数:
(1)75,85,87,95,99,100,101,105,113,115,125;
(2)96,104,112,138,93,96,107,92,93,95,100,100,96,118,115,118.
教材P155页
解:(2)将这 16 个数据从小到大排列,得:
92,93,93,95,96,96,96,100,100,104,107,112,115,118,118,138.
16×50% = 8,中位数 m50 是第8、9个数的平均数=100.
16×25% = 4,16×75% = 12.
第 25 百分位数 m25 是第4、5个数的平均数=95.5 ,
第 75 百分位数 m75 是第 12、13 个数的平均数=113.5 .
因此,该组数据的四分位数分别为:95.5,100,113.5.
新知巩固
教材P155页
2. 求 20.2 节问题2中该公司 25 名员工年薪的四分位数.
年薪/万元 18 15 14 12 9 7 6 5.5 5
员工人数 2 1 3 2 1 6 5 4 1
5,5.5,5.5,5.5,5.5,6,6,6,6,6,7,7,7,7,7,7,9,12,12,14,14,14,15,18,18.
解:∵2 + 1 + 3 + 2 + 1 + 6 + 5 + 4 + 1 = 25
∴将上面的25个数据从小到大排列
因为数据的个数是奇数,所以中位数 m50 = 7.
25×25% = 6.25,25×75% = 18.75.
第 25 百分位数 m25 是第7个数6,第 75 百分位数 m75 是第19个数12.
因此,该组数据的四分位数分别为6,7,12.
拓展提升
1.某社区调查了12户家庭的家庭成员人数,记录如下(未排序):
3,2,5,4,2,3,6,4,3,2,4,5
(1)计算第一四分位数、中位数和第三四分位数;
(2)这组数据的分布是否对称?结合四分位数简要说明.
解:(1)将这12个数据由小到大排列:
2,2,2,3,3,3,4,4,4,5,5,6.
中位数即第50百分位数,∴m50==3.5
前一半数据的中位数为整组数据的第一四分位数,
∴m25==2.5
后一半数据的中位数为整组数据的第三四分位数,
∴m75==4.5
(2)∵4.5-3.5=1,3.5-2.5=1,差值相等
∴说明数据分布大致对称.
2.某校开展了红色经典故事演讲比赛,其中8名同学的成绩(单位:分)分别为:85,81,82,86,82,83,92,89.关于这组数据,下列说法中正确的是( )
A.众数是92 B.中位数是84.5
C.平均数是84 D.第三四分位数是87.5
解:首先将这组数据从小到大排列得:
,数据总数n=8 .
对于A选项,∵数据中82出现次数最多,∴众数为82,A错误;
对于B选项,中位数为第 4个和第 5个数据的平均数,
即 ,B错误;
对于C选项,平均数
C错误;
对于D选项,8×75%=6 ,因此第三四分位数为第6 个和第 7个数据的平均数,
即 ,D正确.
拓展提升
D
真题感知
1.(25-26八年级下·湖南长沙·期末)第8个全国近视防控宣传教育月的主题是“有效减少近视发生,共同守护光明未来”.我校积极响应,开展视力检查.某班 20名同学视力检查数据如下表:
视力 4.3 4.4 4.5 4.6 4.9 5.0
人数 1 2 4 5 5 3
这 名同学视力检查数据的第三四分位数是( )
A.4.3 B. 4.5 C. 4.7 D. 4.9
解:∵共有n=20个数据,第三四分位数对应的位置为i=20x75%=15,i为整数,
∴第三四分位数为从小到大排列后,第15个和第16个数据的平均数。
按从小到大累计人数:视力4.3,累计1人;
视力4.4,累计1+2=3人;
视力4.5,累计3+4=7人;
视力4.6,累计7+5=12人;
视力4.9,累计12+5=17人,
D
可知第13 个到第17个数据均为4.9,
即第15、16个数据都是4.9,
∴第三四分位数为 =4.9.
真题感知
2.(25-26八年级上·河南郑州·期末)已知一组数据:76,82,88,92,93,95,则这组数据的下四分位数为_________.
82
解:将这组数据从小到大排列为:
76,82,88,92,93,95,
数据个数n=6 ,计算下四分位数的位置:
i=6×25%=1.5: ,
∵ i不是整数,将其向上取整为2,
∴这组数据的下四分位数为第2个数据82.
知 识 总 结
四分位数:、、;
将数据从小到大排列后,把数据四等分的三个分割点,分别是Q₁(下四分位数)、Q₂(中位数)、Q₃(上四分位数),对应第25、50、75百分位数,把数据划分为四个部分。
2.计算三步骤:
遵循“排序→计算位置→确定数值”的三步法。
3.关键规则:若计算出的位置是整数,取该位置和下一位置数据的平均值; 若是小数,则向上取整,取对应位置的数值。
课堂小结
方 法 总 结
课堂小结
类比迁移思想:
由中位数二等分数据,拓展到四分位数四等分数据;
分类讨论思想:
根据n×p是否整数分两种取值方案。
在计算四分位数的过程中,我们依据位置计算结果是“整数”还是“小数”,划分了两种截然不同的取值规则。这种分类讨论的方法,让我们的计算逻辑更加严谨、全面,有效避免了因情况不同而产生的结果偏差。
易 错 提 醒
课堂小结
①忘记排序: 乱序直接取数必错,这是最常见的错误!计算前必须确保数据已按从小到大排列,否则后续所有计算都会偏离正确结果。
②取整规则混淆:计算结果为小数时,要向上取整;若为整数,则取该位置和下一个位置上两个数的平均值,不能只取单个数字。
课后练习
教材P159
习题20.4
1.小李调查了本班20名同学家庭的平均每季度用水量(单位:m3),收集数据如下:
计算这20名同学家庭的平均每季度用水量的四分位数
55,42,50,48,42,35,38,39,40,51,
47,52,50,42,43,47,52,48,52,38.
解:将这 20 个数据从小到大排列,得
35, 38, 38, 39, 40, 42, 42, 42, 43, 47, 47, 48, 48, 50, 50, 51, 52, 52, 52, 55.
∵20×50%=10,
∴中位数 m50是第10,11个数的平均数 = 47.
∵20×25%=5,20×75%=15,
∴第25百分位数 m25 是第5,6个数的平均数 =41,
第75百分位数 m75 是第15,16个数的平均数 =50.5 .
∴该组数据的四分位数分别为41,47,50.5 .
感谢聆听!
$