内容正文:
沪科版-数学-八年级下册
第20章 数据的初步分析
20.4 四分位数和箱线图
20.4.1 四分位数
1
学习目标
1. 理解四分数与中位数之间的关系 .
2. 理解百分位数与四位分数的概念和表示方法,掌握求一组数据的四分位数的方法. (重点)
3. 理解四分位数在数据分析中的作用,能够利用四分位数分析一组数据的特征. (难点)
情景导入
体育老师要给班级30名同学的跳绳成绩(单位:次/min)做分层评价,想把成绩分成“优秀、良好、合格、待提升”4个等级,且每个等级的人数大致相等.
125,132,138,142,145,150,153,156,158,160,
162,165,168,170,172,175,178,180,182,185,
188,190,193,195,198,200,205,210,215,220.
按从小到大排序
1、如何精准找到这几个“分割点”,让每个等级恰好包含约7-8名同学?
2、只用平均数、中位数,能完成这种“四等分”的分层吗?
四分位数
问题1 某市举办“中华优秀传统文化知识”竞赛,来自甲、乙两个县的各 15 名选手竞赛成绩 ( 单位:分 ) 按照从低到高排序如下:
甲: 69 , 70, 70, 71, 72, 75, 78, 80, 82, 83, 87, 88, 88, 93, 97;
乙: 70 , 72, 73, 75, 77, 79, 79, 80, 80, 81, 83, 83, 85, 92, 94.
(1) 分别指出甲、乙两个县选手竞赛成绩的中位数;
(2) 中位数能否反映两个县选手成绩的分布差异?
四分位数
1
甲: 69 , 70, 70, 71, 72, 75, 78, 80, 82, 83, 87, 88, 88, 93, 97;
乙: 70 , 72, 73, 75, 77, 79, 79, 80, 80, 81, 83, 83, 85, 92, 94.
(1) 分别指出甲、乙两个县选手竞赛成绩的中位数;
(2) 中位数能否反映两个县选手成绩的分布差异?
甲、乙两个县选手竞赛成绩的中位数均为 80 .
两个县选手竞赛成绩的中位数均为 80 ,无法通过中位数来分析成绩分布差异.
甲:68 70 70 71 72 88 88 93 97 75 78 80 82 83 87
乙:70 72 73 75 77 79 79 80 80 81 83 83 85 92 94
甲、乙两个县区15名选手竞赛成绩的中位数都是80分,但是甲县区中大于80分的成绩普遍比乙县区的高,而小于80分的成绩普遍比乙县区的低.
为了进一步分析上述两组数据的分布特点,我们可以利用百分位数.
第k百分位数(k为1~100之间的整数)是将一组数据从小到大排列后,将数据分成两部分,至少有k%的数据不大于该值,且至少有(100-k)%的数据不小于值.
概念学习
第25百分位数和第75百分位数:
以甲县选手成绩为例,将数据按从小到大排列,可得69,70,70,71,72,75,78,80,82,83,87,88,88,93,97.
寻找一个数a,使不大于a分的至少占25%(15×25%=3.75),不小于a分的至少占75%(15×75%=11.25),可得第4个数71满足这一条件,因此取71作为这组数据的第25百分位数.
寻找一个数b,使不大于b分的至少占75%(15×75%=11.25),不小于b分的至少占25%(15×25%=3.75),可得第12个数88满足这一条件,因此取88作为这组数据的第75百分位数.
四分位数
概念学习
一组数据从小到大排列,第25百分位数(记作m25)、中位数(记作m50)、第75百分位数(记作m75),把这组数据等分成四部分,因此称为四分位数.
四分位数
第25百分位数
第50百分位数
第75百分位数
记为m25,称为第一四分位数(Q1)
记为m50,称为第二四分位数(Q2)
记为m75,称为第三四分位数(Q3)
前半部分数据的中位数
后半部分数据的中位数
思考1 有没有进一步分析这两个县选手成绩分布差异的方法?
中位数是一组由小到大排列的数据里 50% 位置上的数据,优点是计算简单,受极端值影响较小。但仅有中位数,还不能完整地反映数据的分布。
为此,通常还可以找出其他百分位位置上的数据(处于 p % 位置的数据称第 p 百分位数,记为 p% 分位数)。
按照定义可知,第k百分位数可能不唯一,因此按照如下方式定第k百分位数.
(1)将数据从小到大排列,记为x1,x2,..,xn.
(2)计算指数i=n×k%.
(3)若i不是整数,记j为大于i的最小整数,则第k百分位数为第j个据xj;若i是整数,则第k百分位数为第i个和第(i+1)个数据的平均数.
(3)计算下四分位数m25、上四分位数m75:
①当n为偶数时,中位数将这组数据分为数量相等的两组数据,每组有个数,m25为前个数据的中位数,m75为后个数据的中位数;
②当n为奇数时,中位数将这组数据分为数量相等的两组数据,每组有 个数,m25为前 个数据的中位数,m75为后 个数据的中位数.
n 个数据的四分位数其他计算方法:
(1)先将这组数据从小到大排列;
(2)计算 i=n×p%(p=25,50,75 分别对应下四分位数、中位数、上四分位数):
①若 i 是整数,第 i 个数和第(i+1)个数的平均数为 p% 分位数;
②若 i 不是整数,设 i0 为大于 i 的最小整数,第 i0 个数为 p%分位数.
14
例题讲解
例1 求下列各组数据的四分位数.
(1)11,10,12,19,13,11,6,4,17,9,13,17,15;
(2)11,10,12,19,13,11,6,4,17,9,13,17.
4,46,9,10,11,11,12,13,13,15,17,17,19.
解:(1)将13个数据由小到大排列,得
中位数m25=12.
13×25%=3.25,13×75%=9.75,
所以m25是第4个数10,m75是第10个数15.
因此,这组数据的四分位数分别是10,12,15.
例1 求下列各组数据的四分位数.
(1)11,10,12,19,13,11,6,4,17,9,13,17,15;
(2)11,10,12,19,13,11,6,4,17,9,13,17.
4,46,9,10,11,11,12,13,13,15,17,17.
解:(2)将12个数据由小到大排列,得
中位数m25==11.5.
12×25%=3,12×75%=9,
所以m25是第3,4个数的平均数=9.5,
m75是第9,10个数的平均数=15.
因此,这组数据的四分位数分别是9.5,11.5,15.
全品初中
思考2 将一组数据从小到大排列后,类比求中位数的方法,怎样将该组数据四等分?
中位数
整组数据
第 25 百分位数
第 75 百分位数
利用第 25 百分位数、中位数和第 75 百分位数将这组数据均分成四等份即可。
以甲县选手成绩为例,将数据从小到大排列,可得
甲: 69 , 70, 70, 71, 72, 75, 78, 80, 82, 83, 87, 88, 88, 93, 97;
第 25 百分位数:15×25% = 3.75,第 4 个数 71 满足这组数据不大于 71 分的至少占 25% 。
中位数就是第 50 百分位数,它表示不大于 80 分的至少占 50%,不小于 80 分的至少占 50% 。
延伸 根据这种方法,第 75 百分位数是多少 ?
一组数据从小到大排列,第 25 百分位数(记作m25)、中位数(记作 m50)、第 75 百分位数(记作 m75) 把所有的数据等分成四部分,因此,称为四分位数。
m25 称为第一四分位数 (Q1),
m50 称为第二四分位数(Q2),
m75 称为第三四分位数(Q3)。
其中 m25 满足小于或等于 m25 的至少占 25% ,
m75 满足小于或等于 m75 的至少占 75% 。
知识要点
典例精析
范例:数据:11,10,12,19,13,11,6,4,17,9,13,17,15(共13个),其第25百分位数为____,中位数为____,第75百分位数为_____.
10
12
15
仿例:某班15名学生的数学成绩:65,70,72,75,78,80,82,85,88,90,92,93,95,98,100,求其四分位数.
解:因为数据的个数是奇数,所以中位数m50=85.
15×25%=3.75,15×75%=11.25,得到第25百分位数m25是第4个数75,第75百分位数m75是第12个数93.
因此,这15名学生数学成绩的四分位数分别为75,85,93.
归纳总结
求 n 个数据的四分位数的方法:
(1)先将数据按照从小到大的顺序进行排列;
(2)计算这组数据的中位数,即m50;
(3)计算第一四分位数m25、第三四分位数m75:
令i=n×25%(或75%),
①若i是整数,则第一(或三)四分位数是第i和(i+1)个数的平均数;
②若i不是整数,记j为大于i的最小整数,则第一(或三)四分位数是第j个数.
4.利用四分位数来分析数据
1.四分位数的定义: .
四分位数
3.四分位数的作用:反映数据的分布.
2.如何求一组数据的四分位数.
m25 ,m50 ,m75
谢谢大家
$