内容正文:
第二十四章 数据的分析
24.3 数据的四分位数
学习目标
1.理解四分位数的概念及计算方法.
2.掌握箱线图的构成及在数据分析中的作用.
3.能够根据原始数据计算并绘制箱线图,通过解读箱线图,提升从图表中提取信息的能力.
重点:四分位数的概念及计算
难点:箱线图的构成
情景导入
问题:某银行有 A 和 B 两个理财产品经营团队.近三年,这两个团队分别负责经营 12 项理财产品,收益率(单位:%)如下:
A 4.77 3.98 6.44 4.89 2.15 3.85
3.64 3.21 3.18 2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60
4.10 4.21 4.15 4.44 3.87 3.91
如果你是一位购买理财产品的投资者,会选择哪个团队的产品?
思考:如果投资者还想进一步了解两个团队理财产品收益率大部分在什么范围,哪些范围比较集中等信息,那么产品收益率的平均数和方差还能反映出这些信息吗?
我们需要收益率更多分布信息的统计量.
探究新知
知识点1
百分位数
一组数据按从小到大的顺序排列,将数据分成100等份的每一分点处的值叫作这组数据的百分位数.
注:中位数是把一组数据分成2等份,所以中位数就是这组数据的 分位数.
50%
2.02 2.15 3.18 3.21 3.64 3.85 3.98 4.10 4.11 4.77 4.89 6.44
3.915
如图所示,把团队A的12项产品收益率按从小到大的顺序排列:
针对训练
1.八(1班)有42名同学,他们身高的百分位数如下表:
身高的百分位数/cm
5%分
位数 15%分
位数 25%分
位数 50%分
位数 60%分
位数 75%分
位数 90%分
位数 97%分
位数
153.3 157.1 162.7 166.3 169.3 171.2 175.9 180.1
如果小明同学的身高是173 cm,则下列说法正确的是( )
A.小明同学的身高最高
B.小明同学的身高最矮
C.小明同学的身高高于半数以上同学
D.小明同学的身高低于半数以上同学
C
探究新知
知识点2
四分位数
2.02 2.15 3.18 3.21 3.64 3.85 3.98 4.10 4.11 4.77 4.89 6.44
3.915
3.193
4.44
25%分位数?
75%分位数?
50%分位数
四分位数:三个节点把一组数据分成了4等份,它们依次是第一四分位数、第二四分位数、第三四分位数.
第三四分位数(Q2)
第二四分位数(Q2)
下四分位数
上四分位数
第一四分位数(Q1)
注:第一四分位数又称下四分位数,第三四分位数又称上四分位数.
探究新知
知识点2
四分位数
2.02 2.15 3.18 3.21 3.64 3.85 3.98 4.10 4.11 4.77 4.89 6.44
3.915
3.193
4.44
思考:团队 A 产品收益率的分布情况如何?
其产品收益率小于 3.195% 的项目数占总数的 25%,产品收益率小于 3.915% 的项目数占总数的50% ,产品收益率大于 4.44% 的项目数占总数的 25%. 产品收益率在 3.195% 至4.44% 之间的项目数占总数的 50%.
半数分布
典例解析
题型1
四分位数
例1已知有8个样本数据分别为4,6,8,10,12,15,21,22,则该组数据的第三四分位数为( )
A.7 B.8 C.15 D.18
D
针对训练
2.在一次数学测验中,某小组的7位同学的成绩分别为109,116,122,126,131,134,140,则这7位同学成绩的上四分位数与下四分位数的差为 .
18
第三四分位数减去第一四分位数的差,称为四分位距.
探究新知
知识点3
箱线图
为了更加直观地观察产品收益率的分布特征,我们可以用产品收益率的三个四分位数及最小值、最大值这五个数值画出箱线图.
整个箱体长度就是四分位距,体现了数据的50%所在
探究新知
知识点3
箱线图
例如:比较两个团队产品收益率的分布特征,把两个箱线图按竖直方向并列画在同一幅图中,如图所示,你有哪些发现?
两个团队产品收益率的中位数几乎相等,但团队 A 的产品收益率波动明显比团队 B 的大.
步骤:
1.按从小到大的排序;2.找出这组数据的中位数
3.找出中位数左侧和右侧的数据各自的中位数
4.利用箱线图可以刻画这组数据的大致分布.
典例解析
题型2
箱线图
例2 分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.
时刻 0∶00 2∶00 4∶00 6∶00 8∶00 10∶00 12∶00 14∶00 16∶00 18∶00 20∶00 22∶00 24∶00
甲/℃ 11 9 10 12 16 21 23 24 21 18 16 14 13
乙/℃ 13 11 12 14 15 17 19 21 20 18 17 16 15
甲地 9 10 11 12 13 14 16 16 18 21 21 23 24
乙地 11 12 13 14 15 15 16 17 17 18 19 20 21
甲地气温:最小值为 9,最大值为 24,三个四分位数分别为
Q2= 16,
乙地气温:最小值为 11,最大值为 21,三个四分位数分别为
Q2= 16,
典例解析
题型2
箱线图
例2 分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.
时刻 0∶00 2∶00 4∶00 6∶00 8∶00 10∶00 12∶00 14∶00 16∶00 18∶00 20∶00 22∶00 24∶00
甲/℃ 11 9 10 12 16 21 23 24 21 18 16 14 13
乙/℃ 13 11 12 14 15 17 19 21 20 18 17 16 15
甲地 9 10 11 12 13 14 16 16 18 21 21 23 24
乙地 11 12 13 14 15 15 16 17 17 18 19 20 21
答:甲、乙两地气温的中位数相同,但甲地气温的波动明显比乙地的大,甲地约有 25% 时刻的气温高于乙地的最高温度,约有 25% 时刻的气温低于乙地的最低温度.
针对训练
3.如图为某地区2025年5月和6月的空气质量指数(AQI)箱线图.AQI值越小,空气质量越好;AQI值超过200,说明污染严重.下列说法错误的是( )
A.该地区2025年5月AQI最高值比6月低
B.该地区2025年6月的AQI值的上四分位数超过了100
C.该地区2025年5月的AQI值的下四分位数低于50
D.从整体上看,该地区2025年5月的空气质量略好于6月
C
针对训练
4. 如图是某班学生1min跳绳次数的箱线图,从中我
们可以得到信息:
(1)该班学生1min跳绳次数最多相差 次;
(2)四分位距为 .
47
12
归纳总结
四分位数与箱线图
五数概括:最小值、下四分位数、中位数、上四分位数、最大值
应用:分析数据分布
计算步骤:排序→定位→取值
作业布置
课堂作业:P180习题24.3的勾选做在课堂作业本上;(写清页码和题号,不抄题目)
家庭作业:打印的习题,完成对应内容到课后作业本上;
(写清日期和题号,不抄题目)
$