内容正文:
第24章 数据的分析
24.3 数据的四分位数
01
02
03
了解百分位数,并借助百分位数认识四分位数.
会计算四分位数,能够画出箱线图.
了解四分位数与箱线图的关系,能够借助箱线图分析数据的分布信息.
学习目标
新课导入
问题 某银行有A和B两个理财产品经营团队. 近三年,这两个团队分别负责经营12项理财产品,收益率(单位:%)如下:
A 4.77 3.98 6.44 4.89 2.15 3.85
3.64 3.21 3.18 2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60
4.10 4.21 4.15 4.44 3.87 3.91
如果你是一位购买理财产品的投资者,会选择哪个团队的产品?
xA ≈ 3.862,
xB ≈ 3.863,
新课导入
团队 产品收益率平均数 产品收益率方差
A
B
xA ≈ 3.862,
xB ≈ 3.863,
如果你是一位购买理财产品的投资者,你会选择哪个团队的产品?
稳健型投资者可以选择团队 B 经营的理财产品.
激进型投资者可以选择团队 A 经营的理财产品.
问题 团队A负责经营12项理财产品,收益率(单位:%)如下:
4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
(1)收益率大部分在什么范围?
(2)哪些范围比较集中?
思考:平均数和方差能反映出这些信息吗?
不能反映
探索新知
问题 团队A负责经营12项理财产品,收益率(单位:%)如下:
4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
(1)收益率大部分在什么范围?
(2)哪些范围比较集中?
可以
数据的分布
思考:中位数能反映数据的分布情况吗?
探索新知
把团队A的产品收益率按从小到大的顺序排列:
2.02 2.15 3.18 3.21 3.64 3.85 3.98 4.10 4.11 4.77 4.89 6.44
一组数据按从小到大的顺序排列中位数是从中间点把数据分成2等份.
将数据分成100等份,每一分点处的值叫作这组数据的百分位数.
相比中位数,百分位数可以较全面地反映出数据的分布信息.
中位数
3.915
探索新知
把团队A的产品收益率按从小到大的顺序排列:
2.02 2.15 3.18 3.21 3.64 3.85 3.98 4.10 4.11 4.77 4.89 6.44
3.915
中位数
50%分位数
3.195
4.44
25%分位数
75%分位数
由于 3.195,3.915,4.44 这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数.
第二四分位数
Q1
Q2
Q3
第一四分位数
(下四分位数)
第三四分位数
(上四分位数)
探索新知
1. 某校18个班参加艺术节合唱比赛,通过简单随机抽样,抽得 8个班的比赛得分如下:91,90,94,87,93,96,91,85,则这组数据的 75%分位数为_______.
93.5
2.一组数据按从小到大排列为:16,25,33,39,43,m,65,70.若这组数据的下四分位数与上四分位数的和是 85,则m = _____.
29 +
= 85
47
练 习
把团队A的产品收益率按从小到大的顺序排列:
2.02 2.15 3.18 3.21 3.64 3.85 3.98 4.10 4.11 4.77 4.89 6.44
3.915
中位数
3.195
4.44
团队A:
2
3
4
5
6
7
收益率%
2.02
6.44
3.915
3.195
4.44
箱体
须线
须线
最小值
最大值
探索新知
团队B的产品收益率的四分位数:
3.18 3.40 3.60 3.67 3.84 3.87 3.91 3.99 4.10 4.15 4.21 4.44
3.89
3.635
4.125
团队B:
2
3
4
5
6
7
收益率%
探索新知
探索新知
团队A:
2
3
4
5
6
7
收益率%
团队B:
2
3
4
5
6
7
收益率%
观察箱线图,能得到A,B两个团队产品收益率的哪些信息?
分布的范围
中位数的大小
集中的范围
分布是否对称
小结:
为了更加直观地观察数据的分布特征,我们可以用数据的三个四分位数及最小值、最大值这五个数值画出箱线图.
箱体
须线
须线
最小值
最大值
第一四分位数
第三四分位数
整个箱体的长度为第三四分位数减去第一四分位数的差,称为四分位距.
探索新知
箱线图也可以按竖直方向画.为了便于比较两组数据的分布特征,可以把两个箱线图按竖直方向并列画在同一幅图中.
0
1
2
3
4
5
6
7
收益率%
A 团队
B 团队
请结合左边的箱线图,分析比较 A,B两个团队产品收益率的分布情况.
探索新知
0
1
2
3
4
5
6
7
收益率%
A 团队
B 团队
中位数:水平线段差不多高.
两个团队产品收益率的中位数几乎相等.
团队 A 的箱体和须线比团队 B 的长.
团队 A 的产品收益率波动明显比团队 B 的大
0
1
2
3
4
5
6
7
收益率%
A 团队
B 团队
中位数对应的水平线段在箱子的中间位置.
团队 B 的产品收益率分布比团队 A 的更对称
团队 A 有约 25%的产品收益率高于团队 B 的最高产品收益率
也有约 25%的产品
收益率低于团队 B 的最低产品收益率
探索新知
探索新知
与直方图、条形图比较,箱线图在表示数据方面有什么特点?
箱线图可以不受数据量影响,并排展示多组数据的分布,便于比较各组的中位数、离散程度等信息,还能直接反映数据的对称程度、集中范围.
例 根据表中的数据,分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.
解:将表中两地的气温(单位:℃)分别按从小到大的顺序排列,可得
甲地 9 10 11 12 13 14 16 16 18 21 21 23 24
乙地 11 12 13 14 15 15 16 17 17 18 19 20 21
甲/℃ 11 9 10 12 16 21 23 24 21 18 16 14 13
乙/℃ 13 11 12 14 15 17 19 21 20 18 17 16 15
Q2
甲地:Q1 = 11.5,
乙地:Q1 = 13.5.
甲地:Q3 = 21,
乙地:Q3 = 18.5.
典例精讲
在同一幅图中画出两地气温的箱线图如图所示.
0
5
10
15
20
25
30
气温/℃
甲地
乙地
可以看出,甲、乙两地气温的中位数相同,但甲地气温的波动明显比乙地的大.
甲地约有 25%时刻的气温高于乙地的最高温度,约有 25% 时刻的气温低于乙地的最低温度.
按从小到大的顺序排列的一组数据,可以按以下步骤确定其四分位数:先找出这组数据的中位数,作为这组数据的第二四分位数;然后找出中位数左侧和右侧的数据各自的中位数,分别作为这组数据的第一四分位数和第三四分位数. 利用一组数据的三个四分位数,以及最小值、最大值可以刻画这组数据的大致分布情况.
小结:
练 习
1. 某城市 9 月份空气质量指数的箱线图如图所示.
【选自教材第180页 练习 第1题】
(1)这个月空气质量指数的最大值、最小值及四分位数分别是多少?
最大值 110
最大值 30
Q1 = 40
Q2 = 50
Q3 = 80
练 习
(2)请分析这个月空气质量的特点.
最大值 110
最大值 30
空气质量指数低于 40 的天数约占总数的 25%;
空气质量指数低于 50 的天数约占总数的 50%;
空气质量指数高于 80 的天数约占总数的 25%;
空气质量指数在 40~80 之间的天数约占总数的 50%.
Q1
Q2
Q3
练 习
2. 计算第 149 页“问题 1”中每组数据的四分位数,在同一幅图中画出箱线图,据此比较两个小组的跳绳成绩特点.
甲组 182 194 143 185 156
乙组 199 148 242 170 141
解:将数据按照从小到大的顺序排列
【选自教材第180页 练习 第2题】
甲组 143 156 182 185 194
乙组 141 148 170 199 242
Q2
Q1 = 149.5
Q1 = 144.5
Q3 = 189.5
Q3 = 220.5
练 习
在同一幅图中画出两组跳绳成绩的箱线图,如图所示.
甲组的跳绳成绩比乙组的稳定.
甲组跳绳成绩的中位数大于乙组跳绳成绩的中位数.
乙组跳绳成绩的波动明显
比甲组的大.
练 习
3. 任何一组数据的四分位数,是否都恰好能把这组数据分成四等份?举例说明.
将数据平均分成四份,每份数据个数相等.
解:不能. 例如有 9 个数据从小到大排列:
1 2 3 4 5 6 7 8 9
Q2
Q1 = 2.5
Q3 = 7.5
【选自教材第180页 练习 第3题】
课堂小结
如何理解百分位数和四分位数?它们有什么区别?箱线图该怎么画?它是怎样反映数据的分布信息的?
数据
百分位数
分布信息
三个特殊的百分位数
四分位数
箱线图
图形表示
对应课时作业.
课后作业
$