内容正文:
沪科版-数学-八年级下册
第20章 数据的初步分析
20.4 四分位数和箱线图
20.4.2 箱线图
1
学习目标
1. 理解利用四分位数来绘制箱线图的步骤,感受箱线图分析数据的特点.(重点)
2. 明确箱线图的组成结构,各部分结构反映的数据的特征,能够利用箱线图对一组数据的离散程度进行分析.(难点)
3. 对比方差、箱线图等不同方式分析数据的区别,感受不同的数据处理方法对分析数据的影响.
导入新课
四分位数
25%分位数
50%分位数
75%分位数
记为m25,称为下四分位数
记为m50,称为中位数
记为m75,称为上四分位数
前半部分数据的中位数
后半部分数据的中位数
知识模块 箱线图及其应用
探究新知
某银行有A和B两个理财经营团队. 这两个理财团队分别负责经营12项理财产品,收益率(单位:%)如下:
试评价A和B两个团队的经营水平.
A:4.77 3.98 6.44 4.89 2.15 3.85
3.64 3.21 3.18 2.02 4.11 4.10
B:3.18 3.84 3.99 3.67 3.40 3.60
4.10 4.21 4.15 4.44 3.87 3.91
A:4.77,3.98,6.44,4.89,2.15,3.85,
3.64,3.21,3.18,2.02,4.11,4.10;
B:3.18,3.84,3.99,3.67,3.40,3.60,
4.10,4.21,4.15,4.44,3.87,3.91.
思考 可以从哪些角度来评价两个团队的经营水平?
平均数
方差
四分位数
我们用产品收益率的平均数和方差来进行分析:
可以看出,团队B收益率的波动较小,产品收益率的稳定性要好于团队A.
可以看出团队B的平均收益率略高,但差别不大.
仅从平均数、方差进行分析还不够全面,我们还可以从四分位数进行分析.
团队 最小值/% m25(Q1)/% m50(Q2)/% m75(Q3)/% 最大值/%
A 2.02 3.195 3.915 4.440 6.44
B 3.18 3.635 3.890 4.125 4.44
根据四分位数可知,在团队A经营的理财产品中,收益率低于3.195%的项目数占总量的25%(3项),收益率低于3.915%的项目数占总量的一半(6项),收益率高于4.440%的项目数占总量的25%(3项).类似地,也可以分析团队B经营的理财产品的收益率.
能否从四分位数分析团队B的情况?
7
思考 我们可以从哪些角度来评价两个团队的经营水平 ?
可以从平均数的角度分析
可以从方差的角度分析
可以从四分位数的角度分析
1.通过计算器或电子表格软件计算这组数据的平均数.
合作探究
A: 4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B: 3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
2.通过计算器或电子表格软件计算这组数据的方差.
可以看出团队 B 要比团队 A 经营得好一些,但仅从平均数、方差进行分析还不够全面.
3.利用四分位数来分析A 和 B 两个团队的经营水平
A: 2.02,2.15,3.18,3.21,3.64,3.85
3.98,4.10,4.11,4.77,4.89,6.44:
B: 3.18,3.40,3.60,3.67,3.84,3.87
3.91,3.99,4.10,4.15,4.21,4.44.
将 A ,B 两组数据从小到大排列,得:
请各位同学计算一下这两组数据的四分位数 。
能否将AB两组数据的最小值、第25百分位数、第50百分位数、第75百分位数和最大值更加直观地体现出来呢?
团队 最小值/% m25(Q1)/% m50(Q2)/% m75(Q3)/% 最大值/%
A 2.02 3.195 3.915 4.440 6.44
B 3.18 3.635 3.890 4.125 4.44
箱线图:箱线图是一种用来反映一组数据的整体分布情况的统计图,特别适用于多组数据的分布情况的比较,其中包含了最小值、最大值和四分位数信息。
箱线图的两种常见形式:
思考
能否将A,B两组数据的最小值、第 25 百分位数、第 50 百分位数、第 75 百分位数和最大值更加直观地体现出来呢?
统计学上,常用箱线图直观地展示一组数据的统计特征值,便于分析不同类别数据各层次水平的差异(如离散程度、分布差异等).
5
4
3
2
1
0
最小值
最大值
第一四分位数
第二四分位数(中位数)
第三四分位数
须长
4. 根据 A,B 两组数据的最小值、第 25 百分位数、第 50 百分位数、第 75 百分位数和最大值画出箱线图.
观察与思考 你能从上面画出的箱线图得出哪些信息 ?
基于四分位数或箱线图,可以发现 A 团队收益率的中位数与 B 团队的相差不大,但 A 团队的收益率明显比 B 团队的波动大.两个团队经营效益基本一样,但 B 团队的经营水平比 A 团队要平稳.
画箱线图的一般步骤:
(1)画数轴:画一条数轴,度量单位大小和数据的单位一致,起点比最小值稍小,终点比最大值稍大.
(2)画箱体:画一个长方形盒,两端边的位置分别对应数据的上、下四分位数. 在长方形盒内部的中位数位置画一条线段,表示中位数.
(3)画须线:从长方形盒两端边向外各画一条须线延伸至数据的最大值和最小值,分别在最大值和最小值处画一条线段.
(1)直观展示数据分布:箱体的长度直观呈现数据的离散程度,箱体短说明数据集中在中位数附近,离散程度小;箱体长说明数据较为分散. 观察中位数在箱体中的位置及须的长度可以判断数据分布的对称性. 若中位数大致在箱体正中间且上下须长度相近,说明数据分布较为对称;若中位数偏向箱体某一端,或某一侧须较长,说明数据分布不对称。
箱线图的特点:
团队A的产品收益率的中位数与团队B的几乎相同.
团队A的产品收益率明显比团队B的波动大.
两个团队的经营收益基本一样,但是团队B的经营水平比团队A的要平稳得多.
对于稳健型投资者,选择团队B经营的理财产品更合适,对于部分激进型投资者,也可以选择团队A经营的理财产品.
根据问题1中的甲、乙两个县各15名选手竞赛成绩的最小值、最大值和四分位数画出箱线图,并根据箱线图进行分析.
例2
甲:69,70,70,71,72,75,78,80,82,
83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,
81,83,83,85,92,94.
甲:69,70,70,71,72,75,78,80,82,
83,87,88,88,93,97;
乙:70,72,73,75,77,79,79,80,80,
81,83,83,85,92,94.
解 易求得甲、乙两个县各15名选手竞赛成绩(单位:分)的最小值、最大值和四分位数,如下表所示:
县 最小值/分 M25(Q1)/分 m50(Q2)/分 m75(Q3)/分 最大值/分
甲 69 71 80 88 97
乙 70 75 80 83 94
县 最小值/分 M25(Q1)/分 m50(Q2)/分 m75(Q3)/分 最大值/分
甲 69 71 80 88 97
乙 70 75 80 83 94
画出箱线图.
(2)便于多组数据比较:在同一图表中绘制多个箱线图时,可以很方便地比较不同组数据的分布特征,包括中位数的差异(反映中心位置的不同)、四分位数间距的大小(体现数据的离散程度),从而快速发现组间的差异和规律.
通过箱线图可以直观看出,甲、乙两个县选手成绩的中位数相同,但是甲县选手的成绩差距较大, 乙县选手的成绩差距较小,并结合甲、乙两个县选手成绩的平均数,可以说甲、乙两个县选手的平均水平相当,但是乙县选手的成绩相对于甲县选手的更集中。
课堂小结
统计学上,常用箱线图直观地展示一组数据的统计特征值,便于分析不同类别数据各层次水平的差异(如离散程度、分布差异等).
利用箱线图分析数据的特征
箱线图的结构
箱线图
利用四分位数绘制箱线图
$