内容正文:
4.4 四分位数与箱线图
第2课时 箱线图
第4章 数据分析
导入新课
说一说
北京市 2016—2024 年全年空气质量优良天数从小到大排列如下:
198,226,227,240,271,276,286,288,290
这组数据的m₂₅、m₅₀、m₇₅分别是多少?
这组数据的最小值是多少?最大值是多少?
m₂₅=227,m₅₀=271,m₇₅=286
最小值是198,最大值是290
能不能用一张图,把这5个数都表示出来,让我们一眼就能看出数据的整体情况?
今天,我们一起来学习
——箱线图
学 习 目 标
1
2
3
理解“五数概括”(最小值、m₂₅、m₅₀、m₇₅、最大值)的概念
掌握箱线图的构成要素,能根据一组数据绘制箱线图
(重点)
能从箱线图中读取信息,比较多组数据的分布特征(难点)
新知探究
思 考
北京市 2016—2024 年全年空气质量优良天数从小到大排列如下:
198,226,227,240,271,276,286,288,290
这组数据的第一四分位数是227,第三四分位数是286.
这组数据的第一四分位数和第三四分位数有什么用处呢?
小于或等于227的数据个数与这组数据个数的比值是
大于或等于286的数据个数与这组数据个数的比值是
比值≥25%
比值≥25%
最小值
第一四分位数
第三四分位数
最大值
观察并思考:你发现小于或等于第一四分位数的数据个数与大于或等于第三四分位数的数据个数相加,所得和与这组数据的总个数的比值有什么关系?
结论:对于一组数据,将小于或等于第一四分位数的数据个数与大于或等于第三四分位数的数据个数相加,所得和与这组数据的总个数的比值大于或等于50%,
新知探究
比值≥25%
比值≥25%
最小值
第一四分位数
第三四分位数
最大值
一组数据的第三四分位数减去第一四分位数的差可以用来刻画这组数据的分散程度,第三四分位数减去第一四分位数的差越大,这组数据就越分散.
总结归纳
典例分析
例3 某工厂生产了一批某种型号的机械零件,从甲车间生产的零件中用简单随机抽样方法抽取14个零件,测得它们的质量(单位:g)如下:
257,243,249,245,253,248,256,
246,252,247,250,254,260,251.
从乙车间生产的零件中用简单随机抽样方法抽取14个零件,测得它们的质量(单位:g)如下:
249,253,241,251,243,250,246,
256,262,258,247,259,239,240.
甲车间和乙车间生产的14个零件的质量数据,哪一组比较分散?
解 将甲车间生产的14个零件的质量数据从小到大排列:
243,245,246,247,248,249,250,251,252,253,254,256,257,260.
因为×14=3.5,所以第4个数247是第一四分位数.
因为×14=10.5,所以第11个数254是第三四分位数.
于是甲车间生产的14个零件的质量数据的第三四分位数减去第一四分位数的差是254-247 =7.
将乙车间生产的14个零件的质量数据从小到大排列:
239,240,241,243,246,247,249,250,251,253,256,258,259,262.
因为×14=3.5,所以第4个数243是第一四分位数.
因为×14=10.5,所以第11个数256是第三四分位数.
于是乙车间生产的14个零件的质量数据的第三四分位数减去第一四分位数的差是256-243 =13.
又13>7,故乙车间生产的14个零件的质量数据比较分散.
典例分析
新知探究
最小值 m₂₅ m₅₀ m₇₅ 最大值
甲车间 243 247 250.5 254 260
乙车间 239 243 249.5 256 262
能不能用一张图,把这5组数据都表示出来,让我们一眼就能看出哪个车间生产的14个零件的质量数据比较分散吗?
240
244
248
252
256
260
264
零件的质量/g
甲车间
最小值
第一四分位数
中位数
第三四分位数
最大值
乙车间
最小值
第一四分位数
中位数
第三四分位数
最大值
乙车间生产的14个零件的质量数据比甲车间的质量数据分散.
乙车间的箱子更长
新知探究
240
244
248
252
256
260
264
零件的质量/g
甲车间
最小值
第一四分位数
中位数
第三四分位数
最大值
乙车间
最小值
第一四分位数
中位数
第三四分位数
最大值
像左图这样,由一组数据的最小值、第一四分位数、中位数、第三四分位数、最大值这5个数绘制而成的图是这组数据的箱线图,它是由矩形“箱子”和直线组成的图形,直观地表示了这组数据的分布状态.
新知探究
240
244
248
252
256
260
264
零件的质量/g
甲车间
最小值
第一四分位数
中位数
第三四分位数
最大值
乙车间
最小值
第一四分位数
中位数
第三四分位数
最大值
以小组为单位,小组合作完成
问题1:从箱子的长度和箱子的整体形态看,哪个车间生产的零件的质量数据更稳定?
问题2:哪个车间的“一般水平”(中位数)更高?哪个车间的“正常发挥区间”(箱子范围)的整体数据更高?
问题3:你的选择:如果你需要选择一个高产且稳定的车间,你会选泽哪个?
甲车间,箱子短,发挥更稳定
甲:250.5和乙:249.5,相差不大
乙
甲
基础巩固题
新知应用
1.判断下列说法是否正确,正确的打“✓”,错误的打“✗”。
(1) 第一四分位数就是一组数据中的最小值。 ( )
(2) 中位数也叫第二四分位数。 ( )
(3) 四分位数差可以衡量一组数据的分散程度。 ( )
(4) 如果一组数据的m₂₅ = 30,m₇₅= 50,说明中间50%的数据都在30~50之间。( )
(5) 箱线图中的“箱子”表示的是全部数据的范围。 ( )
✓
✓
✓
✗
✗
基础巩固题
新知应用
2. 从箱线图中一般不能直接读出一组数据的( )
A. 第75百分位数 B.中位数
C. 众数 D.最大值
C
3.如图是根据八年2班学生1分钟跳绳次数制作的箱线图,由图不能确定这组数据的( )
A.下四分位数 B.中位数C.最大值 D.平均数
D
基础巩固题
新知应用
4.某校为普及世界杯知识,举办了“激情世界杯·热血足球梦”知识竞赛.已知甲组和乙组人数相等,两班竞赛成绩的箱线图如图,则下列说法正确的是( )
A.乙组的中位数是80分
B.甲组成绩的上四分位数是70分
C.乙组有同学的成绩超过96分
D.乙组成绩比甲组成绩集中
D
基础巩固题
新知应用
5.小明家 2 月 17 日至 2 月 24 日每天的燃气用量(单位:m3)为
1.31,1.26,1.41,1.21,1.50,1.34,1.43,1.39;
3 月 1 日至 3 月 8 日每天的燃气用量为
1.25,1.33,1.00,1.45,1.69,1.36,1.24,1.35.
这两组数据中哪组数据比较分散?
基础巩固题
新知应用
解:将第一组数据按从小到大的顺序排列:
1.21,1.26,1.31,1.34,1.39,1.41,1.43,1.50.
因为×8=2,所以第2个数与第3个数的平均数=1.285是第一四分位数.
因为×8=6,所以第6个数与第7个数的平均数=1.42是第三四分位数.
1.42-1.285=0.135.
将第二组数据按从小到大的顺序排列:
1.00,1.24,1.25,1.33,1.35,1.36,1.45,1.69.
因为×8=2,所以第2个数与第3个数的平均数=1.245是第一四分位数.
因为×8=6,所以第6个数与第7个数的平均数=1.405是第三四分位数.
1.405-1.245=0.16.
又0.135<0.16,故3 月 1 日至 3 月 8 日每天的燃气用量比较分散.
能力提升题
新知应用
6. A 班和 B 班某次测试成绩(单位:分)如下:
A 班:70,72,74,75,76,77,78,79,80,80,80,
81,82,83,84,85,86,87,88,89,90;
B 班:40,50,55,60,62,65,68,70,72,73,74,
74,75,76,78,80,82,84,85,88,90.
(1)填写下表,并在图中画出 B 班测试成绩的箱线图.
班级 最小值 m25 m50 m75 最大值
A 70 77 80 85 90
B 40 74 90
65
80
(2)利用所学的统计知识对这两个班的成绩进行分析和评价.
能力提升题
新知应用
解:①通过箱线图可知,A班中位数显著高于B班,说明A班整体成绩更优.
② A班箱线图箱体长度短,说明A班成绩更集中.
③两个班的最高分都是90分,但B班最低分为40分,明显低于A 班的70分,说明B班存在极端低分现象.
综上所述,A班成绩整体更高且更稳定,B班成绩比较分散且存在极端低分现象.
能力提升题
新知应用
7.在某次射击训练中,甲、乙两人的成绩如图1所示,嘉琪根据图1绘制成如图2所示箱线图.
能力提升题
新知应用
(1)图1中甲的众数为________环,乙的平均数为_______环;
(2)在图2中,A反映________的成绩;(填“甲”或“乙”)
(3)图2中,直接写出A的m25和B的m75,并判断甲和乙谁的成绩比较好.
7
8
乙
A的m25为7,B的m75为8,乙的成绩比较好
课堂小结
箱线图
箱线图
四分位数差:
m₇₅ − m₂₅,反映分散程度
五数概括
min、m₂₅、m₅₀、m₇₅、max
五数的直观图形
用途:比较多组数据的分布,观察数据分散程度
感谢聆听!
$