内容正文:
3. 4四分位数与箱线图
第2课时 箱线图
第三章
数据初步分析
01
教学目标
01
02
了解四分位数和箱线图的关系;
知道箱线图可以直观反映数据分布的信息,感悟百分位数的意义,形成和发展数据观念。
情景导入
小芳 3 周岁时身高 99cm,妈妈说小芳比 75% 的同龄女孩长得高,这个说法的依据是什么?
03
新知探究
箱线图:
人们用如图所示的统计图来表示四分位数所刻画的一组数据的分布特点。水平的线从下至上依次表示最小值, (下四分位数),(中位数), (上四分位数),最大值。图中的长方形(即“箱子”)的高度等于与的差,反映了中间 数据的离散程度。这样的统计图叫作箱线图。
03
新知探究
箱线图:
意义
“箱子”越扁,说明中间的数据越集中;
“箱子”越高,说明中间的数据越分散。
说明:箱线图大多用于多组数据的比较。箱体越扁,中间的竖线(也就是常说的“须”)越短,说明数据越集中。#8.1
获取新知
某校为了制订男生跳绳项目合格成绩的衡量标准,随机抽取26名男生的1分钟跳绳测试成绩,获得以下数据(单位:个):
108,150,170,124,169,142,154,43,139,167,149,165,191,
208,259,184,120,134,96,125,130,172,168,170,174,130。
请思考下列问题,并与你的同伴交流。
(1)如果想让一半(即50%)男生的跳绳成绩能达到合格,你会选择什么数据作标准?
(2)如果想让75%男生的跳绳成绩能达到及格,你会选择什么数据作为标准?
(3)现在要制订男生跳绳成绩优秀的标准,能让25%男生的跳绳成绩达到优秀,可以选择什么数据作为标准?
把上述数据从小到大排列:
43,96,108,120,124,125,130,130,134,139,142,149,150,154,165,167,168,169,170,170,172,174,184,191,208,259。
要想让一半(即50%)男生的跳绳成绩能达到合格,我们容易想到,可以选择这组数据的中位数作为该校男生跳绳达到合格的标准。由26×50%= 13,可知上述数据从小到大排列后,中位数是第13,14个数的平均数,即152(个)
新知探究
箱线图
人们用右侧的统计图来表示四分位数所刻画的一组数据的分布特点。如图,水平的线从下至上依次表示最小值,(下四分位数),(中位数),(上四分位数),最大值。图中的大长方形(即箱体)的高度等于与的差,反映了中间50%数据的离散程度。
箱体越扁,说明中间的数据越集中;箱体越高,说明中间的数据越分散。这样的统计图叫作箱线图(box-plot)。
说明:箱线图大多用于多组数据的比较。箱体越扁,中间的竖线(也就是常说的“须”)越短,说明数据越集中。#8.1
8
典例分析
例1 观察八年级五个班学生的视力情况箱线图(如图),从图中你得到哪些信息?
箱线图
二班学生视力的中位数最小,即仅一半学生的视力在 4.2之上;
八年级五个班学生视力的上四分位数( )都为5.0,说明这五个班学生视力在 5.0以上的都占了 25%;
一班学生视力最大值和最小值的间距最大,说明这个班学生视力的差距较大;
五班学生视力的差距较小;
三班和四班箱体高度一样,说明两个班的视力中间数据差不多;
你还找到了其他信息吗?
9
03
新知讲解
例2
观察八年级五个班学生的视力情况箱线图(如图),从图中你得到哪些信息?
解:八年级五个班学生视力的上四分位数(m75)都为5.0,说明这五个班学生视力在 5.0以上的都占了 25%;二班学生视力的中位数最小,即仅一半学生的视力在 4.2之上;一班学生视力最大值和最小值的间距最大,说明这个班学生视力的差距较大,而五班学生视力的差距相对较小。
03
新知讲解
例3
科技创新是提高社会生产力和综合国力的战略支撑。根据创新评价体系,获得 A,B 两个团队 12 种同类科技产品的创新贡献率(单位:%)如下:
团队A:28.97, 22.58, 27.15, 7.87, 13.57, 19.78,
13.07, 11.87, 21.27, 13.56, 20.31, 21.51;
团队B:15.47, 19.11, 17.46, 16.58, 17.64, 20.12,
20.34, 20.83, 15.06, 14.93, 16.85, 14.28。
请评价团队A和团队B的创新水平。
一般地, 一组数据中至少有50%的数小于或等于中位数,也至少有50% 的数大于或等于中位数。中位数也叫作第50百分位数,记为m50
进一步地,将一组数据按从小到大排列,中位数把这组数据分成左右两部分,用m25和m75 分别表示左右两部分数据的中位数,那么,所有数据中,至少有25%的数小于或等于m25 (也至少有75%的数大于或等于m25),至少有 75%的数小于或等于m75 (也至少有25%的数大于或等于m75) 。m25和 m75 分别叫作第25百分位数和第75百分位数。
在一组从小到大排列的数据中,m25,m50,m75 这三个数值把所有数据分为个数相等的四个部分,这三个数叫作四分位数(quartile) 。 其中第25百分位数也称为下四分位数,第75百分位数也称为上四分位数。
归纳总结
箱线图
与直方图、条形图比较,箱线图在表示数据方面有什么特点?
箱线图可展示四分位数、最大值、最小值等,反映数据分布范围与离散程度,适合多组数据整体分布情况的比较.
14
典例分析
例2 科技创新是提高社会生产力和综合国力的战略支撑。根据创新评价体系,获得 A,B 两个团队12种同类科技产品的创新贡献率(单位:%)如下:
团队A:28.97, 22.58, 27.15, 7.87, 13.57, 19.78,
13.07, 11.87, 21.27, 13.56, 20.31, 21.51;
团队B:15.47, 19.11, 17.46, 16.58, 17.64, 20.12,
20.34, 20.83, 15.06, 14.93, 16.85, 14.28。
请评价团队A和团队B的创新水平。
箱线图
分析:可以通过分析两个团队同类科技产品的创新贡献率的集中趋势和离散程度来评价两个团队的创新水平,还可以通过箱线图对两个团队的创新水平进行直观比较。
15
03
新知讲解
例3
分析:可以通过分析两个团队同类科技产品的创新贡献率的集中趋势和离散程度来评价两个团队的创新水平,还可以通过箱线图对两个团队的创新水平进行直观比较。
解:分别计算 A,B 两个团队同类科技产品创新贡献率的平均数和方差,如表3-11。
由平均数和方差可见,团队 A 与团队 B 同类科技产品创新贡献率的平均数相近,但团队A的方差较大。总体上看,团队B的同类科技产品创新贡献率比较稳定。
03
新知讲解
例3
将两个团队的同类科技产品创新贡献率按从小到大排列:
团队A: 7.87, 11.87, 13.07, 13.56, 13.57, 19.78,
20.31, 21.27, 21.51, 22.58, 27.15, 28.97;
团队B:14.28, 14.93, 15.06, 15.47, 16.58, 16.85,
17.46, 17.64, 19.11, 20.12, 20.34, 20.83。
它们的四分位数及最小值和最大值见表3-12,箱线图如图3-7。
【做一做】
根据国家卫生健康委员会发布的《7岁以下儿童生长标准》,3岁和4岁儿童年龄别身高的部分百分位数值如下表。
3岁和4岁儿童年龄别身高的百分位数值表
单位:厘米
(1)上表中,4岁男童m25的数值为102.3厘米,其实际意义是什么?
男童中,有25%儿童的身高小于或等于102.3厘米
性别 年龄 m25 m50 m75
男童 3岁 95.1 97.5 99.9
4岁 102.3 104.9 107.5
女童 3岁 93.9 96.2 98.5
4岁 101.1 103.7 105.3
(2)女童小丽3周岁,身高98.6厘米。她至少比百分之几的同龄女童长得高?
因为3岁女童m75=98.5,而小丽身高是98.6,则比百分之七十五的同龄女童高
性别 年龄 m25 m50 m75
男童 3岁 95.1 97.5 99.9
4岁 102.3 104.9 107.5
女童 3岁 93.9 96.2 98.5
4岁 101.1 103.7 105.3
典例分析
箱线图
解:分别计算 A,B 两个团队同类科技产品创新贡献率的平均数和方差,如下表。
团队 平均数 方差
A 18.46 38.16
B 17.39 4.73
由平均数和方差可见,团队 A 与团队 B 同类科技产品创新贡献率的平均数相近,但团队A的方差较大。总体上看,团队B的同类科技产品创新贡献率比较稳定。
20
典例分析
箱线图
将两个团队的同类科技产品创新贡献率按从小到大排列:
团队A: 7.87, 11.87, 13.07, 13.56, 13.57, 19.78,
20.31, 21.27, 21.51, 22.58, 27.15, 28.97;
团队B:14.28, 14.93, 15.06, 15.47, 16.58, 16.85,
17.46, 17.64, 19.11, 20.12, 20.34, 20.83。
它们的四分位数及最小值和最大值见下表,箱线图如右图。
A,B两个团队同类科技产品创新贡献率的
四分位数及最小、最大值
团队 最小值 最大值
A 7.87 13.32 20.05 22.05 28.97
B 14.28 15.27 17.16 19.62 20.83
21
典例分析
箱线图
由箱线图可知,团队 A 的科技产品创新贡献率的中位数和最大值明显高于团队B,最小值明显比团队B低,说明团队 A 的科技产品创新贡献率波动较大,有些产品创新水平高,但有些产品创新水平低。团队 B 的科技产品创新贡献率比较稳定,所有产品都有一定的创新性。
结论:两个团队在创新贡献率方面虽有差异,但都能在科技创新方面作出贡献。
22
03
新知讲解
例3
由箱线图(图 3-7)可知,团队 A 的科技产品创新贡献率的
中位数和最大值明显高于团队B,最小值明显比团队B低,说明
团队 A 的科技产品创新贡献率波动较大,有些产品创新水平
高,但有些产品创新水平低。团队 B 的科技产品创新贡献率比
较稳定,所有产品都有一定的创新性。两个团队在创新贡献率
方面虽有差异,但都能在科技创新方面作出贡献。
03
新知探究
方法点拨
箱线图的画法
(1)找出一组数据的最小值、第一四分位数、中位数、第三四分位数和最大值,并用5 条横线分别对应这5 个数据;
(2)连接第一四分位数和第三四分位数,画出“箱体”;
(3)将最小值和最大值与“箱体”相连接,中位数在“箱体”中间.
注意:箱线图可以画成竖直的,也可以画成横向的.
例题精讲
例1 为评估七年级学生的视力情况,学校从七年级学生体检数据中 随机抽取43名学生的视力数据,具体如下:
4.2,4.1,4.7,5.2,5.0,4.7,4.4,4.9,4.7,5.1,4.5,4.3,4.5,4.8,
4.3,4.3,4.3,5.0,4.3,4.2,4.3,4.1,4.9,3.6,5.0,4.5,4.6,4.4,
5.0,4.8,4.2,4.9,4.3,4.2,5.1,5.2,5.3,5.0,5.0,5.0,5.1,5.1,5.2。
(1)求这组数据的四分位数。
解:把这43名学生的视力数据按从小到大的顺序排列如下:
3.6,4.1,4.1,4.2,4.2,4.2,4.2,4.3,4.3,4.3,4.3,4.3,4.3,4.3,4.4,4.4,
4.5,4.5,4.5,4.6,4.7,4.7,4.7,4.8,4.8,4.9,4.9,4.9,5.0,5.0,5.0,5.0,
5.0,5.0,5.0,5.1,5.1,5.1,5.1,5.2,5.2,5.2,5.3。
这组数据共有43个,按从小到大的顺序排列后,第22个数即中位 数,所以m50=4.7。
中位数左右两边各有21个数,它们的中位数分别是所有数据中的第11 个数和第33个数,所以m25=4.3,m75=5.0。
(2)尝试用四分位数评估该校七年级学生的视力情况。
该校七年级学生至少有25%,即四分之一学生的视力小于或等于m25, 在4.3及以下,属于近视。
至少有50%,即一半的学生视力小于或等于m50,在4.7及以下,有一定程度的近视。
至少有25%,即四分之一 的学生视力大于或等于m75, 在5.0及以上,视力正常。
归纳总结
箱线图
箱线图的画法:
(1)找出一组数据的最小值、第一四分位数、中位数、第三四分位数和最大值,并用5 条横线分别对应这5 个数据;
(2)连接第一四分位数和第三四分位数,画出“箱体”;
(3)将最小值和最大值与“箱体”相连接,中位数在“箱体”中间;
(4)箱线图可以画成竖直的,也可以画成横向的.
箱线图也可用相关软件绘制,感兴趣的同学可以试一试哟。
28
随堂练习
基础过关(P88)
1.一组数据的箱线图如图。这组数据的最大值是________,最小值是________,上四分位数是________,中位数是________.
200
80
170
160
02
新知导入
数据的
四分位数
百分位数
四分位数
25%分位数,50%分位数,75%分位数
一组数据按从小到大的顺序排列,将数据分成100等份的每一分点处的值叫作这组数据的百分位数
第一四分位数, 又称下四分位数
第三四分位数,又称上四分位数
$