内容正文:
20.3.1 数据的离散程度
第1课时 离差平方和与方差
第 20 章 数据的初步分析
学习目标
1. 掌握离差平方和、方差的概念与计算方法,能够进行常见与离差平方和、方差相关的计算. (重点)
2. 能够利用离差平方和、方差来简要的分析一组数据的离散程度. (难点)
3. 理解利用计算器和电子表格计算一组数据的方差的方法.
这是两名队员射击训练各 10 次的成绩,观察两幅图片,比较这两名队员成绩的稳定性.
我们常用平均数、中位数来刻画数据的“集中水平”,但在有些情况下只有“集中水平”是不够的,如评价选手的射击水平、机器的加工零件的精度、手表的日走时误差时,还需要用一新的数量来刻画一组数据的波动情况.
获取新知
知识点1:离差平方和与方差
首先比较两者的平均数:
它们的中位数也都是20.0 mm
数据是由一个标准基数+浮动值构成的,这样可以减小计算量
两组数据的集中趋势是相同的,所以无法区分,
下面就来考虑数据的离散程度
把每组零件的直径分别用散点图来表示:
直径波动较大
直径波动较小
图中过20.0与横轴平行的直线上的点表示平均数.可见机床A生产出的零件的直径中偏离这个平均数0.2mm的有6个、0.1mm的有2个;机床B生产出的零件的直径中偏离这个平均数0.2mm的有2个、0.1mm的有4个,直观上容易看出机床B比机床A生产的零件的精确度更稳定. 但如何用数量来刻画一组数据的离散程度呢?
离差平方和与方差
问题1 两台机床都生产直径为 (20 ± 0.2) mm 的零件 ,为了检验产品质量从产品中各抽出 10 个零件进行测量,结果如下 ( 单位: mm ):
如何评判哪台机床生产的零件的精度更稳定?
机床A 20.0 19.8 20.1 20.2 19.9 20.0 20.2 19.8 20.2 19.8
机床B 20.0 20.0 19.9 20.0 19.9 20.2 20.0 20.1 20.1 19.8
1
要比较零件的精度,首先要想到比较两组数据的平均值。
机床A 20.0 19.8 20.1 20.2 19.9 20.0 20.2 19.8 20.2 19.8
机床B 20.0 20.0 19.9 20.0 19.9 20.2 20.0 20.1 20.1 19.8
从平均数这个角度很难区分两台机床生产零件的精度的稳定性。
如图,将每台机床生产的10个零件的直径用散点图表示.
0 1 2 3 4 5 6 7 8 9 10
20.2
20.1
20.0
19.9
19.8
零件直径/mm
数据序号
0 1 2 3 4 5 6 7 8 9 10
20.2
20.1
20.0
19.9
19.8
零件直径/mm
数据序号
(2) 机床 B
(1) 机床 A
机床 B 比机床 A 生产的零件的精度更稳定.
统计学中,常用方差或离差平方和来衡量数据的离散程度.设一组数据是 x1,x2,…,xn,它们的平均数是 ,我们将 称为这组数据的离差平方和.可以简记为 .
将 称为这组数据的方差.
知识要点
统计学中常采用下面的做法:设一组数据x1, x2 ,… ,xn,它们的平均数是 ,我们将
称为这组数据的离差平方和,简记为 .
将
称为这组数据的方差.
统计学中,通常采用离差平方和或方差衡量数据的离散程度.
概念学习
离差平方和和方差都具有如下性质:
(1)最小值是0;
(2)数据的离散程度大,它们的值也大.
知识拓展
① 方差的作用:方差是用来衡量一组数据波动大小的重要量,反映的是数据在平均数附近波动的情况. 一般地,方差越大,该组数据的波动就越大(离散程度大);方差越小,该组数据的波动就越小(离散程度小).
② 方差的适用条件:当两组数据的平均数相等或相近时,才利用方差来判断它们的波动情况.
Administrator (A) - 老师要说明方差的出现更多的是在平均数相同或相近,不能作为区别选择的依据时,从考虑稳定性的角度出发引入了方差,所以方差的意义就是反应了数据的离散程度
离差平方和与方差都具有如下性质:
(1)最小值为 0 ;
(2)数据的离散程度大,它们的值也大.
当数据个数较多时,离差平方和的值将变得很大,而且当几组数据个数不相等时,不能用离差平方和衡量数据的离散程度,在实际操作中,我们一般选用方差来衡量数据的离散程度,而离差平方和常常会出现在回归分析等多种分析方法中.
机床A 20.0 19.8 20.1 20.2 19.9 20.0 20.2 19.8 20.2 19.8
机床B 20.0 20.0 19.9 20.0 19.9 20.2 20.0 20.1 20.1 19.8
分别计算问题 1 中离差平方和与方差来分析机床 A 和机床 B 哪台生产的零件的精度更稳定。
A 和 B 两组数据的平均数均为 20 ,于是,它们的离差平方和分别为
则方差分别为:
无论是离差平方和还是方差,我们都可以知道机床 A 生产的 10 个零件直径比机床 B 生产的 10 个零件直径波动要大,据此,我们可以评判机床 B 生产的零件精度更稳定.
练一练:如图是甲、乙两射击运动员的 10 次射击训练成绩的折线统计图.观察图形,甲、乙这 10 次射击成绩的离差平方和哪个大?
【答】乙的射击成绩波动大,所以乙的离差平方和大.
下面通过计算离差平方和与方差,来分析机床A和机床B哪台生产的零件的精确度更稳定. 前面已经算得A,B两组数的平均数都是20,于是它们的离差平方和分别为
[ ]
=
(20 -20)2
+ ···
+(19.8-20)2
+(19.8-20)2
=0.26.
[ ]
=
(20 -20)2
+ ···
+(20-20)2
+(19.8-20)2
=0.12.
方差分别为
=
1
10
×0.26
=0.026.
=
1
10
×0.12
=0.012.
由于0.26>0.12,0.026>0.012,可知无论是根据离差平方和还是方差,都可发现机床A生产的10个零件直径比机床B生产的10个零件直径波动要大.
据此,我们可以评判机床B生产的零件精度更稳定.
用计算器计算机床A生产的零件的方差:
20.0, 19.8, 20.1, 20.2, 19.9,
20.0, 20.2, 19.8, 20.2, 19.8.
知识点2:用计算器计算方差
Administrator (A) - 授课时以实际使用的计算器为准,灵活修改按键。不同种类的计算器一般都要经过4个环节:开机—启动变量统计功能—输入数据—显示方差。
例1 小明和小兵两人参加体育项目训练,近期的五次测试成绩如下表所示.谁的成绩较为稳定?为什么?
测试次数 1 2 3 4 5
小明 10 14 13 12 13
小兵 11 11 15 14 11
典例精析
1 2 3 4 5 求平方和
小明 每次测试成绩 10 14 13 12 13
(每次成绩-
平均成绩)2 5.76 2.56 0.36 0.16 0.36 9.2
小兵 每次测试成绩 11 11 15 14 11
(每次成绩-
平均成绩)2 1.96 1.96 6.76 2.56 1.96 15.2
所以根据结果小明的成绩比较稳定.
用计算器和电子表格计算方差
机床A 20.0 19.8 20.1 20.2 19.9 20.0 20.2 19.8 20.2 19.8
机床B 20.0 20.0 19.9 20.0 19.9 20.2 20.0 20.1 20.1 19.8
以计算机床 A 生产的零件直径的方差为例,
(1) 设定 SD 模式:打开计算器后,先按键
将其设定至开始状态;
(2) 按键 (SCL) ,清除
计算器原先在 SD 模式下所储存的数据;
MODE
2
SHIFT
CLR
1
=
2
(3) 依次按键:20.0 19.8 20.2 19.9 20.0 20.2 20.2 19.8 20.1
19.8 输入数据;
(4) 按键 显示方差的算术平方根为 0.161 245 155 ;
(5) 按键 ,显示方差为 0. 026,因此,= 0.026.
DT
DT
DT
DT
DT
DT
DT
DT
DT
DT
SHIFT
=
1
S-VAR
你能用计算器计算机床 B 生产的零件直径的方差吗 ?
x2
=
用科学计算器求方差的一般步骤:
1. 按有关键, 使计算器进入统计状态;
2. 依次输入数据 x1, x2, ……, xn;
3. 按求方差的功能键(例如x2键), 计算器显示结果.
归纳总结
例题讲解
例 在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都表演了舞剧《天鹅湖》, 参加表演的女演员的身高(单位:cm)如表所示.
哪个芭蕾舞团女演员的身高更整齐?
甲 163 164 164 165 165 166 166 167
乙 163 165 165 166 166 167 168 168
解:甲、乙两团演员的身高平均数分别是
方差分别是
由s甲2 < s乙2 可知,甲芭蕾舞团女演员的身高更整齐.
甲 163 164 164 165 165 166 166 167
乙 163 165 165 166 166 167 168 168
方差的计算是本课的重点,也是难点,计算量大,一定要细心。
25
用电子表格软件计算
(1) 在电子表格软件中输入机床 A,B 的数据,如下图:
类似的操作你能得到机床 B 数据的方差吗?
课堂小结
离差平方和与方差
方差的统计学意义(判断数据的波动程度):
方差越大(小),数据的波动越大(小).
衡量一组数据的离散程度
公式:
离差平方和:
方差:
全品文教初中
谢谢大家
$