内容正文:
20.3 数据的离散程度
第20章 数据的整理与初步处理
1.方差
新课探究
一
下表显示的是上海市 2001 年 2 月下旬和2002 年同期的每日最高气温,如何对这两段时间的气温进行比较呢?
2月21日 2月22日 2月23日 2月24日 2月25日 2月26日 2月27日 2月28日
2001年 12 13 14 22 6 8 9 12
2002年 13 13 12 9 11 16 12 10
从表中可以看出,2002 年 2 月下旬和 2001 年同期的气温相比,有 4 天的气温相对高些,有 3 天的气温相对低些,还有一天的气温相同. 我们可以由此认为 2002 年 2 月下旬的气温总体上比 2001 年同期高吗?
2月21日 2月22日 2月23日 2月24日 2月25日 2月26日 2月27日 2月28日
2001年 12 13 14 22 6 8 9 12
2002年 13 13 12 9 11 16 12 10
比较两段时间气温的高低,求平均气温是一种常用的方法.
2月21日 2月22日 2月23日 2月24日 2月25日 2月26日 2月27日 2月28日
2001年 12 13 14 22 6 8 9 12
2002年 13 13 12 9 11 16 12 10
经计算可知这两个时段的平均气温相等,都是12℃,这是不是说,两个时段的气温情况总体上没有什么差异呢?
21日
22日
23日
24日
25日
26日
27日
28日
21日
22日
23日
24日
25日
26日
27日
28日
气温(℃)
气温(℃)
(a)2001年2月下旬
(b)2002年2月下旬
观察下图,你感觉它们有没有差异呢?
通过观察,我们可以发现:图(a)中的点波动范围比较大——从6℃到22℃,图(b)中的点波动范围比较小——从9℃到16℃.
图(a)中气温的最大值与最小值之间差距很大,相差16℃;图(b)中气温的最大值与最小值相差7℃,总体上气温变化的范围不太大.
小明和小兵两人参加体育项目训练,近期的 5 次测试成绩如表所示,谁的成绩较为稳定?为什么?
测试次数 1 2 3 4 5
小明 10 14 13 12 13
小兵 11 11 15 14 11
16
14
12
10
8
6
4
2
0
1
2
3
4
5
体育项目测试成绩图
小明
小兵
从图中我们可以看到:相比之下,小明的成绩大部分集中在平均数附近,而小兵的成绩与其平均数的离散程度略大.
16
14
12
10
8
6
4
2
0
1
2
3
4
5
体育项目测试成绩图
小明
小兵
通常,如果一组数与其平均数的离散程度较小,我们就说它比较稳定.
怎样的指标能反映一组数据与其平均数的离散程度呢?
16
14
12
10
8
6
4
2
0
1
2
3
4
5
体育项目测试成绩图
小明
小兵
我们已经看出,小兵的测试成绩与平均数的偏差与小明相比略大. 那么如何加以说明呢?可以直接将各数据与平均数的差进行累加吗?
1 2 3 4 5 求和
小明 每次测试成绩 10 14 13 12 13
每次成绩 -平均成绩
小兵 每次测试成绩 11 11 15 14 11
每次成绩 -平均成绩
-2.4
1.6
0.6
-0.4
0.6
0.6
-1.4
-1.4
2.6
1.6
-1.4
0
在下表中写出你的计算结果.
1 2 3 4 5 平均
小明 每次测试成绩 10 14 13 12 13
小兵 每次测试成绩 11 11 15 14 11
(每次成绩 -平均成绩)2
5.76
2.56
0.36
0.16
0.36
1.84
(每次成绩 -平均成绩)2
1.96
1.96
6.76
2.56
1.96
3.04
如果不行,请你提出一个可行的方案,在下表中写上新的计算方案.
依据最后求和的结果可以比较两组数据围绕其平均数的波动情况吗?
如果一共进行了7次测试,小明因故缺席了2次,怎样比较谁的成绩更稳定?
1 2 3 4 5 6 7 平均
小明 每次测试成绩 10 14 13 缺席 12 缺席 13
小兵 每次测试成绩 11 11 15 14 11 14 11
(每次成绩 -平均成绩)2
5.76
2.56
0.36
0.16
0.36
1.84
(每次成绩 -平均成绩)2
1.96
1.96
6.76
2.56
1.96
2.56
1.96
2.82
我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,这个结果称为方差.
我们通常用 x1,x2,…表示各个原始数据,用
表示一组数据的平均数. 上表中,小明和小兵5次测试成绩的方差的计算式就是
x
测试次数 1 2 3 4 5
小明 10 14 13 12 13
小兵 11 11 15 14 11
计算可得:
小明 5 次测试成绩的方差为_______,
小兵 5 次测试成绩的方差为_______.
计算结果是否是小明的成绩比较稳定呢?
1.84
3.04
测试次数 1 2 3 4 5
小明 10 14 13 12 13
小兵 11 11 15 14 11
方差是用来衡量一组数据的波动大小的特征量.
方差越大,数据的波动越大;方差越小,数据的波动越小,通过比较方差的大小来判断数据的稳定性.
随堂练习
二
比较下列两组数据的方差:
A 组:0, 10, 5, 5, 5, 5, 5, 5, 5, 5;
B 组:4, 6, 3, 7, 2, 8, 1, 9, 5, 5.
解 A 组数据的方差为 5.
B 组数据的方差为 6.
课堂小结
三
方差是用来衡量一组数据的波动大小的特征量.
方差越大,数据的波动越大;方差越小,数据的波动越小,通过比较方差的大小来判断数据的稳定性.
22
课后作业
1.从课后习题中选取;
2.完成练习册本课时的习题。
Chart1
1
2
3
4
5
6
7
8
Y 值
12
13
14
22
6
8
9
12
Sheet1
X 值 Y 值
1 12
2 13
3 14
4 22
5 6
6 8
7 9
8 12
Chart1
1
2
3
4
5
6
7
8
Y 值
13
13
12
9
11
16
12
10
Sheet1
X 值 Y 值
1 13
2 13
3 12
4 9
5 11
6 16
7 12
8 10
$$