内容正文:
20.2.2 数据的离散程度
*
1.一组数据中的最大数据与最小数据的差称为极差,即
极差=最大数据一最小数据.
2.极差反映一组数据的波动范围,用极差描述这组数据的离散程度简单明了.极差越大,数据的离散程度越大.
3.由于极差忽视了一组数据中所有数据之间的差异,仅仅由其中的最大值和最小值所确定,个别远离群体的极端值在很大程度上会影响极差,因而极差往往不能充分反映一组数据的实际离散程度.
*
下表是我国北方某城市1956年~1990年大气降水资料:
(1)上面这组数据的极差是多少?
(2)丰水年、平水年、偏枯年、特枯年的降水量与年平均降水量的差分别是多少?
在一组数据中,每个数据与平均数的差叫做这个数据的偏差.偏差可以反映一个数据偏离平均数的程度.
刻画一组数据的离散程度,除了用极差外,还有其他方式吗?
516毫米
282毫米、
39毫米、
-87毫米、
-234毫米.
类别 年平均 丰水年 平水年 偏枯年 特枯年
降水量/毫米 600 882 639 513 366
交流与发现
*
能用偏差的和表示一组数据的离散程度吗?
282 +39 +(-87 )+(-234)=0
丰水年、平水年、偏枯年、特枯年的降水量与年平均降水量的差分别是282毫米、 39毫米、 - 87毫米、 -234毫米.
这是不是偶然现象呢?
=0
设 是数据为x1、 x2、 x3、……、xn的平均数,n为数据的个数,那么
x
分别表示每个数据的偏差.
x
x1- 、
x
x2- 、
x
x3- 、……、
x
xn-
x
(x1- )+
x
(x2- )+
x
(x3- )+
……
x
+(xn- )
=(x1+x2+x3+……+xn) -n
x
(
)
n
x
x
x
x
n
x
+
+
+
+
=
L
3
2
1
1
=(x1+x2+x3+……+xn) -n·
(
)
n
x
x
x
x
n
+
+
+
+
L
3
2
1
1
*
为了刻画一组数据的离散程度,通常选用偏差的平方的平均数来描述.
由于偏差可能是正数、零、负数,在求偏差的和时,正、负数恰好相互抵消,结果为零,所以不能用偏差的和表示一组数据的离散程度.
在一组数据中,各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差(variance ) ,通常用S2 表示,即
……
2
2
2
2
+
+
+
+
n
S2=
方差越小,这组数据的离散程度越小,数据就越集中,平均数代表性就越大.
x
(x1- )
x
(x2- )
x
(x3- )
n
1
……
x
(xn- )
2
2
2
2
+
+
+
+
[
]
S2=
x
(x1- )
x
(x2- )
x
(x3- )
x
(xn- )
*
例1某足球队对运动员进行射点球成绩测试,每人每天射点球5次,在10天中,运动员大刚的进球个数分别是:
5 4 5 3 3 5 2 5 3 5
(1)求大刚进球个数的平均数;
(2)求大刚进球个数的方差.
解:(1)大刚进球个数的平均数为
(2)大刚进球个数的方差为
=1.2
(3)求大刚进球个数的标准差.
(3)大刚进球个数的标准差为
10
5
3
5
2
5
3
3
5
4
5
+
+
+
+
+
+
+
+
+
=
x
=4(个);
10
)
4
5
(
)
4
5
(
)
4
4
(
)
4
5
(
2
2
2
2
2
-
+
+
-
+
-
+
-
=
L
s
)
(
09
.
1
2
.
1
2
个
»
=
=
s
s
*
也可以采用列表的方法求大刚进球个数的方差:
1
0
1
-1
-1
1
-2
1
-1
1
1
0
1
1
4
1
1
1
1
1
数据xi 平均数 xi- (xi- )2
5 4
4 4
5 4
3 4
3 4
5 4
2 4
5 4
3 4
5 4
x
x
x
2(个2)
.
1
10
1
1
0
1
2
=
+
+
+
+
=
L
s
*
由于方差S2的单位与原始数据单位不一致,因此在实际应用中常常求出方差后,再求它的算术平方根,这个算术平方根称为这组数据的标准差,用S表示.
标准差也是表示一组数据离散程度的量.
.
)
(
)
(
)
(
2
2
2
2
1
n
x
x
x
x
x
x
s
n
-
+
-
+
-
=
L
*
a
x
n
na