内容正文:
5.1.2 数据的数字特征
[课标解读]1.理解集中趋势参数(平均数、中位数、众数)的统计含义.2.理解离散程度参数(标准差、方差、极差)的统计含义.3.理解百分位数的统计含义.
知识点一 最值与平均数
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
2.平均数
如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).
这一公式在数学中常简记为=i,其中的符号“∑”表示求和,读作“西格玛”,∑右边式子中的i表示求和的范围,其最小值与最大值分别写在∑的下面与上面.
求和符号∑具有以下性质:
(1)(xi+yi)=i+i;(2)(kxi)=ki;(3)=nt.
平均数会受每一个数的影响,尤其是最大值、最小值.很多情况下,为了避免过于极端的值对结果影响太大等,会去掉最小值与最大值后再计算平均数.
学生用书第38页
知识点二 中位数、百分位数、众数
1.中位数
一般地,有时也可以借助中位数来表示一组数的中心位置:如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.(注意:一组数据的中位数是唯一的.)
2.百分位数
(1)定义
一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
直观来说,一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
(2)求百分位数的步骤
为了方便,我们按如下方式确定p%分位数:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取x为p%分位数;如果i是整数,取为p%分位数.特别地,规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
(1)中位数就是一个50%分位数.
(2)按照定义可知,p%分位数可能不唯一,也正因为如此,各种统计软件所得出的p%分位数可能会有差异.
(3)实际应用中,除了中位数外,经常使用的是25%分位数(简称为第一四分位数)与75%分位数(简称为第三四分位数).
3.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.有些情形中,我们用众数来描述一组数据的中心位置.
(1)众数不唯一,可以有一个,也可以有多个,还可以没有.如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数.
(2)众数一定是原数据中的数,百分位数和中位数都不一定是原数据中的数.
知识点三 极差、方差与标准差
1.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.不难看出,极差反映了一组数的变化范围,描述了这组数的离散程度.
(1)极差反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.一般情况下,极差大,则数据较分散,数据的波动性大;极差小,则数据相对集中,数据的波动性小,极差的计算非常简单,但极差只考虑了两个极端值,而没有考虑中间的数据,因此很多时候,极差作为数据的离散程度的统计量,可靠性较差.
(2)极差的取值范围是[0,+∞).
2.方差
如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为s2=(xi-)2.
3.标准差
方差的算术平方根称为标准差.
如果一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没有离散性;若各数据的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高.因此标准差描述了数据相对于平均数的离散程度.
学生用书第39页
标准差与方差的统计意义
(1)标准差(方差)的取值范围是[0,+∞)(标准差的大小不会超过极差).
(2)标准差(方差)描述了一组数据相对于平均数离散程度的大小.可以根据不同组数据的离散程度比较标准差(方差)的大小.
知识点四 平均数、方差的计算方法总结
1.平均数的计算方法
(1)定义法:当所给数据x1,x2,…,xn比较小,又比较分散时,一般选用公式=i来计算.
(2)新数据法:当所给的一组数据都在某一常数a的附近波动时,一般选用简单化公式xi=a+xi′,其中常数a通常取接近于这组数据的平均数的较“整”的数,先计算′=i′=(xi-a),则=a+′.
(3)频数平均数法(也称为加权平均数法):在给定的n个数据中,如果x1出现了f1次,x2出现了f2次,…,xk出现了fk次,则一般选用=ifi(其中i=n)来计算平均数.
2.