内容正文:
5.1.2 数据的数字特征
学习目标
1.通过本节课的学习,理解数据的最值、平均数、中位数、百分位数、众数的意义和作用,会计算数据的这些数字特征,并能解决有关实际问题,提升学生的数据分析和数学运算的核心素养.
2.通过极差、方差和标准差的求解及应用,理解极差、方差和标准差的意义和作用,会计算样本数据的这些数字特征,并能解决有关实际问题,提升学生的数据分析、逻辑推理、数学运算的核心素养.
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.
一般地,最大值用max表示,最小值用min表示.
2.平均数
如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn),简记为=xi.
一般地,利用平均数的计算公式可知,如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
思考1:符号xi的含义是什么?
答案:符号“∑”表示求和,读作“西格玛”,∑右边式子中的i表示求和的范围,其最小值与最大值分别写在∑的下面与上面.例如,xi=x1+x2+x3+x4,xi=x2 018+x2 019+x2 020.
思考2:求和符号∑具有哪些性质?
答案:(1)(xi+yi)=xi+yi;(2)(kxi)=kxi;(3)t=nt.
3.中位数、百分位数
(1)一般地,如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
(2)按如下方式确定p%分位数:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取为p%分位数;如果i是整数,取为p%分位数.特别地,规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
思考3:p%分位数唯一吗?
答案:p%分位数可能不唯一,也正因为如此,各种统计软件所得出的p%分位数可能会有差异.
4.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.
思考4:众数一定描述一组数据的中心位置吗?
答案:众数不一定描述一组数据的中心位置.例如,1,2,2,3的众数是2,处于中心位置;但例如,1,2,3,4,4的众数是4,就不在中心位置.
5.极差、方差与标准差
极差:一组数的极差指的是这组数的最大值减去最小值所得的差.极差反映了一组数的变化范围,描述了这组数的离散程度.
方差:如果x1,x2,…,xn的平均数为,则方差s2=.
如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为a2s2.
标准差:方差的算术平方根.标准差描述了数据相对于平均数的离散程度.
s=.
思考5:如果一组数据中各个数值相等,则这组数据的极差、平均数、中位数、众数、方差、标准差各是什么?
答案:设一组数据共5个数,且为1,1,1,1,1,则极差为0,平均数为1,中位数为1,众数为1,方差为0,标准差也为0.
最值、平均数
[例1] (1)运动员参加体操比赛,当评委亮分后,往往是先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均数,这是为了( )
A.减少计算量 B.避免故障
C.剔除异常值 D.活跃赛场气氛
(2)下面是某快餐店所有工作人员一周的收入表:
老板
大厨
二厨
采购员
杂工
服务生
会计
3 000
元
450
元
350
元
400
元
320
元
320
元
410
元
①计算所有人员的周平均收入;
②这个平均收入能反映打工人员的周收入的一般水平吗?为什么?
③去掉老板的收入后,再计算平均收入,这能代表打工人员的周收入的一般水平吗?
(1)答案:C
(2)解:①周平均收入
=×(3 000+450+350+400+320+320+410)=750(元).
②这个平均收入不能反映打工人员的周收入的一般水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.
③去掉老板的收入后的周平均收入
=×(450+350+400+320+320+410)
=375(元).
这能代表打工人员的周收入的一般水平.
平均数反映了数据的平均水平,我们需根据实际需要选择使用.平均数与每一个数据都有关,受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若存在少量极端数据,平均数不能反映数据的集中趋势,有时也采用剔除最大值与最小值后计算所得的平均数反映该组数据的集中趋势.
针对训练:已知样本数据3,2,1,a的平均数为2,则a= .
解析:由题意得3+2+