内容正文:
第五章 统计与概率
5.1统计
5.1.2数据的数字特征
知识梳理
一.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况,一般地,最大值用max表示,最小值用min表示.
二.平均数
如果给定的一组数是,则这组数的平均数为:
这一公式在数学中常简记为:
注:(1)其中的符号表示求和,读作“西格玛“,右边式子中的i表示求和的范围,其最小值和最大值分别写在的下面和上面.
(2)求和符号具有以下性质:
①②③
(3)平均数会受每一个数的影响,尤其是最大值、最小值.很多情况下,为了避免过于极端的值影响结果太大等,会去掉最低分与最高分后再计算平均数.
(4)一般地,利用平均数地计算公式可知,如果的平均数为,且为常数,则的平均数为
三.中位数、百分位数
1.一般地,有时也可以借助中位数来表示一组数的中心位置:
(1)如果一组数有奇数个数,且按照从小到大排列后为,则称为这组数的中位数;
(2)如果一组数有偶数个数,且按照从小到大排列后为,则称为这组数的中位数.
2.一组数的分位数指的是满足下列条件的一个数值:至少有的数据不大于该值,且至少有的数据不小于该值.
注:(1)直观来说,一组数的分位数指的是,将这组数按照从小到大的顺序排列后,处于位置的数,例如中位数就是一个分位数.
(2)按照定义可知,分位数可能不唯一
(3)设一组数按照从小到大排列后为,计算的值,如果不是整数,设为大于的最小整数,取为分位数:如果是整数,取为分位数.特别的,规定:0分位数是(是最小值),100分位数是(即最大值).
(4)实际应用中,除了中位数外,经常使用的是分位数(简称为第一四分位数)与分位数(简称为第三四分位数)
四.众数
一组数据中,某个数据出现的次数称为这个数据的频数,重复出现的次数最多的数据称为这组数据的众数.
五.极差、方差、标准差
1.极差:一组数的极差指的是这组数的最大值减最小值,不难看出,极差反映了一组数的变化范围,描述了这组数的离散程度.
描述一组数的离散程度的量还有方差和标准差.
2.方差:如果的平均数为,则方差可用求和符号表示为:
注:如果a,b为常数,则:的方差为.
3.标准差:方差的算术平方根称为标准差;
注:如果一组数中,各数据值都相等,则标准差为0,表面数据没有波动,数据没有离散;若各数据的值与平均数的差的绝对值较大,则标准差越大,表明数据的波动幅度越大,数据的离散程度较高,因此标准差描述了数据相对平均数的离散程度.
常见考点
考点一 平均数、中位数、众数
典例1.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.a>c>b
C.c>a>b D.c>b>a
【答案】D
【分析】
根据平均数的求法,所有数据的和除以总个数即可,中位数求法是从大到小排列后,最中间一个或两数的平均数,众数是在一组数据中出现次数最多的即是众数,根据以上方法可以确定出众数与中位数.
【详解】
解:从小到大排列此数据为:11、13、15、15、16、16、17、18、18、18.
平均数为
中位数为是最中间两数的平均数,即;
众数为,即.
故选:D.
【点睛】
本题属于基础题,考查了确定一组数据的平均数、中位数和众数的能力.要明确定义.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数.如果数据有奇数个,则正中间的数字即为所求;如果是偶数个则找中间两位数的平均数.
变式1-1.如果五个数的平均数是7,那么这五个数的平均数是( )
A.5 B.6 C.7 D.8
【答案】D
【解析】
试题分析:利用平均数计算,或利用结论:样本x1,x2,…xn的平均数为7,
∴样本x1+1,x2+1,…,xn+1的平均数=7+1=8,故选D.
考点:本题主要考查平均数的意义及其计算.
点评:基本题型,注意掌握平均数计算公式.在此基础上推出一般结论更好.
变式1-2.下表记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
甲组
56
65
65
74
x
乙组
59
61
67
y
78
A.70,65 B.75,65 C.73,67 D.75,67
【答案】A
【分析】
对甲、乙两组数进行从小到大排列,同时注意甲组数据中位数的特点,再逐步求出x,y的值.
【详解】
甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得
又甲、乙两组数据的平均值相等,
所以,
解得.
故选:A
变式1-3.下面表格记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数