内容正文:
9.2.4总体离散程度的估计
1
复习回顾
总体百分位数的估计
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
计算一组n个数据的第p百分位数的步骤
第一步:按从小到大排列原始数据;
第二步:计算i=n×p%;
第三步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
平均数:一组数据的算术平均数,即
2. 总体集中趋势的估计
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法,但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策,下面的问题就是一个例子.
问题一:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4,
乙 9 5 7 8 7 6 8 6 7 7 ,
如果你是教练,你如何对两位运动员的设计情况作出评价?如果这是一次选拔性考核,你应当如何做出选择?
通过上述数据计算得出:甲、乙两名运动员射击成绩的平均数、中位数、众数都是7。从这三个数据来看,两名运动员没有差别.
由上图发现:甲的成绩比较分散,乙的成绩相对集中。即甲的成绩波动幅度较大,而乙的成绩比较稳定。
一种简单的度量数据离散程度的方法就是用极差.
思考
根据甲、乙运动员的10次射击成绩,可以得到
甲命中环数的极差=10-4=6,
乙命中环数的极差=9-5=4.
可以发现甲的成绩波动范围比乙的大.
极差在一定程度上刻画了数据的离散程度.但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少.
我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远。因