内容正文:
13.5统计估计
第13章 统计
教师
xxx
沪教版(2020) 必修第三册
总体集中趋势的估计
01
03
02
CONTANTS
目 录
总体离散程度的估计
估计百分数
总体集中趋势的估计
01
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
(2)中位数:一组数据按大小依次排列后处在最中间位置的数(或最中间两个数据的平均数).
(1)众数:一组数据中出现次数最多的数.
(3)平均数:一组数据的算术平均数.
一组11个样本数据为:19,23,12,15,14,17,10,12,18,12,27
排序后为:10,12,12,12,14,15,17,18,19,23,27
众数为12
中位数为15
下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
众数的特点
例1.某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格. 据统计,高一年级女生需要不同规格校服的频数如下表.
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、
平均数和众数中,哪个量比较合适?
校服规格 155 160 165 170 175 合计
频 数 39 64 167 90 26 386
众数只利用了出现次数最多的那个值的信息,只能说明它比其他值出现的次数多,但并未体现它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值不敏感.
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
平均数、中位数、众数刻画一组数据的集中趋势的特点
【思考】小明用统计软件计算了100户居民用水量的平均数和中位数.但在录入数据时,不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较,哪个量的值变化更大?你能解释其中的原因吗?
平均数:8.79 t
中位数:6.8 t
9.483 t
6.8 t
与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感。
“去掉一个最高分和一个最低分”的原因?
“我们企业员工的年平均收入为20万元”可信吗?
由频率分布直方图估计平均数、中位数、众数
在频率分布直方图中,我们无法知道每组数据是如何分布的,故通常假设它们在组内均匀分布。
1.平均数是直方图中每个小矩形底边中点的横坐标与小矩形的面积的乘积之和(组中值与频率积的和)
2.中位数左边和右边的直方图面积相等,各为0.5
3.众数是直方图中最高矩形的中点的横坐标
平均数、中位数的大小与数据分布形态
平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关(如下图)
(1)直方图形状对称:平均数和中位数应该大体上差不多;
(2)直方图右边“拖尾”:平均数大于中位数;
(3)直方图左边“拖尾”:平均数小于中位数.
与中位数相比,平均数总在直方图的“长尾巴”那边
用频率分布直方图估计众数、中位数、平均数
众数:最高矩形的中点
特点:反映样本数据的最大集合点
忽视了其他数据,无法客观的反映总体特征
中位数:中位数左右两边的直方图面积相等
特点:不受少数几个极端值的影响
平均数:直方图的“重心”,各组组中值与频率乘积之和
特点:和每一个样本数据都有关,可以反映更多的关于样本数据的信息
离平均数越远的数据对平均数影响越大(可靠性低)
求一组n个数据的平均数的方法
1.算术平均数:
2.加权平均数:
4.组中值法(由频率分布直方图求平均数)
推论:
3.分层抽样的样本平均数:
总体离散程度的估计
02
问题导入
问题一:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4,乙 9 5 7 8 7 6 8 6 7 7 ,如果你是教练,你如何对两位运动员的设计情况作出评价?如果这是一次选拔性考核,你应当如何做出选择?
通过上述数据计算得出:甲、乙两名运动员射击成绩的平均数、中位数、众数都是7。
从这三个数据来看,两名运动员没有差别。
12
根据以上数据作出频率分布直方图,如下:
由上图发现:甲的成绩比较分散,乙的成绩相对集中。
即甲的成绩波动幅度较大,而乙的成绩比较稳定。
可见,他们的射击成绩是