内容正文:
9.2 用样本估计总体
SHAPE \* MERGEFORMAT
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且
;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以
的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①
,
②个小长方形的面积等于1,
③
.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线
来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
2、用样本的平均数估计总体平均数
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为
,则样本的算术平均数为
;
(4)众数、中位数、平均数的异同:
①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;
②平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动;
③众数考察各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题;
④中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势;
⑤实际问题中求得的平均数、众数和中位数应带上单位。
(5)平均数相关结论:
①如果两组数
和
的平均数分别是
和
,则一组数
的平均数是
;
②如果一组数
的平均数为
,则一组数
的平均数为
。
③如果一组数
的平均数为