内容正文:
9.2 用样本估计总体
一、频率分布直方图
制作频率分布直方图的步骤
(1)求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.
注意点:(1)组数太多或太少,都会影响我们了解数据的分布情况.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.决定组距与组数:当样本容量不超过100时,常分成5~12组,为了方便起见,一般取等长组距,并且组距应力求“取整”.
(2)分点的确定:若数据为整数,则分点数据减去0.5;若数据是小数点后有一位数字的数,则分点数据减去0.05,以此类推.分组时,通常对组内数值所在的区间取左闭右开区间,最后一组取闭区间.
二、频率分布直方图的应用
(1)频率分布直方图的性质
①因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
②在频率分布直方图中,各小矩形的面积之和等于1.
③=样本容量.
(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
三、几种不同的统计图
(1)不同的统计图在表示数据上有不同的特点.如:扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势.
(2)不同的统计图适用的数据类型也不同.例如,条形图适用于描述离散型的数据,直方图适用于描述连续型数据等.
四、利用各种统计图表对数据进行分析
对于涉及扇形图、条形图的性质等问题,要充分考虑到图形所提供的各类信息,从中提取信息进行计算.
(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率.
(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数.
(3)在画折线图时,要注意明确横轴、纵轴的实际含义.
五、百分位数的定义
1.计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
注意点:(1)中位数相当于是第50百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第25,50,75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
六、由样本数据求百分位数
计算一组n个数据的第p百分位数的一般步骤
第1步:按照从小到大排列原始数据.
第2步:计算i=n×p%.
第3步:若i不是整数,大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项和第(i+1)项数据的平均数.
七、由频数(频率)分布表求百分位数
由频率分布直方图求百分位数的方法
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)一般采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
八、众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
3.平均数:如果有n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
九、总体集中趋势的估计
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
十、利用频率分布直方图估计总体的集中趋势
利用频率分布直方图求众数、中位数以及平均数的方法
(1)众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).平均数为每个小矩形底边中点的横坐标与小矩形面积乘积之和.
(2)用频率分布直方图求得的众数、中位数不一定是样本中的