内容正文:
第04讲 用样本估计总体
【学习目标】
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),
3.结合实例,理解集中趋势参数的统计含义,能用样本估计总体的离散程度参数(标准差、方差、极差),4.结合实例,理解离散程度参数的统计含义,
5.能用样本估计总体的取值规律,能用样本估计百分位数,理解百分位数的统计含义
【基础知识】
一、频率分布直方图
1.制作频率分布直方图的步骤
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图。
2.解决频率分布直方图问题时要抓住3个要点
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总体数.
二、样本的数字特征
1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数
3.平均数:样本数据的算术平均数,即.
4.百分位数:求总体百分位数的估计,首先要从小到大排列数据,然后计算出i=n×p%,当i不是整数要取整,当i是整数,则百分位数为第i项与第(i+1)项数据的平均数.
5.方差与标准差
(1)标准差是样本数据到平均数的一种平均距离.
(2)方差:(是样本数据,是样本容量,是样本平均数).
(3)标准差:.
6.平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
7.平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理论依据,一般先比较平均数,若平均数相同,再用方差来决定.
8.用频率分布直方图估计众数、中位数、平均数的方法
(1)众数为频率分布直方图中最高矩形底边中点横坐标;
(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和。
三、统计图
1.统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具.其中有条形统计图、扇形统计图、折线统计图、象形图等.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.
2. 茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
3.折线图
折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势.折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布.另外,在折线图中,数据是递增还是递减、增减的速率、增减的规律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出来.所以,折线图常用来分析数据随时间的变化趋势,也可用来分析多组数据随时间变化的相互作用和相互影响.例如可用来分析某类商品或是某几类相关的商品随时间变化的销售情况,从而进一步预测未来的销售情况.在折线图中,一般x轴用来表示时间的推移,并且间隔相同;而y轴代表不同时刻的数据的大小.
四、频率分布折线图和总体密度曲线
1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
【考点剖析】
考点一:频率分布直方图
例1.(2021-2022学年河北省邢台市卓越联盟高一下学期第三次月考)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间),分组整理数据得到如图所示的频率分布直方图.则图中