内容正文:
复习:分层随机抽样的步骤吗?
开始
分层
计算各层比例
计算各层样本容量
抽样
组样
结束
分层抽样的步骤:
(1)将总体按一定的标准分层;
(2)计算各层比例;
(3)按抽样比确定各层应抽取的样本容量;
(4)在每一层进行简单随机抽样;
(5)综合每层抽取的样本,组成总样本.
1
9.2.1总体取值规律的估计(一)
一、统计中数据分析过程
收集数据
整理数据
提取信息
构建模型
进行推断
获得结论
问题1:在初中我们学习过哪些统计图?
提示:条形图、扇形图、折线图、频数分布直方图等.
一、统计中数据分析过程
频率:样本中某个组的频数和样本容量的比,叫做该数据的频率
频数:在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数
频率分布是指一个样本数据在各个小范围内所占比例的大小
二、频率分布直方图
问题2:什么是频数?什么是频率?
新课引入
探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出.
某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价费.如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?
了解在全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.
问题1:为了确定一个较为合理的用水标准,需要了解一些什么信息呢?
抽样调查
总体:
个体:
调查的变量:
该市的全体居民用户
该市的每户居民用户
居民用户的月均用水量
新课引入
探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出.
某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,必须先了解在全市所有居民用户中,月用水量的情况。用什么方法获取数据?
问题1:在这个问题中,总体、个体、调查变量分别是什么?
抽样调查
总体:
个体:
调查的变量:
该市的全体居民用户
该市的每户居民用户
居民用户的月均用水量
新课讲解
假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t):
最大值:
最小值:
范围:
用表格整理数据
频率分布表、频率分布直方图
1.3t~28.0t
1.3t
28.0t
频率分布表、频率分布直方图
长这样
新课讲解
制作频率分布表、频率分布直方图的步骤:
1.求极差:样本数据中的最大值和最小值的差
28.0-1.3=26.7
2.决定组距与组数
(1)组数太多或太少,都会影响我们了解数据的分布情况,组距与组数的确定没有固定的标准.
(2)常当样本容量不超过100时,常分成5~12组.
(3)为方便起见,一般取等长组距,并且组距应力求“取整”.
如果取组距为3,则组数= ,
即可以将数据分为 组,
这也说明这个组距是比较合适的。
26.7/3=8.9
9
组数=
新课讲解
3.将数据分组
由于组距为3, 9个组距的长度超过极差,我们可以使
第一组的左端点略小于数据中的最小值1.3,
最后一组的右端点略大于数据中的最大值28.0.
[1.2,4.2),[4.2,7.2),…,[25.2,28.2]
例如,可以取区间为 ,按如下方式把样本观测数据以组距为3,分为9组:
[1.2,28.2]
4.列频率分布表
频率=
注意:分组取左闭右开区间 , 最后一组取闭区间
一般分四列:分组、频数累计、频数、频率,
最后一行是合计.其中频率合计应是样本容量,频率合计是1.
新课讲解
12
横轴表示月均用水量,纵轴表示频率/组距。
纵轴实际上就是频率分布直方图中各小长方形的高,
各小长方形的面积的总和等于1 ,即样本数据落在整个区间的频率为1.
5.画频率分布直方图
小长方形面积=组距×(频率/组距)=频率,
新课讲解
13
思考一:频率分布直方图与频数分布直方图有什么区别?
纵轴不同。
频率分布直方图的纵轴是频率/组距,
频数分布直方图的纵轴是频数。
二、频率分布直方图
14
从频率分布表中可以看出,样本观测数据落在各个小组的比例大小。
例如,月均用水量在区间 内的居民用户最多,在区间 内的次之,而月均用水量超过 的各区间内数据所占比例较小,等等。
这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在 最为集中,少数用户居民的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现 趋势。
思考二:观察上述频率分布表和频率分布直方图, 你能发现居民用