内容正文:
9.2.1总体取值规律的估计
二战期间,为了加强对战机防护,英美军方调查了幸存飞机上的弹痕的分布,决定哪里弹痕多就加强哪里,然而统计学家沃德力排众议,指出更应该注意弹痕少的部位,因为这些部位收到重创的战机,很难有机会返航,而这部分数据被忽略了,事实证明,沃德是正确的。
故事导入
沃德在分析问题的时候,能够做到不被表面现象所迷惑,在获取数据之后,通过数据分析,找出数据中蕴含的信息,进而得到正确的统计分析结果
随机抽样的基本抽样方法
简单随机抽样
分层随机抽样
回顾旧知
要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述。在此基础上,通过数据分析找到数据中蕴含的信息,就可以利用这些信息来解决实际问题了。
下面我们讨论的是对随机抽样获取的数据的处理方法。
收集数据
分析数据
新知探究
问题1.我国是世界上严重缺水的国家之一,城市缺水问题较为突出. 某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准,用水量不超过的部分按平价收费,超出的部分按议价收费,如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?
(1)每户居民月均用水标准如果定得太低,会影响_______________________;
(2)每户居民月均用水标准如果定得太高,会不利于__________________;
(3)为了较为合理地确定出这个标准,需要做哪些工作?
思考:
很多居民的日常生活
节约用水
必须先了解全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.
新知探究
追问1:为了了解全市居民月均用水量数据,采用什么方法去调查呢?
抽样调查
追问2:在这个问题中,抽样总体,个体,调查变量分别是什么呢?
该市的全体居民用户
每户居民用户
居民用户的月均用水量
新知探究
假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t)
最大值:
最小值:
28.0
1.3
新知探究
思考:为了更深入地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析.在实际问题中,我们更关心什么问题?
月均用水量在不同范围内的居民用户占全市居民用户的比例.
追问1:如何探索、研究这组数据的取值规律呢?
频数分布表
频数分布直方图
频率分布表
频率分布直方图
画频率分布直方图有哪些步骤呢?
1.求极差(极大值与极小值的差)
新知探究
2.确定组距和组数.
28.0-1.3=26.7
说明样本观测数据的变化范围是26.7t
组距:每个小组的两个端点的距离
当样本容量不超过100时,常分成5~12组
当组距为2时分几组?
当组距为3时分几组?
当组距为4时分几组?
分14组
分9组
分7组
一般取等长组距,并且力求取整
组数=
新知探究
3.将数据分组
由于组距为,个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中最大值.
左闭右开,最后一组取闭区间
新知探究
分组 频数 频率
[1.2,4.2) 23 0.23
[4.2,7.2) 32 0.32
[7.2,10.2) 13 0.13
[10.2,13.2) 9 0.09
[13.2,16.2) 9 0.09
[16.2,19.2) 5 0.05
[19.2,22.2) 3 0.03
[22.2,25.2) 4 0.04
[25.2,28.2] 2 0.02
合计 100 1
计算各小组的频率
频率=
4.列频率分布表
新知探究
5.画频率分布直方图
横轴表示月均用水量,纵轴表示频率与组距的比值,以每个组距为底,以频率除以组距的商为高,分别画出矩形,得到的直方图就是频率分布直方图。
分组 频数 频率 频率 / 组距
[1.2,4.2) 23 0.23 0.077
[4.2,7.2) 32 0.32 0.107
[7.2,10.2) 13 0.13 0.043
[10.2,13.2) 9 0.09 0.030
[13.2,16.2) 9 0.09 0.030
[16.2,19.2) 5 0.05 0.017
[19.2,22.2) 3 0.03 0.010
[22.2,25.2) 4 0.04 0.013
[25.2,28.2] 2 0.02 0.007
合计 100 1
新知探究
思考:频率分布直方图与频数分布直方图有什么区别?
频率分布直方图的优点:把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.
注意:频率直方图纵轴表示频率除以组距,就是小长方形的高,它反映了各组样本观测数据的疏密程度.
新知探究
思考:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积总和为多少?
所以各小长方形的面积表示相应各组的频率.
注:各小长方形的面积总和为1.
频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小。
小长方形的面积=
=频率
思考:观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分部规律?
新知探究
新知探究
(1)从频率分布表可以看出样本观测数据落在各个小组的比例大小.
例如,本次抽样调查月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小等等;
新知探究
(2)从频率分布直方图可以看出,样本的观测数据分布对称情况、左右高低情况、数据集中情况从左到右的变化趋势等.
这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间[1.2,7.2)最为集中,少数居民用户的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.
例如,本次抽样调查居民用户月均用水量的样本观测数据的分布是不对称的,图形的左边高、右边低,右边有一个较长的“尾巴”.
练习巩固
辨析1:判断正误.
1.用样本的频率分布可以估计总体分布.( )
2.频率分布直方图的纵轴表示频率.( )
3.频率分布直方图中小矩形的面积表示该组的个体数.( )
×
×
√
练习巩固
练习:某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间范围是,样本数据分组为根据直方图,_________,这200名学生中每周的自习时间不少于22.5小时的人数是_________.
自习时间/小时
频率/组距
O
20
22.5
17.5
25
27.5
30
0.02
0.16
0.10
a
0.04
画频率分布直方图步骤:
①频率分布直方图中,纵轴表示:
③各小长方形的面积的总和等于1
频率分布直方图步中长方形意义:
②小长方形的面积=
归纳总结
=频率
①求极差 ②确定组距和组数. ③将数据分组.
④列频率分布表. ⑤画频率分布直方图
$$