内容正文:
9.2.1 总体取值规律的估计
第一课时
第九章 统计
教学目标
1.结合实例,能用样本估计总体的取值规律.
2.会列频率分布表,画频率分布直方图.
3.能根据频率分布表和频率分布直方图观测数据的分布规律.
收集到数据后,我们需要寻找数据中蕴含的信息.因为实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述.在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了.
复习引入
上一节我们学习了随机抽样的两种方法:简单随机抽样;分层随机抽样。在具体问题中,我们考虑总体特征,样本的代表性,调查需要的人力,物力,时间等因素,通常把多种抽样方法组合起来使用。
频数:某个对象出现的频繁程度,指标为出现次数;
初高衔接
注意:1.频数是一个数,没有单位;
2.所有对象的频数和等于数据总数.
语文成绩/分 60~70 70~80 80~90 90~100
人数(频数) 1 5 18 6
例如: 某次考试中,一班语文成绩统计结果如表,用频数直方图表示内部情况。
初高衔接
系列1
60~70 70~80 80~90 90~100 1 5 18 6
1.计算出数据中最大值与最小值的差;
2.确定组距与组数:数据越多分的组越多;
3.确定分点:常把略小于最小的数据的一点作为左端点的分点,略大于最大的数据的一点作为右端点的分点;
4.列频数分布表:统计每组数据出现的次数;
5.绘制频数直方图.
画频数直方图的一般步骤:
这节课,在初中的基础上,进一步研究整理、分析数据的方法。
初高衔接
为了确定一个较为合理的用水标准,必须先了解在全市居民用户中,月用水量在不同范围内的居民用户所占的比例情况。
由于全市居民很多,通常采用抽样调查的方式,通过分析样本观测数据,来估计全市居民用户月均用水量的分布情况。
问题:某市政府为了减少水资源浪费,计划对居民生活用水费用实施阶梯式水价制定。即确定一户居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。
如果希望大多数居民的生活不受影响,那么标准a定为多少比较合理呢?确定标准需要做哪些工作?
探究新知
★思考:如果已通过简单随机抽样,得到100户居民的月均用水量数据(单位:t)
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.3
这个实际问题中,因为我们更关心月均用水量在不同范围内的居民占全市居民用户的比例,
利用初中知识,我们可以用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数。
所以选择频率分布表和频率分布直方图整理和表示数据。
频数:将一批数据按要求分为若干个组,各组内数据的个数
频率:每组数据的频数与全体数据个数的比
探究新知
探究新知
(1)求极差
极差为一组数据最大值与最小值的差.
画频率分布直方图的步骤:
样本观测数据的最小值是1.3t,
最大值是28.0t,
极差为28.0-1.3=26.7,
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.3
(2)决定组距与组数
①数据的个数越多,所分的组数也越多. 当样本量不超过100时,常
分成5—12组.
②一般取等长组距,且组距应力求“取整”.
③分组时可以先确定组距,也可以先确定组数.
即可以将数据分为9组
如果我们取组距为3,则
探究新知
(3)将数据分组
[1.2,4.2)
[4.2,7.2)
[7.2,10.2)
[10.2,13.2)
[13.2,16.2)
1.通常组内数值所在区间取左闭右开,
2.最后一组取闭区间。
[16.2,19.2)
[19.2,22.2)
[22.2,25.2)
[25.2,28.2]
探究新知
观测数据变化范围内,分得9个组
(4)频率分布表如下
各小组的频率=
频率和为1
频数和为样本量n
探究新知
(5)画频率分布直方图
在直角坐标系中,用横轴表示月均用水量,纵轴表示
0
1.2
4.2
7.2
10.2
13.2
16.2
19.2
22.2
25.2
28.2
月均用水量/t
0.077
0.107
0.043
0.03
0.03
0.013
0.017
0.007
0.01
探究新知
0
1.2
4.2
7.2
10.2
13.2
16.2
19.2
22.2
25.2
28.2
月均用水量/t
0.077
0.107
0.043
0.03
0.03
0.013
0.017
0.007
0.01
思考2:频率分布直方图中各小长方形的面积表示什么?
思考3:各小长方形的面积之和为多少?
思考1:为什么把纵轴规定为 ?
思考4:频率分布直方图有哪些优缺点?
探究新知
频率分布直方图中:
1、小长方形的高=频率/组距
2、小长方形的面积表示该组的频率
3、所有小长方形的面积和为1,
即频率之和为1.
优点:直观地表明各段分布的情况
缺点:原始数据不能在图中表示出来
探究新知
例1、从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2; [50,60),3; [60,70),10;
[70,80),15; [80,90),12; [90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)的学生比例.
成绩分组 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 10 0.2
[70,80) 15 0.3
[80,90) 12 0.24
[90,100] 8 0.16
合计 50 1.00
例1、从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2; [50,60),3; [60,70),10;
[70,80),15; [80,90),12; [90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)的学生比例.
例1、从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2; [50,60),3; [60,70),10;
[70,80),15; [80,90),12; [90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)的学生比例.
(3)学生成绩在[60,90)的频率为(0.2+0.3+0.24)×100%=74%,所以估计成绩在[60,90)的学生比例为74%.
0.0044
70
课堂练习
解:(1) 通话时长在区间[15,20),[20,30)内的次数分别为9次和12次.
(2) 区间[20,30)上每单位区间长度内的通话次数 少于区间[15,20内的通话次数.
2.如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次. 胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.
(1) 通话时长在区间[15,20),[20,30) 内的次数分别为多少?
(2) 区间[20, 30)上的小长方形高度低于[15, 20)上的小长方形的高度,说明什么?
课堂练习
小结:频率分布直方图
1.求极差(一组数据中的最大值与最小值的差).
2.决定组距与组数
3.将数据分组(确定分点,左闭右开最后闭)
4.列出频率分布表(分组,频数,频率)
5.列出频率分布直方图(纵轴为频率/组距)
$