内容正文:
讲课人:
日期:
9.2.1 总体取值规律的估计(一)
学习目标
学习目标 核心素养
1.会列频率分布表,会画频率分布直方图,理解统计图的画法及应用.(重点) 直观想象
2.能用样本估计总体的取值规律.(难点) 数据分析
复习回顾
收集数据是为了寻找数据中蕴含的信息.因为实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适统计图表对数据进行整理和直观描述. 在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了.
1.通过调查获取数据
2.通过试验获取数据
3.通过观察获取数据
4.通过查询获得数据
获取数据的基本途径:
如图5 . 31, 在直角坐标系内,设任意角α 的
终边与单位圆交于点P1 .
(1) 作 P1 关于原点的对称点 P2 , 以 。P2 为
终边的角β与角α有什么关系? 角 β, α 的三角函
数值之间有什么关系?
(2) 如果作P1 关于x 轴(或S轴) 的对称点
P3 (或 P4 ), 那么又可以得到什么结论?
新课引入
面对一个统计问题,在随机抽样获得观测数据的基础上,需要根据数据分析的需要,选择适当的统计图表描述和表示数据,获得样本的规律,并利用样本的规律估计总体的规律,解决相应的实际问题。对于下图的数据,大家可以发现什么规律?
探索新知
思考:思考下面的问题
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费,如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?
探索新知
(1)每户居民月均用水标准a如果定得太低,会影响____________________;
(2)每户居民月均用水标准a如果定得太高,会不利于__________________;
(3)为了较为合理地确定出这个标准,需要做哪些工作?
必须先了解全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况.
(4)如何调查全市所有居民用户的月用水量分布情况?
①全面调查:获取过去一年全市所有居民用户的月均用水量数据
②抽样调查:分析样本观测数据,估计全市居民用户月均用水量的分布情况.
很多居民的日常生活
节约用水
探索新知
假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位: t):
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
最小值是1.3t,最大值是28.0t,其他值在1.3t至28.0t之间.
问题1: 从这组数据我们能发现什么信息呢?
在这个问题中,总体是该市的全体居民用户,个体是每户居民用户,调查的变量是居民用户的月均用水量.
探索新知
思考: 数据有哪些可视化的呈现方式,不同的呈现方式分别具有什么特点呢?
表格
图
频数分布表
频数分布直方图
探索新知
在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据.
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.
将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数。
频数:
频率:
样本中某个组的频数和样本容量的比,叫做该数据的频率。
探索新知
1.求极差
极差为一组数据中最大值与最小值的差
样本观测数据的最小值是 1.3 t ,最大值是 28.0 t,极差为
28.0-1.3=26.7
这说明样本观测数据的变化范围是26.7 t.
2.决定组距与组数
一般数据的个数越多,所分组数也越多.当样本容量不超过100时,常分成5-12组.为了方便起见,一般取等长组距,并且组距应力求“取整”.
分组时可以先确定组距,也可以先确定组数.如果我们取所有组距为 3 ,则
即可以将数据分为9组,这也说明这个组距是比较合适的.
探索新知
3.将数据分组
由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.例如,可以取区间为[1.2,28.2] ,按如下方式把样本观测数据以组距3分为9组:
[1.2,4.2),[4.2,7.2),⋯,[25.2,28.2].
4.列频率分布表
计算各小组的频率:
分组区间通常取:左闭右开,最后一组闭区间.
探索新知
频率和必须为1
频数的和等于样本容量
探索新知
5、画频率分布直方图
横轴表示月均用水量,纵轴表示.比如第一组数据,这就是频率分布直方图中第一个小长方形的高.
(1)小长方形的面积等于什么?
(2)小长方形的面积之和为多少?
(1)小长方形的面积=组距× =频率. 频率分布直方图就以面积
的形式反映了数据落在各个小组的频率的大小.
(2)小长方形的面积之和为1,即样本数据落在整个区间的频率为1.
探索新知
追问1 :频率分布直方图与频数分布直方图有什么联系与区别?
都可以描述数据的取值规律
追问2:频率分布表和频率分布直方图的优缺点
(1)频率分布表反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便.
(2)频率分布直方图能够直观地表明数据分布的形状,一般呈中间高、两端低、左右对称的“峰”状结构.但是从直方图本身得不到具体的数据内容,也就是说,将数据表示成直方图以后,原式数据不能再图中表示出来.
探索新知
观察:观察上表和上图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的语言描述吗?
从频率分布表可以清楚地看出,样本观测数据落在各个小组的比例大小.例如,月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过 16.2 的各区间内数据所占比例较小,等等.
从频率分布直方图容易看出,居民用户月均用水量的样本观测数据的分布是不对称的,图形的左边高,右边低,右边有一个较长的"尾巴".这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间[1.2,7.2)最为集中,少数居民用户的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.
思想:用样本的频率分布估计总体的频率分布
探索新知
追问3 请同学们重新确定组数,对这100个数据再次进行等距分组,画出相应的频率分布直方图,观察不同的组数(组距)对直方图呈现的数据分布规律有什么影响.
追问4 全体居民用户月均用水量有什么规律呢?
探索新知
同一组数据,组数不同,得到的直方图形状和频率分布特点也不尽相同。
随着月均用水量的增加,居民用户数的频率呈下降趋势 , 数据主要集中在低值区,尤其在区间[5.2,6.2)内最为集中。但存在个别区间频率变大或者缺少的现象.
随着月均用水量的增加,居民用户数的频率在降低;大部分居民用户的月均用水量低于10.2 t.
组数少、组距大:
容易从中看出数据整体的分布特点,但损失了较多的原始数据信息,无法看出每组内的数据分布情况;
组数多、组距小:
保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点。
不同的频率分布印象有时会影响人们对总体的判断
跟踪练习
在频率分布直方图中得不到原始的数据内容,把数据表示成直方图后原有的具体数据信息就被抹掉了
1
在频率分布直方图中,纵轴表示频率
2
3
在频率分布直方图中,各小长方形的面积为1
4
在频率分布直方图中,各小长方形的面积之比等于各组频率之比
探索新知
2、从某小区抽取100户居民进行月用电量调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1)直方图中的值为________;
(2)在被调查的用户中,用电量落在区间[100,250)内的户数为________.
0.0044
70
课堂小结
小结:频率分布直方图
1.求极差(一组数据中的最大值与最小值的差).
2.决定组距与组数
3.将数据分组(确定分点,左闭右开最后闭)
4.列出频率分布表(分组,频数,频率)
5.列出频率分布直方图(纵轴为频率/组距)
课堂检测
C
课堂检测
组号 1 2 3 4 5 6
频数 14 17 20 16 15
C
课堂检测
3.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,
11,10,那么频率为0.2的范围是( )
A. 5.5~7.5 B. 7.5~9.5
C. 9.5~11.5 D. 11.5~13.5
解析: 共20个数据,频率为0.2,在此范围内的数据有4个,只有在11.5~13.5范围内有4个数据:13,12,12,12.故选D.
D
课堂检测
解:(1) 通话时长在区间[15,20),
[20,30)内的次数分别为9次和12次.
(2) 区间[20,30)上每单位区间长度内的通话次数 少于区间[15,20内的通话次数.
4.如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次. 胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.
(1) 通话时长在区间[15,20),[20,30) 内的次数分别为多少?
(2) 区间[20, 30)上的小长方形高度低于[15, 20)上的小长方形的高度,说明什么?
课后作业
课本第198页课后习题(15分钟)
分层作业基础练(20分钟)
希望同学们:好学数学
学好数学
祝语
谢谢大家观看
讲课人:
日期:
例:第一小组的频率是
.
1.关于频率分布表,下列叙述中正确的是( )
A.从频率分布表可以看出样本数据相对于平均数的波动大小
B.频数是指落在各个小组内的数据
C.每小组的频数与样本容量之比是这个小组的频率
D.组数是样本平均数除以组距
解析:对于A选项,无法通过频率分布表看出样本数据相对于平均数的波动情况;对于B选项,频数是指落在各个小组内的数据的个数;对于C选项,每小组的频数与样本容量之比等于这个小组的频率;对于D选项,组数一般由样本数据的极差除以组距得到.故选C.
解析:由频率分布表可得第3组的频数为:
第3组的频率为
故选: C
$