内容正文:
9.2.1 总体取值规律的估计
授课人:张发松 学 校:昆明市呈贡区第一中学
1
目标导航
1. 析各类统计图表的适用场景,精准掌握频率分布表、频率分布直方图的生成步骤,明晰频数、频率、组距、的内在关联.
2. 能规范完成数据分组、制表、绘图,熟练进行频率计算、直方图参数运算,统一答题规范.
3. 能通过频率分布直方图直观解读数据集中、分散、峰值、偏态等取值规律,理解面积定频率、高度定密度的核心模型.
4.建立“样本规律推断总体规律”的统计大概念,能结合真实情境分析数据分布特征,体会统计近似估计的科学价值,形成理性数据思维
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
2
内容解析
? 核心问题:面对一堆杂乱的数据,如何从中发现规律?
“ 为什么要画这样的图→怎么画→画出来后怎么看→图告诉我们什么?
第一层——离散化:用“分组”压缩信息,化杂乱为有序。 原始数据是散乱的、个别的。频率分布直方图的核心思想是通过“分组”将大量的个别数据归入有限的若干个区间,用每个区间的“频率”概括该区间内数据的密集程度。这种“离散化”处理——将连续的数据归入离散的组别——是数学中处理大量信息的基本策略:牺牲细枝末节,换取结构明朗。正如统计学家所说:“好的统计图表不展示全部信息,而是有选择地突出重要信息。”
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
3
内容解析
第二层——面积表示频率:一个关键的几何直观。
小矩形面积=对应组频率,总面积恒为1.纵坐标为频率/组距是为了保证不同组距下频率表达统一,实现数据分布密度的可视化。矩形的面积才是频率。这一设计的数学精妙在于:不同组距的直方图可以通过面积实现“频率”的同一度量,使得不同组距下各组的频率具有可比性;同时,所有矩形面积之和恰好为1(即100%),这一性质与概率密度函数的积分为1形成了自然的对应,为后续学习连续型随机变量的概率密度函数埋下直观基础。
第三层——从样本到总体的推断:统计图表的终极指向。 频率分布直方图虽然画的是样本数据,但其标题却使用了“总体取值规律的估计”这一表述。这揭示了本节最深刻的思想:绘制图表的最终目的不是描述样本,而是通过样本的分布形态去推断总体的分布特征。直方图的形状(对称性、偏态、峰的数量、疏密分布)是总体分布的一次“可视化估计”。从这个意义上说,频率分布直方图不仅是描述统计的工具,更是推断统计的桥梁。
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
4
内容解析
一是从数据整理走向规律发现
——用表格和图的形式让杂乱的数据蕴含的规律显现出来;
二是从样本走向总体
——用样本的频率分布估计总体的概率分布;
三是从确定性思维走向统计思维
——用不确定的样本信息对不确定的总体作出合理推断。
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
5
收集数据是为了寻找数据中蕴含的信息.因为实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述.在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了.
下面我们讨论对随机抽样获取的数据的处理方法.
【环节一】情境导入——创设冲突,催生新知
一起探究吧!
【环节一】情境导入——创设冲突,催生新知
问题 1:从地理困境到数学决策
假设你是一名政府决策人员,面对严峻的缺水形势,市政府计划推行居民生活用水定额管理:确定一个月用水量标准 a,用水量不超过 a 的部分按平价收费,超过 a 的部分按议价收费.
如果希望大部分居民的日常生活不受影响,标准 a 定多少才合理?
分析 1:水资源短缺的紧迫性要求我们必须节水,但节水不能以牺牲居民基本生活为代价;
分析 2:“大部分居民”需要用数据量化(如覆盖 90% 居民的用水量),这就需要我们通过统计分析,找到科学的 a 值.
【环节一】情境导入——创设冲突,催生新知
问题2:
(1)每户居民月均用水标准如果定得太低,会影响_____________________;
(2)每户居民月均用水标准如果定得太高,会不利于__________________;
(3)为了较为合理地确定出这个标准,需要做哪些工作?
很多居民的日常生活
节约用水
标准定太低——不利于节水,标准定太高——不利于民生
【环节一】情境导入——创设冲突,催生新知
问题3:在这个问题中,抽样总体,个体,调查变量分别是什么呢?
抽样总体:该市的全体居民用户,
个 体:每户居民用户,
调查变量:居民用户的月均用水量.
问题1: 要合理确定a,首先需要了解什么?
问题2: 如何获取全市居民月均用水量的数据?
【环节一】情境导入——创设冲突,催生新知
了解全市居民月均用水量的分布情况
抽样调查
假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:):
问题4:观察这些数据,你能直接看出月均用水量的分布规律吗?
【环节二】探索方法,明确工具
条形图主要用于直观描述不同类别或分组数据的频数(离散型数据)
扇形图主要用于直观描述各类数据占总数的比例(离散型数据);
折线图主要用于描述数据随时间的变化趋势 (离散型数据)
直方图主要用于直观描述不同分组数据的频率 (连续型数据)
【环节二】探索方法,明确工具
问题5:面对100个杂乱的数据,如何整理才能使隐藏的规律显现出来?
问题5:为了更深人地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析.在实际问题中,我们更关心什么问题?
月均用水量在不同范围内的居民用户占全市居民用户的比例.
【环节二】探索方法,明确工具
频数分布表
频数分布直方图
整理与表示数据
画频率分布直方图步骤:
1.计算最大值与最小值的差(极差).
2.确定组距和组数.
3.将数据分组.
4.列频率分布表.
5.画频率分布直方图
(纵坐标是频率/组距).
【环节二】探索方法,明确工具
极差为—组教据中最大值与最小值的差.
9.0 13. 6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0
2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5
2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9
2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 22.4
3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0
22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9
5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7
5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3
5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8
7.1 28.0 10.2 13. 8 17.9 10.1 5.5 4.6 3.2 21.6
非负数
它反映了一组数据的最大幅度,对极端值敏感
描述数据的离散程度
极差
【环节二】探索方法,明确工具
什么是极差?
(1)求极差:
极差为说明样本观测数据的变化范围是26.7
组距:一般取等长组距
组距应力求取整
组数:当容量不超过100时
常分成5-12组
当组距为2时分几组?
当组距为3时分几组?
当组距为4时分几组?
分14组
分9组
分7组
组数太多或太少,都会影响我们了解数据的分布情况.
【环节二】探索方法,明确工具
(2)确定组距和组数:
由于组距为 3,9 个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值;
例如:可以取区间为 [1.2,28.2],按如下方式把样本数据以组距 3 分成 9 组:[1.2,4.2),[4.2,7.2),...,[25.2,28.2]
通常对组内数据所在区间:左闭右开,最后一组取闭区间.
(3)将数据分组:
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7
3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5
5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9
8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6
13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
【环节二】探索方法,明确工具
统计频数,计算各小组的频率,作出频率分布表.
(4)列频率分布表:
第一组 [1.2,4.2) 的频数:23;
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.6 2.6 3.0 3.2 3.2 3.6 3.6 3.7
3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5
5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9
8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6
13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
频率 = = = 0.23 .
频数
样本容量
23
100
分组 频数 频率
[1.2,4.2)
[4.2,7.2)
[7.2,10.2)
[10.2,13.2)
[13.2,16.2)
[16.2,19.2)
[19.2,22.2)
[22.2,25.2)
[25.2,28.2]
合计
【环节二】探索方法,明确工具
分组 频数 频率
[1.2,4.2) 23 0.23
[4.2,7.2) 32 0.32
[7.2,10.2) 13 0.13
[10.2,13.2) 9 0.09
[13.2,16.2) 9 0.09
[16.2,19.2) 5 0.05
[19.2,22.2) 3 0.03
[22.2,25.2) 4 0.04
[25.2,28.2] 2 0.02
合计 100 1.00
(4)列频率分布表:
频率/组距
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
(5)画频率分布直方图:
组距×
组距
频率
频率:小长方形的面积 =
:
小长方形的高度;
反映各组样本观测数据的疏密程度;
【环节二】探索方法,明确工具
所有小长方形的面积总和=1
=频率
组距
频率
面积=宽×高=组距X
(1)每个小长方形的宽表示什么?高表示什么?
组距
频率/组距
观察频率分布直方图,回答以下问题:
(2)每个小长方形的面积表示什么?
(3)所有小长方形的面积之和等于多少?
表 示 数 据
【环节二】探索方法,明确工具
问题 4:观察下列频率分布表和频率分布直方图,说说数据中蕴含了哪些有用的信息?试用适当的语言描述居民用户月均用水量的分布规律.
【环节三】探索方法,明确工具
追问1:月均用水量在哪个区间占的比例最大?哪个区间最小?说明什么问题?
从图中你能得知该地区用户月度平均用水量的哪些信息?
追问1 局部分析:月均用水量在哪个区间占的比例最大?哪个区间最小?说明什么问题?
追问2 整体观察:这组数据的分布是对称还是不对称?有什么特征?
追问3 统计推断:根据样本的分布,如何估计全市居民月均用水量的分布规律?
追问4 实际应用:如果希望70%的居民不受影响,你认为用水标准a大约定为多少比较合理?
【环节四】应用迁移——图中“读”出规律
频率分布直方图的优点:把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.
观察频率分布直方图,回答以下问题:
(1)从在整体来看,月均用水量样本观测数据的分布是怎样的?
是不对称的,图形左边高,右边低,右边有一个较长的尾巴.
(2)大部分居民用户月均用水量处于较高值区域还是较低值区域?在哪个区域最为集中?
较低值区域
[1.2,7.2)
(3)随着月均用水量的增加,居民用户数呈现什么趋势?
呈降低趋势
0.013
0.077
0.030
0.030
0.017
0.107
0.043
0.010
0.007
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
频率/组距
【环节四】应用迁移——图中“读”出规律
思考3:以其它组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图如下图.观察图形,你发现不同组数对于直方图呈现数据分布规律有什么影响?
【环节四】应用迁移——图中“读”出规律
当频率分布直方图的组数少、组距大时,从中容易看出数据整体的分布特点,但无法看出每组内的数据分布情况,损失了较多的原始数据信息;
当频率分布直方图的组数多、组距小时,保留了较多原始数据信息,但小长方形较多,有时图形会变得非常不规则,从中不易看出总体数据的分布特点.
【环节四】应用迁移——图中“读”出规律
画频率分布直方图的步骤
求极差
决定组距和组数
将数据分组
列频率分布表
画频率分布直方图
【环节四】应用迁移——图中“读”出规律
1、某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间范围是,样本数据分组为根据直方图,_________,这200名学生中每周的自习时间不少于22.5小时的人数是_____.
【答案】:,.
自习时间/小时
频率/组距
O
20
22.5
17.5
25
27.5
30
0.02
0.16
0.10
a
0.04
【环节五】学以致用——典型例题与巩固练习
2、从小区抽取户居民用户进行月用电量调查,发现用电量都之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1) 直方图中的值为________;
(2) 在被调查的用户中,用电量落在区间内的户数为_______.
【答案】:,.
【环节五】学以致用——典型例题与巩固练习
3、如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次. 胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图
(1) 通话时长在区间[15,20),[20,30) 内的次数分别为多少?
(2) 区间[20, 30)上的小长方形高度低于[15, 20)上的小长方形的高度,说明什么?
解:(1) 通话时长在区间15,20),[20,30)内的次数分别为9次和12次.
(2) 区间[20,30)内的通话次数 少于区间[15,20内的通话次数.
【环节五】学以致用——典型例题与巩固练习
4、为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测验,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2 : 4 : 17 : 15 : 9 : 3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体
高一年级学生的达标率是多少?
【环节五】学以致用——典型例题与巩固练习
4、从左到右各小矩形的面积之比为2 : 4 : 17 : 15 : 9 : 3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
解:(1)频率分布直方图是以面积的形式反映了数据落在各小组的频率大小的,因此第二小组的频率为.
又因为第二小组的频率,
所以样本容量
【环节五】学以致用——典型例题与巩固练习
4、从左到右各小矩形的面积之比为2 : 4 : 17 : 15 : 9 : 3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
解:(1)频率分布直方图是以面积的形式反映了数据落在各小组的频率大小的,因此第二小组的频率为.
又因为第二小组的频率,
所以样本容量
【环节五】学以致用——典型例题与巩固练习
4、从左到右各小矩形的面积之比为2 : 4 : 17 : 15 : 9 : 3,第二小组的频数为12.
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
解:(2)由频率分布直方图可估计该校高一年级学生的达标率为
【环节五】学以致用——典型例题与巩固练习
本节课你学习到了什么?
(知识?方法?思想?)
【环节五】课堂小结——回顾提炼,升华认知
34
总体取值规律的估计
求极差
将数据分组
列频率分布表
五大步骤
画频率分布直方图
样本估计总体
决定组距与组数
画频率分布直方图
应用
回顾本节课所学内容,你学到了什么?
【环节五】课堂小结——回顾提炼,升华认知
频率分布直方图的优点:把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.
所有小长方形的面积总和=1
=频率
组距
频率
面积=宽×高=组距X
(1)每个小长方形的宽表示什么?高表示什么?
组距
频率/组距
二、频率分布直方图的意义:
(2)每个小长方形的面积表示什么?
(3)所有小长方形的面积之和等于多少?
表 示 数 据
【环节五】课堂小结——回顾提炼,升华认知
频率分布直方图的优点:把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.
1.教材198-199页——练习2,3(作业本);
情境引入:
课后作业
2.教材第 189 页习题9.1第6、7、8 题(作业本);
感谢大家的聆听
授课人:张发松 学 校:昆明市呈贡区第一中学
38
$