内容正文:
9.2.4 总体离散程度的估计(2)
授课人:张发松 学 校:昆明市呈贡区第一中学
1
目标导航
1.掌握总体与样本的方差、平均差公式,了解方差和标准差的性质。
2. 掌握分层随机抽样均值、方差的计算方法,能区分简单随机抽样与分层随机抽样统计量的差异
3.理解分层随机抽样中层内波动、层间波动的双重结构,会用分层样本的均值与方差估计总体的集中趋势与离散程度。
4. 能从数据波动性的角度对实际问题作出分析判断,会用样本的方差和标准差估计总体的离散程度,体会“用样本估计总体”的统计思想,发展数据分析素养.
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
2
内容解析
核心问题:分层随机抽样的均值与方差,其本质是加权平均数(按比例贡献)思想在统计推断中的具体应用和拓展。
当不能获得全部样本的原始数据,只知道各层的样本均值和方差、以及各层样本量时,仍然可以计算出总样本的数字特征——这里的核心思想是 “按权重合并” :每一层的信息并不是等同的,其权重取决于该层样本量占总体样本量的比例。在已知各层数据特征的前提下推算出总样本特征,体现了统计中“从部分数据推知整体信息”的核心逻辑。
加权平均数公式将各层均值按权重合并得到总均值;而方差公式则进一步将总方差分解为“层内方差”与“层间方差”两部分,揭示了总方差的来源:它既包含各层内部的波动,也包含各层均值之间的差异。
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
3
内容解析
结构本质:简单随机抽样数据为均质整体,而分层随机抽样数据具层内差异小层间差异大的结构特征,总体由若干均值不同、波动不同的子层构成,不能直接套用简单随机抽样公式。
均值本质:分层抽样总体样本均值是各层均值以样本量为权重的加权平均值,体现“按比例贡献、整体均衡”的统计原则。
方差本质:分层抽样样本方差是双重波动的合成,即分层总方差=层内加权平均波动+层间加权均值波动。层内方差刻画各层内部数据的离散程度,层间偏差刻画各层整体水平的差异,完整解释分层数据的离散来源。
请注意:
1.正文标题为:黑体,30号字;
2.正文内容为:华文楷体,尽量不小于24号,特殊辅助性文字不低于18;根据文字量可适当调整。内容文字一行一般不能超过28个字,单页文字一般不能超过8行。
3.拍摄版本呈现内容务必与上传版本呈现的内容完全一致。
英文
1.正文标题为:以Times New Roman为主,可搭配使用Arial。字号为32—36号,特别强调可以用40号。
2.正文内容为:以Times New Roman为主,可搭配使用Arial。字号为24—28号,特别强调可用32号。
3.英文每行一般不能超过15个单词;单页文字一般不能超过8行。
4
问题1:前面学习了哪些抽样的方法?如何选择恰当的方法进行抽样?
简单随机抽样与分层随机抽样;
当总体有明显的层次差异时用分层随机抽样.
问题2:如何计算样本数据的均值?
如果在n个数据中,x1出现f1次,x2出现f2次xk出现fk次(f1+f2++fk=n),
那么这n个数的加权平均数是
【环节一】复习旧知----制造冲突
按比例贡献、整体均衡
例1:某教研部门对本地区A,B,C三所学校高三年级进行教学质量抽样调查,研究人员用分层随机抽样的方法从三所学校中共抽取20个班级进行调查,得到这三所学校所抽取班级的数量、平均数如下:
学校 A B C
数量/个 5 10 5
平均数 85 90 95
求抽取到的20个班级的平均数.
解:
【环节二】探究分层抽样的平均数的计算
按比例贡献、整体均衡
分层加权平均数
1.计算方差常用公式
(1)定义法:s2=[(x1-)2+(x2-)2+…+(xn-)2];
(2)简化法:s2=[(++…+)-n].
标准差和方差刻画了数据的离散程度或波动幅度.
标准差(或方差)越大,数据的离散程度越大,越不稳定;
标准差(或方差)越小,数据的离散程度越小,越稳定.
【环节一】复习旧知----制造冲突
集中趋势与离散程度是描述数据分布的两大基本维度。
集中趋势回答了“数据中心在哪里”,
离散程度则回答了“数据有多散”。
1.计算方差常用公式
(1)定义法:s2=[(x1-)2+(x2-)2+…+(xn-)2];
(2)简化法:s2=[(++…+)-n].
标准差和方差刻画了数据的离散程度或波动幅度.
标准差(或方差)越大,数据的离散程度越大,越不稳定;
标准差(或方差)越小,数据的离散程度越小,越稳定.
【环节一】复习旧知----制造冲突
集中趋势与离散程度是描述数据分布的两大基本维度。
集中趋势回答了“数据中心在哪里”,
离散程度则回答了“数据有多散”。
【追问1】具有线性关系的一组数据,他们的平均数、方差有什么关系?
已知一组数据x1,x2,…,xn的平均数是 ,方差是 s2 ,
那么下列各组数据的平均数、方差和标准差分别是什么?
【环节二】探究平均数、方差的性质
例2 已知一组数据为: x1,x2,…,xn,平均数记为,方差记为sx2 ,标准差为s,计算下列各组数据的平均数,方差和标准差。
【环节二】探究平均数、方差的性质
例2 已知一组数据为: x1,x2,…,xn,平均数记为,方差记为sx2 ,标准差为s,计算下列各组数据的平均数,方差和标准差。
【环节二】探究平均数、方差的性质
例2 已知一组数据为: x1,x2,…,xn,平均数记为x,方差记为sx2 ,标准差为s,计算下列各组数据的平均数,方差和标准差。
【环节二】探究平均数、方差的性质
平均数、方差性质
【环节二】探究平均数、方差的性质
【环节三】深化理解——分层抽样方差的公式推导
【环节三】深化理解——分层抽样方差的公式推导
【环节三】深化理解——分层抽样方差的公式推导
把第一层样本记为: x1,x2,…,xm,平均数记为x,方差记为sx2 ;
把第二层样本记为: y1,y2,…,yn,平均数记为y,方差记为sy2 ;
把总样本数据的平均数记为z,方差记为s2 . 则
【环节三】深化理解——分层抽样方差的公式推导
各层均值按权重合并得到总均值
总方差= 层内加权平均波动 + 层间加权离均值平方波动
总离差平方和 = 各层内离差平方和 + 各层的组间离差平方和
计算分层随机抽样的方差s2的步骤
(1)确定,,,;
(2)确定;
(3)应用公式s2=[+(-)2]+[+(-)2] 计算s2.
【环节三】深化理解——分层抽样方差的公式推导
【环节三】深化理解——分层抽样方差的公式推导
分层抽样总样本方差的计算
如果分三层的分层抽样的总样本的均值和方差怎么计算?
【例3】一组样本数据分为甲、乙两组,用分层随机抽样的方法从甲组中抽取6个数,其平均数为10,方差为50;从乙组中抽取4个数,其平均数为15,方差为55,则估计这个样本的平均数为 ,方差为 .
【环节四】应用巩固——典例精讲
练一练:某班为了了解学生每周购买零食的支出情况,利用分层随机抽样抽取了一个15人的样本统计如下:
学生数 平均支出 方差
男生 9 40 6
女生 6 35 4
求这15名学生每周购买零食的平均费用和方差.
解:
【环节五】分层训练——当堂巩固
【例4】甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为80.5分,方差为500;乙班的平均成绩为85分,方差为360.那么甲、乙两班全部90名同学的平均成绩和方差分别是多少?
解 设甲班50名同学的成绩分别为a1,a2,⋯,a50,那么甲班的平均成绩、权重和方差分别是
设乙班40名同学的成绩分别为b1,b2,⋯,b40,那么乙班的平均成绩、权重和方差分别是
【环节五】分层训练——当堂巩固
【环节五】总结反思——建构离散程度认知体系
1、分层抽样下总样本均值的公式是怎样的?为什么用权重 wk而非简单平均?权重的含义是什么?
2、分层抽样总样本方差的公式有何结构特征?总方差 = 层内方差 + 层间方差,这个分解有何统计意义?
3 、回顾本节课的学习,你最大的收获是什么?
分层均值看加权,分层方差两层藏,层内波动稳基底,层间差异定整体
23
回顾本节课所学内容,你学到了什么?
【环节六】总结升华,体系建构
均值本质:分层抽样总体样本均值是各层均值以样本量为权重的加权平均值,体现“按比例贡献、整体均衡”的统计原则。
方差本质:分层抽样样本方差是双重波动的合成,即分层总方差=层内平均波动+层间均值波动。层内方差刻画各层内部数据的离散程度,层间偏差刻画各层整体水平的差异,完整解释分层数据的离散来源。
核心思想:延续统计核心逻辑——用平均偏离刻画波动、用样本统计量估计总体参数,通过加权修正适配分层数据结构,解决异质总体的数据分析问题,体现分类、加权、量化建模的数学思想。
分层随机抽样的平均数:
一般地,设样本中不同层的平均数和相应权重分别为,和,
则这个样本的平均数为,
为了简化表示,引进求和符号,记作
分层随机抽样的方差和标准差
分层随机抽样的方差计算:
设样本容量为,平均数为,其中两层的个体数量分别为,,
两层的平均数分别为,,方差分别为,,
则这个样本的方差为:.
【环节六】总结升华,体系建构
1.教材215页——练习2、5(作业本);
情境引入:
课后作业
2.教材第 218页习题9.2第11 题(作业本);
感谢大家的聆听
授课人:张发松 学 校:昆明市呈贡区第一中学
27
$