内容正文:
人教A版2019必修第二册
9.1.2 分层随机抽样
第九章 统计
学习目标
1
2
3
通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性
掌握各层样本量比例分配的方法,结合具体实例,掌握分层随机抽样的样本均值
能根据实际问题的特点,设计恰当的抽样方法,培养数据分析的核心素养
复习回顾
概念
条件
公式
总体均值(总体平均数)
总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,
从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…yn,
样本均值(样本平均数)
创设情境
156.0 157.0 161.0 159.0 156.0 174.0 168.0 155.0 158.0 167.0
166.0 160.0 166.0 175.0 154.0 157.0 173.0 161.0 160.0 171.0
157.0 170.0 174.0 171.5 175.0 153.0 155.0 158.0 167.0 178.0
155.0 175.0 170.0 150.5 155.0 163.0 171.0 160.0 152.0 159.0
162.0 158.0 155.0 153.0 153.0 177.0 166.0 170.0 169.0 150.0
现再从高一学生中用简单随机抽样抽取50名学生,得到一组新的样本,身高值(单位:cm)如下:
在上一节课中,我们知道从树人中学医务室得到了高一年级学生身高的所有数据.经计算得,高一年级学生的平均身高为165.0cm.
经计算得样本平均身高为162.72cm.
新知探究
问题1.2 为什么运用简单随机抽样获取的样本中,会出现“极端”样本?
(1)高一年级学生的身高差异较大;
(2)样本抽取的随机性.
简单随机抽样存在不足,有必要探究其它的抽样方式.
问题1.3 如何减少“极端”样本的出现?
高中男生身高普遍高于女生的身高,相同性别的身高差异相对较小,把高一学生分成男生和女生两个身高有明显差异的群体.这样可以减少极端情况出现.
问题1.1 为什么样本平均数大幅度地偏离了总体平均数?
样本中的个体中
有大量的矮个子
“极端”样本
估计出现
较大误差
能否利用总体中的一些额外信息对抽样方法进行改进呢?
新知探究
问题2 在树人中学高一年级的712名学生中,男生有326名,女生有386名. 能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?
性别是影响身高的其中一个主要因素.
高中男生的身高普遍高于女生的身高,而相同性别的身高差异相对较小.
我们可利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本。
按照性别变量
高一年级的学生
男生
女生
男生样本
女生样本
抽样
抽样
总样本
子总体1
子总体2
总体
新知探究
问题3 对男生、女生分别进行简单随机抽样,样本量在男生、女生中应分别分配?
为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的群体应少抽一些.
即可按男生、女生在全体学生中所占的比例进行分配:
追问 每个学生被抽到的可能性(概率)相等吗?
无论是男生还是女生,每个学生抽到的概率都相等.
均为
当总样本量为50时,我们就可以计算出从男生、女生分别应抽取的人数为
新知探究
男生
173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 164.0 173.0 172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0 167.0 170.0 175.0
女生
163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0
我们按上述方法抽取了一个容量为50的样本,其观测数据(单位:)如下:
男生身高的样本平均数为170.6
男生身高的总体平均数约为170.6
估计
女生身高的样本平均数为160.6
女生身高的总体平均数约为160.6
估计
根据男生、女生身高的样本平均数以及它们各自的人数,可以估计总体平均数为
所以树人中学高一年级学生的平均身高大约在165.2cm左右.
概念生成
分层随机抽样
一般地,按 变量把总体划分成若干个 ,每个个体 一个子总体,在每个子总体中独立地进行 ,再把所有子总体中抽取的样本合在一起作为 ,这样的抽样方法称为分层随机抽样.
每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为 .
一个或多个
子总体
属于且仅属于
简单随机抽样
总样本
比例分配
每一层抽取的样本数=
×总样本量
该层个体数
总体个体数
=抽样比例
×该层个体数
典例分析
例1 某单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及以上的有95人.为了了解该单位的职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,若职工年龄与这项指标有关,应该怎样抽取?
解:用分层随机抽样的方法来抽取样本,步骤如下:
第一步:分层.按年龄将500名职工分成三层,即不到35岁的职工,35岁至49岁的职工和50岁及以上的职工.
第二步:计算抽样比.
样本容量与总体容量的比为 =
第三步:确定分别从三类人员中抽取的人数,
从在不到35岁的职工中抽取 (人),
从在35岁至49岁的职工中抽取 (人),
从在50岁及以上的职工中抽取 (人);
第四步:在各层中用简单随机抽样方法依次抽取25人、56人、19人
第五步:把抽取的个体组合在一起,组成样本量为100的样本 .
新知探究
问题4 根据上面的例题,你能归纳出分层随机抽样的步骤吗?
分层
按某种特征将总体分成若干互不交叉的层
计算
抽样比
抽样比
定数
按抽样比确定每层抽取的个体数
抽样
各层分别按简单随机抽样的方法抽取样本
汇总
综合各层抽样,组成样本
注意:当总体是由差异明显的几个部分组成时, 往往选用分层随机抽样的方法.
新知探究
问题5 在简单随机抽样中如何估计总体平均数?
用样本平均数估计总体平均数
那么在分层随机抽样中,还能用样本平均数估计总体平均数吗?
先来了解一下在分层随机抽样中,总体平均数和样本平均数是如何表示的
在分层随机抽样中,如果层数分别为2层,
第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.
第1层总体的各个个体的变量值为:X1,X2,…,XM;
第1层样本的各个个体的变量值为:x1,x2,…,xm;
第2层总体的各个个体的变量值为:Y1,Y2,…,YN;
第2层样本的各个个体的变量值为:y1,y2,…,yn.
新知探究
总体平均数 样本平均数
第1层
第2层
总体
由于用第1层的样本平均数可以估计第1层的总体平均数,
用第2层的样本平均数可以估计第2层的总体平均数,
因此我们可以用: 估计总体平均数
新知探究
在比例分配的分层随机抽样中:
可得
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数
新知探究
问题6 与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,与上一小节P179的“探究”中相同样本量的简单随机抽样的结果比较,小明有了一个重要的发现.你是否也有所发现?
抽样序号
1 2 3 4 5 6 7 8 9 10
男生样本的平均数 170.0 170.7 169.8 171.7 172.7 171.9 171.6 170.6 172.6 170.9
女生样本的平均数 162.2 160.3 159.7 158.1 161.1 158.4 159.7 160.0 160.6 160.2
总样本的平均数 165.8 165.1 164.3 164.3 166.4 164.6 165.2 164.9 166.1 165.1
我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用下图形进行表示,其中粉红线表示整个年级学生身高的平均数.
新知探究
1. 分层抽样的样本平均的围绕总体平均数波动,与简单随机抽样的结果相比分层抽样并没有明显优于简单随机抽样。
2. 相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有的偏离总体平均数的幅度比较大的极端数据。
3. 分层随机抽样的结果并不是每一次都优于简单随机抽样。
简单随机抽样 1 2 3 4 5 6 7 8 9 10 165.2 162.8 164.4 164.4 165.6 164.8 165.3 164.3 165.7 165 分层随机抽样 1 2 3 4 5 6 7 8 9 10 165.8 165.1 164.3 164.3 166.4 164.6 165.2 164.9 166.1 165.1 实际值 1 2 3 4 5 6 7 8 9 10 165 165 165 165 165 165 165 165 165 165
探究小结
实际上,在个体之间差异较大的情形下, 只要选取的分层变量合适,使得各层间差异明显、层内差异不大, 分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法. 分层随机抽样的组织实施也比简单随机抽样方便, 而且除了能得到总体的估计外,还能得到每层的估计.
选择抽样方法的规律:
(1)当总体的个体数和样本量都较小时,可采用抽签法.
(2)当总体的个体数较大,样本量较小时,可采用随机数法.
(3)当总体按一个或多个变量可划分为若干个层时,采用分层随机抽样.
新知探究
问题7 简单随机抽样和分层随机抽样有哪些异同?
简单随机抽样 分层随机抽样
方法
要点
共同点
不同
点
相互
联系
适用
范围
随机→“搅拌均匀”→抽取
分层→比例→抽取
①抽样过程中每个个体被抽到的可能性相等
②每次抽出个体后不再放回,即不放回抽样
从总体中逐个随机抽取
将总体分成不交叉的若干层,
各层中按比例抽取
各层的抽样可采用简单随机抽样
总体中的个体总数较少
总体由差异明显的几个部分组成
学以致用
教材P184
证明:
学以致用
教材P184
解:这种说法有道理. 因为一个好的抽样方法,一般随着样本量的增加,抽样调查结果会越来越接近于普查的结果. 因此,只要根据误差控制范围的要求取相应的样本量进行调查,就可以节省人力、物力和财力.
2. 有人说:“如果抽样方法设计得好,用样本进行视力调查与对24300名学生进行视力普查的结果差不多,而且对于想要掌握学生视力状况的教育部门来说,节省了人力、物力和财力,抽样调查更可取.”你认为这种说法有道理吗?为什么?
学以致用
教材P184
3. 高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2 cm和160. 8 cm.
(1) 如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2) 如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
1. (1)下列问题中,最适合用分层随机抽样抽取样本的是( )
例题
A. 从10名同学中抽取3人参加座谈会
B. 某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解家庭购买力的某项指标,要从中抽取一个容量为100的样本
C. 从1 000名工人中,抽取100人调查上班途中所用时间
D. 从生产流水线上,抽取样本检查产品质量
能力提升
题型一
分层随机抽样的概念
B
能力提升
题型一
分层随机抽样的概念
1.(2)现要完成下列三项抽样调查:以下较为合理的抽样方法是( )
①从15种疫苗中抽取5种,检测是否合格;
②某科研所共有480名科研人员,其中具有高级职称的有48名,具有中级职称的有360名,具有初级职称的有72名.为了解该科研所科研人员的创新能力,拟抽取一个容量为20的样本;
③在中秋节前,某食品药品监督管理局从某品牌的10盒月饼中随机抽取3盒进行食品卫生检查.
A.①③简单随机抽样,②分层随机抽样 B.①②简单随机抽样,③分层随机抽样
C.②③简单随机抽样,①分层随机抽样 D.①简单随机抽样,②③分层随机抽样
例题
[解析] ①③中总体容量较少,且个体没有明显差别,适合用简单随机抽样.②中总体是由有明显差异的几部分组成的,适合用分层随机抽样.故选A.
A
能力提升
题型二
分层随机抽样中的设计
例题
2.某高级中学有学生270人,其中高一年级108人,高二、高三年级各81人,
现要抽取10人参加某项调查,考虑用分层随机抽样的方法,将学生按高一、
高二、高三年级依次编号,抽得的号码有下列四种情况,则符合分层随机抽
样的是________.(填序号)
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
[解析] 按照分层随机抽样的方法在高一年级应抽取4人,在高二、高三年级应各抽取3人,所以需要从 中取4个编号, 中取3个编号, 中取3个编号.④中,在 中取了3个编号, 中取了3个编号, 中取了4个编号,故不符合.
①②③
能力提升
题型二
分层随机抽样中的设计
例题
3.某电台就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000,其
中持各种态度的人数分布如下表所示,电视台为进一步了解观众的具体想法和
意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样(结果保留整数)?
喜爱程度 很喜爱 喜爱 一般 不喜爱
人数 2 435 4 567 3 926 1 072
[解析] 可用分层随机抽样的方法,按观众的喜爱程度进行分层,并确定每层抽取的人数.
总体中的个体数为 ,持“很喜爱”态度的人所占的比例为 故该层应抽取 人);
持“喜爱”态度的人所占的比例为 ,故该层应抽取 (人);
持“一般”态度的人所占的比例为 ,故该层应抽取 (人);
持“不喜爱”态度的人所占的比例为 ,故该层应抽取 (人).
因此采用分层随机抽样的方法在持“很喜爱”“喜爱”“一般”和“不喜爱”态度的人中分别抽取12人、23人、
20人和5人,组成样本量为60的样本.
能力提升
题型三
分层随机抽样中的相关计算
A
例题
4. 某高校为了了解本校学生的阅读情况,拟采用分层随机抽样的方法从该校四
个年级的学生中抽取一个容量为360的样本进行调查,大一与大二学生占全校学
生的一半,大三与大四学生人数之比为 则大四学生中应抽取的人数为( )
A. 72 B. 100 C. 108 D. 120
[解析] 因为大一与大二学生占全校学生的一半,大三与大四学生人数之比为 ,
所以大四学生占全校学生的 ,则大四学生中应抽取的人数为 ,故选A.
能力提升
题型三
分层随机抽样中的相关计算
例题
5. 某企业三月中旬生产 , , 三种产品共3 000件,根据分层随机抽样的
结果,企业统计员制作了如下的统计表:
产品类型
产品数量/件 1 300
样本量 130
由于不小心,表格中 , 两种产品的有关数据被污染了,统计员只记得 产品
的样本量比 产品的样本量多10,根据以上信息,求 产品的产品数量.
[解析] 易知抽样比为 ,即每10件产品中抽取1件产品,
又 产品的样本量比 产品的样本量多10,
所以 产品的产品数量是 (件).
课堂小结
一、分层随机抽样的概念.
在分层随机抽样中,如果每层样本都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3.各层抽取的样本量之比 = 总体中各层个体数之比
二、分层随机抽样的3个重要的关系.
三、用样本平均数 估计总体平均数 .
主讲:
人教A版2019必修第二册
感谢聆听
$$