内容正文:
第九章 统计
9.1 随机抽样
9.1.2 分层随机抽样
【学习目标】
1. 理解分层随机抽样的定义与核心特征,掌握样本量比例分配的计算方法,能根据总体分层情况合理确定各层抽样数量.
1. 理解分层随机抽样中样本均值与总体均值的关系,能熟练计算样本均值并估计总体均值.
1. 体会统计方法在实际问题中的应用,提升数据分析、数学运算与逻辑推理核心素养.
【学习重点】
1. 分层随机抽样的定义及比例分配.
2.
各层样本量的计算:( 为第 层个体数, 为总体总数, 为样本容量).
3.
用分层随机抽样的样本平均数估计总体平均数:,或 .
【学习难点】
1. 理解分层抽样的“层内差异小、层间差异大”的合理性.
2. 掌握总体平均数的估计公式及其与简单随机抽样的比较.
3. 实际应用中选择合适的分层变量.
学习任务一 分层随机抽样的概念与必要性
【合作探究】
1. 问题引入:
· 在上节课的简单随机抽样中,我们发现有些样本平均数大幅度偏离总体平均数,产生“极端样本”.
· 例如,在高一年级学生身高调查中,若样本中恰好包含了大量矮个子学生,就会低估总体平均身高.
· 如何避免这种极端情况?
· 思路:将总体按某些特征(如性别)分成若干个“层”,使层内个体差异较小,然后在每一层内独立地进行简单随机抽样,最后将各层样本合并.这种方法叫做分层随机抽样.
1. 分层随机抽样的定义:
· 按一个或多个变量将总体划分成若干个子总体(每个个体属于且仅属于一个子总体),在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.每一个子总体称为一个层.
1. 比例分配:
·
如果每层样本量都与层的大小成比例,即第 层抽取的样本量 ( 为第 层个体数, 为总体总数, 为样本容量),则称这种样本量的分配方式为比例分配.
· 比例分配保证了每个个体被抽到的概率相等,体现了公平性.
1. 思考:
1. 为什么分层随机抽样能减少极端样本?
· (因为层内个体差异小,每层独立抽样,不会让某一特征在样本中过度集中或缺失.)
2. 下列情况适合用分层随机抽样吗?
· (1) 调查全校学生的平均身高,按年级分层.
· (2) 调查一批零件的合格率,零件由三台不同机器生产,按机器分层.
· 答:均适合,因为层内差异小,层间差异大.
【自主梳理】
1. 分层随机抽样:将总体分层,每层独立简单随机抽样,再合并.
1.
比例分配:.
1. 优点:能有效避免极端样本,提高估计精度,尤其当层内差异小、层间差异大时效果更好.
学习任务二 分层随机抽样的步骤与样本量计算
【合作探究】
1. 分层随机抽样的步骤:
· (1) 分层:根据研究目的和变量特征,将总体分成若干层(层内差异小,层间差异大).
·
(2) 确定样本容量 .
·
(3) 计算各层应抽取的样本量 (比例分配).
· (4) 在每一层内独立地进行简单随机抽样,得到各层样本.
· (5) 将各层样本合并,得到总样本.
1. 例题:
· 某学校学生由小学部、初中部、高中部构成.小学部与初中部共有700人,该校采用按比例分配的分层随机抽样方法抽取12名学生进行家访,若高中部抽取了5名学生,则该校高中部有多少名学生?
·
解:设高中部人数为 ,则总人数 .
·
高中部抽样比例 ,解得 ,,,.
·
所以高中部有 名学生.
1. 思考:
如果各层样本量分配不是比例分配,会有什么影响?
· (可能破坏等概率性,导致估计有偏.)
【自主梳理】
1.
样本量比例分配公式:.
2. 已知部分层样本量和总样本量,可求该层总体量.
学习任务三 用分层随机抽样的样本估计总体平均数
【合作探究】
1. 总体平均数的估计:
·
设总体分为 层,第 层的个体数为 ,总体均值为 .从第 层抽取容量为 的样本,样本均值为 .则总体均值的估计量为:
· 当采用比例分配时,该估计量是无偏的.
1. 例题:
·
树人中学高一年级有男生326名,女生386名.现用按比例分配的分层随机抽样方法,从男生和女生中分别抽取样本,测得男生样本平均身高为 cm,女生样本平均身高为 cm.试估计高一年级全体学生的平均身高.
· 解:总体均值估计
·
cm.
·
故估计平均身高约为 cm.
1. 比较分层抽样与简单随机抽样:
· 通过多次试验发现:
(1) 分层抽样的样本平均数也围绕总体平均数波动.
(2) 但与简单随机抽样相比,分层抽样的样本平均数波动幅度更均匀,出现极端偏离的样本更少.
(3) 当总体内个体差异较大时,分层抽样的估计效果通常优于简单随机抽样.
1. 思考:
(1) 为什么分层抽样有时没有明显优于简单随机抽样?
· (当层内差异也较大时,分层优势不明显;另外样本量较小时,随机性影响大.)
(2) 分层变量应如何选择?
· (应选择与调查指标相关性强的变量,且能显著区分层间差异.)
【自主梳理】
1.
总体均值估计:.
2. 分层随机抽样在总体差异大时优于简单随机抽样.
3. 分层抽样的样本平均数波动更温和,极端值较少.
学习任务四 分层随机抽样的实际应用
【合作探究】
1. 例题:
· 某地区有5个乡镇,人口分别为 1.2万、0.8万、2.0万、0.8万、1.2万,现要调查该地区某种疾病的发病率,由于各乡镇发病情况差异明显,决定采用分层随机抽样,从该地区3万人中抽取300人作为样本.请设计抽样方案.
· 解:
· (1) 将5个乡镇各作为一层.
·
(2) 总人口 万?注意:题目给出总人数3万,但各乡镇数字可能是比例?实际数据:1.2,0.8,2.0,0.8,1.2 之和为6.0,但总人口为3万,说明这些数字可能是以“万人”为单位,总和6万人,与实际3万不符.推测这些数字是“万人”但总人口是3万,可能是数字示例.为计算方便,直接用:
·
各层人数:万,万,万,万,万,总和 万.样本容量 .
· 各层抽取人数:
·
,,,,.
· (3) 在各乡镇内独立进行简单随机抽样,抽取相应人数.
· (4) 将抽得的300人合在一起,构成样本.
1. 拓展:
· 如果已知各层样本均值和层人数,可直接用公式估计总体均值.若还知道各层的方差,可进一步计算估计量的方差.
【自主梳理】
1. 分层抽样适用于总体由差异明显的几部分构成的情况.
2. 实际设计时,需先获取各层个体数,再按比例分配样本量.
3. 每层内采用简单随机抽样.
【自查自纠】(正误判断)
1. 分层随机抽样中,各层样本量必须与该层个体数成正比. ( )
1. 分层随机抽样一定能比简单随机抽样得到更精确的估计. ( )
1.
分层随机抽样的估计量公式为 . ( )
1. 分层时,应使层内差异尽可能大,层间差异尽可能小. ( )
1. 在比例分配下,每个个体被抽到的概率相等. ( )
答案:1.√ 2.× 3.√ 4.× 5.√
【典例分析】
例1:某学校学生由三个年级组成,高一年级600人,高二年级500人,高三年级400人.现用比例分配的分层随机抽样抽取一个容量为150的样本,则高一、高二、高三年级各应抽取多少人?
解:总人数 .
高一:;高二:;高三:.
答:高一60人,高二50人,高三40人.
例2:某电视台为了解观众对某节目的满意度,按性别分层随机抽样,从男观众中抽50人,平均评分8.2分;从女观众中抽50人,平均评分7.8分.已知总体中男观众占60%,女观众占40%.试求总体平均评分的估计值.
解: 分.
例3:已知某工厂有甲、乙、丙三个车间,人数分别为200、300、500.现采用分层随机抽样抽取一个容量为100的样本,测得三个车间样本的平均产量分别为 10.2、9.8、10.5 吨,估计全厂平均产量.
解:总人数 .
吨.
【习题巩固】
1. 某学校高中部有高一、高二、高三三个年级,其中高一年级800人,高二年级750人,高三年级650人.现用分层随机抽样抽取一个容量为110的样本,则高三年级应抽取( )
· A. 30人 B. 32人 C. 33人 D. 35人
1. 某地区有城市人口120万,农村人口80万.为了调查居民收入情况,采用分层随机抽样,从城市居民中抽取了300人,从农村居民中抽取了200人.则样本中城市人口的比例与总体中城市人口的比例( )
· A. 相等 B. 不相等 C. 可能相等 D. 无法确定
1. 某工厂有甲、乙两条生产线,甲生产线生产了400件产品,乙生产线生产了600件产品.现用分层随机抽样抽取一个容量为50的样本进行质量检验,则甲生产线应抽取( )件产品.
· A. 20 B. 25 C. 30 D. 40
1. 某校有男生500人,女生400人,用比例分配的分层随机抽样抽取了一个容量为90的样本,测得男生平均身高172 cm,女生平均身高160 cm,则估计全校学生的平均身高为______ cm.
1. (选做)某地区有5个乡镇,人口数分别为 1.2万、0.8万、2.0万、0.8万、1.2万,现要调查该地区居民的年收入,采用分层随机抽样抽取500人,请设计抽样方案(写出各层应抽人数).
【参考答案】
自查自纠:1.√ 2.× 3.√ 4.× 5.√
习题巩固:
1.
C(,取整约33人,但比例分配应为精确值,实际可能取32或33,题目选最接近的33,但严格计算应得32.5,若人数为整数需调整,此处按比例得32.5,但选项无32.5,可能数据设计为整数:,约33人.)
1. A(比例分配时样本比例与总体比例相等)
1.
A(甲)
1.
cm
1.
总人口数 万,.
· 各层应抽人数:
·
乡镇1:;
·
乡镇2:,取 67;
·
乡镇3:,取 167;
·
乡镇4:,取 67;
·
乡镇5:.
·
总和为 ,可调整为 100,66,167,66,101 等,总和500.
学科网(北京)股份有限公司
$