内容正文:
第2课时 分层抽样
课程标准
素养解读
1.通过实例,了解分层随机抽样的特点和适用范围
2.了解分层随机抽样的必要性,掌握各层样本量比例分配的方法
3.结合具体实例,掌握分层随机抽样的样本均值
在分层随机抽样的实施过程中,掌握分层随机抽样的抽样步骤,发展学生的数据分析素养
[情境引入]
某市为调查中小学生的近视情况,在全市范围内对小学生、初中生、高中生三个群体抽样,进而了解中小学生近视的总体情况和三个群体近视情况的差异大小.
问题 (1)上述问题中总体有什么特征?
(2)采用抽签法合适吗?若不合适,应该用什么方法抽取样本?
提示 (1)该总体中,小学生、初中生、高中生三个群体的近视情况存在着明显的差异.
(2)不合适,若用抽签法,抽取的样本可能集中于某一个群体,不具有代表性.应该用分层随机抽样抽取样本.
[知识梳理]
[知识点一] 分层抽样的概念
在抽样时,将总体分成 互不交叉 的层,然后按照 一定比例 从各层 独立地 抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
1.为什么要将总体分成互不交叉的层?
提示:在总体中由于个体之间存在着明显的差异,为了抽取的样本更合理、更具有代表性,所以将总体分成互不交叉的层,而后独立地抽取一定数量的个体.
[知识点二] 分层抽样的适用条件
分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持 样本结构 与 总体结构 的一致性,这对提高样本的代表性非常重要.当总体是由 差异明显 的几个部分组成时,往往选用分层抽样的方法.
2.某县为了解中小学生平时零花钱问题,为了节省人力、物力、财力,只在位于县城的几所中小学按小学、初中、高中在校人数分层抽取了一部分学生了解情况,你认为这样科学吗?说明理由.
提示:这种抽样不科学.因为影响学生零花钱的不只有学生的年龄,同时城镇学生和农村学生零花钱也会有区别.所以这样分层不合理.
[预习自测]
1.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取 ____________ 名学生( )
A.10 B.15 C.20 D.25
答案:B
2.某校高三年级有男生500人,女生400人,为了了解该年级学生的健康状况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )
A.简单随机抽样法 B.抽签法
C.随机数法 D.分层抽样法
解析:D [男生500人中抽取25人,女生400人中抽取20人,抽取的比例相同,用的是分层抽样法.]
3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们身体状况的某项指标,按照老、中、青三个年龄层次进行分层抽样.已知在青年人中抽了18人,那么该单位抽取的样本容量为( )
A.27 B.36 C.54 D.81
解析:B [样本容量==36.]
4.某校高一、高二、高三分别有学生1 600名,1 200名,800名,为了解该校高中学生的牙齿健康状况,按各年级的学生数进行分层抽样,若高三抽取20名学生,则高一、高二共抽取的学生数为 ________ .
解析:设高一、高二共抽取的学生数为n,由题意得=, 得n=70.
答案:70
5.一批产品中,有一级品100个,二级品60个,三级品40个,从这批产品中抽取一个容量为20的样本,应如何抽取?
解析:采用分层抽样可按一、二、三级品的个数之比5∶3∶2,从一级品中抽取10个,从二级品中抽取6个,从三级品中抽取4个.抽取时,将一级品中100个产品按00,01,02,…,99编号;将二级品中的60个产品按00,01,02,…,59编号,将三级品中的40个产品按00,01,02,…,39编号,用随机数表法分别抽取10个,6个,4个产品,这样取得一个容量为20的样本.
对分层随机抽样概念的理解
[例1] (1)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.随机数法
C.简单随机抽样 D.分层随机抽样
(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行( )
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取的个体数量相同
[思路点拨] 由于总体是由差异明显的几部分组成的,所以,应采用分层抽样法抽取.
[解析] (1)总体由差异明显的三部分构成,应选用分层随机抽样.
(2)为了保证每个个体等可能的被抽取,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.
[答案] (1)D (2)C
1.使用分层随机抽样的前提
分层随机抽样的总体按一个或多个变量划分成若干个子总体,并且每一个个体属于且仅属于一个子总体,而层内个体间差异较小.
2.使用分层随机抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层随机抽样为保证每个个体等可能抽取,需遵循在各层中进行简单随机抽样,每层样本量与每层个体数量的比等于抽样比.
[变式训练]
1.在下列问题中,各采用什么抽样方法抽取样本?
(1)从20台彩电中抽取4台进行质量检验;
(2)光远中学有180名教职工,其中教师136名,管理人员20名,后勤服务人员24名,为征求某项意见,现从中抽取一个容量为15的样本.
解析:(1)所述问题中总体中的个体数和样本容量均较少,故宜用简单随机抽样法;(2)所述问题的总体中的个体具有明显差异,即出现了3个阶层,因此适宜用分层抽样法.
答案:(1)简单随机抽样;(2)分层抽样.
分层抽样的应用
[例2] 某城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.
[思路点拨] 由题目可以获取以下主要信息:
①某城市的百货商店包括差异明显的大、中、小型商店三种;
②总体容量为210;
③样本容量为21.
解答本题应按分层抽样的步骤抽取,首先算出抽样比例,然后求出各层抽样的样本数,最后在各层抽取得到样本.
[解析] (1)样本容量与总体的个体数的比为=;
(2)确定各种商店要抽取的数目;
大型:20×=2(家),中型:40×=4(家),
小型:150×=15(家);
(3)采用简单随机抽样在各层中抽取大型:2家;中型:4家;小型:15家;
这样便得到了所要抽取的样本.
1.使用分层抽样的前提
分层抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
2.使用分层抽样应遵循的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
3.分层抽样的步骤
[变式训练]
2.一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层随机抽样的方法.
具体过程如下:
第一步,将3万人分为5层,一个乡镇为一层.
第二步,按照抽样比求得各乡镇应抽取的人数分别为60,40,100,40,60.
第三步,采用简单随机抽样的方法,按照各层抽取的人数抽取各乡镇的样本.
第四步,将300人合到一起,即得到一个样本.
分层随机抽样中的计算问题
[例3] (1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101 B.808
C.1212 D.2012
(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层随机抽样方法抽取容量为100的样本,则应从C中抽取 ________ 个个体.
(3)分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为 ________ .
[思路点拨] 样本容量比上总体容量等于抽样比例,用抽样比例乘以各层的样本容量等于在每层抽取的个体数.
[解析] (1)因为甲社区有驾驶员96人,并且在甲社区抽取的驾驶员的人数为12,
所以抽取驾驶员的抽样比为=,
所以驾驶员的总人数为(12+21+25+43)÷=808.
(2)∵A,B,C三层个体数之比为5∶3∶2,又由总体中每个个体被抽到的概率相等,∴分层随机抽样应从C中抽取100×=20(个)个体.
(3)=×3+×8=6.
[答案] (1)B (2)20 (3)6
(1)进行分层随机抽样的相关计算时,常用到的两个关系
①=;
②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(2)样本的平均数和各层的样本平均数的关系为:
=+=+.
[变式训练]
3.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层随机抽样法抽取一个容量为90的样本,应在这三校分别抽取学生( )
A.30人,30人,30人 B.30人,45人,15人
C.20人,30人,40人 D.30人,50人,10人
解析:B [先求抽样比==,再各层按抽样比分别抽取,甲校抽取3 600×=30(人),乙校抽取5 400×=45(人),丙校抽取1 800×=15(人),故选B.]
1.从一个容量为m(m≥3,m∈N)的总体中抽取一个容量为3的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
解析:D [因为在简单随机抽样时每个个体被抽到的可能性相等,所以选取分层抽样方法抽取样本时,总体中每个个体被抽中的可能性仍为.]
2.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150 C.200 D.250
解析:A [由题意得,=,
解得n=100,故选A.]
3.我国古代数学名著《九章算术》中有如下问题“今有北乡算八千七百五十八,西乡算七千二百三十六,南乡算八千三百五十六,凡三乡,发役三百七十八人,欲以算数多少出之,问各几何?”意思是:北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,问从各乡征集多少人?在上述问题中,需从西乡征集的人数大约是( )
A.102 B.112 C.130 D.136
解析:B [因为北乡有8 758人,西乡有7 236人,南乡有8 356人,现要按人数多少从三乡共征集378人,故需从西乡征集的人数是378×≈112.]
4.一个班共有54人,其中男同学、女同学人数之比为5∶4,若采用分层抽样的方法抽取9人参加活动,则每个男同学被抽取的可能性为 ________ ,每个女同学被抽取的可能性为 ________ .
解析:男、女每人被抽取的可能性是相同的,因为男同学共有54×=30(人),女同学共有54×=24(人),所以每个男同学被抽取的可能性为=,每个女同学被抽取的可能性为=.
答案:
5.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:
学历
35岁以下
35~50岁
50岁以上
本科
80
30
20
研究生
x
20
y
(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;
(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为,求x,y的值.
解:(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,设抽取学历为本科的人数为m,所以=,解得m=3.
抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.
从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3).
其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).所以从中任取2人,至少有1人学历为研究生的概率为.
(2)由题意,得=,解得N=78.所以35~50岁中被抽取的人数为78-48-10=20,所以==,解得x=40,y=5.即x,y的值分别为40,5.
学科网(北京)股份有限公司
$$