内容正文:
2.2 分层抽样与系统抽样
[读教材·填要点]
1.分层抽样的概念
将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
2.系统抽样的概念
系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按相同的间隔(称为抽样距)抽取其他样本.
系统抽样又叫等距抽样或机械抽样.
[小问题·大思维]
1.分层抽样时为什么要将总体分成互不重叠的层?
提示:在总体中由于个体之间存在着明显的差异,为了使抽取的样本更合理,更具有代表性,所以将总体分成互不重叠的层,而后独立地抽取一定数量的个体.
2.系统抽样的第二步中,当不是整数时,从总体中剔除一些个体采用的方法是什么?影响系统抽样的公平性吗?
提示:剔除一些个体可以用简单随机抽样抽取,不影响系统抽样的公平性.
[研一题]
[例1] 某企业共有3 200名职工,其中青、中、老年职工的比例为3∶5∶2.若从所有职工中抽取一个容量为400的样本,则采用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?每人被抽到的可能性相同吗?
[自主解答] 因为总体由差异明显的三部分(青、中、老年)组成,所以采用分层抽样的方法更合理.
因为青、中、老年职工的比例是3∶5∶2,所以应分别抽取:
青年职工400×=200(人);
=120(人);中年职工400×
老年职工400×=80(人).
由样本容量为400,总体容量为3 200可知,抽样比是.,所以每人被抽到的可能性相同,均为=
[悟一法]
分层抽样的步骤:
(1)根据已经掌握的信息,将总体分成互不重叠的层;
(2)根据总体中的个体数N和样本容量n计算抽样比 k=;
(3)确定第i层应该抽取的个体数目ni=Ni×k(Ni为第i层所包含的个体数),使得各ni之和为n;
(4)在各层中,按步骤(3)中确定的数目在各层中随机地抽取个体,合在一起得到容量为n的样本.
[通一类]
1.某城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.
解:第一步:样本容量与总体容量的比为=15(家);第三步:采用简单随机抽样在各层中分别抽取大型商店2家,中型商店4家,小型商店15家,综合每层抽样即得样本.=4(家),小型商店:150×=2(家),中型商店:40×;第二步:确定各种商店要抽取的数目:大型商店:20×=
[研一题]
[例2] 相关部门对某食品厂生产的303盒月饼进行质量检验,需要从中抽取10盒,请用系统抽样法完成对此样本的抽取.
[自主解答] 第一步 将303盒月饼用随机的方式编号.
第二步 从总体中剔除3盒月饼,将剩下的300盒月饼重新编号(分别为000,001,…,299),并分成10段.
第三步 在第一段中用简单随机抽样抽取起始号码l.
第四步 将编号为l,l+30,l+2×30,…,l+9×30的个体取出,组成样本.
[悟一法]
1.当总体容量能被样本容量整除时,分段间隔k=;当用系统抽样抽取样本时,通常是将起始数s加上间隔k得到第2个个体编号(s+k),再加k得到第3个个体编号(s+2k),依次进行下去,直到获得整个样本.
2.当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体,但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几个个体后使总体中剩余的个体能被样本容量整除,然后再按系统抽样方法抽取样本.
[通一类]
2.为了了解某地区今年高一学生期末考试数学学科的成绩,拟从参加考试的15 000名学生的数学成绩中抽取容量为150的样本.请用系统抽样写出抽取过程.
解析:(1)对全体学生的数学成绩进行编号:1,2,3,…,15 000.
(2)分段:由于样本容量与总体容量的比是1∶100,所以我们将总体平均分为150个部分,其中每一部分包含100个个体.
(3)在第一部分即1号到100号用简单随机抽样抽取一个号码,比如是56.
(4)以56作为起始数,然后依次抽取156,256,356,…,14 956,这样就得到容量为150的一个样本.
[研一题]
[例3] 选择恰当的抽样方法,并写出抽样过程.
(1)有30个篮球,其中,甲厂生产的有21个,乙厂生产的有9个,现抽取10个作样品;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,现取出3个作样品;
(3)有甲厂生产的300个篮球,抽取10个作样品;
(4)有甲厂生产的300个篮球,从中抽取30个作样品.
[自主解答] (1)因总体是由差异明显的几部分构成,可采用分层抽样的方法抽取.
第一步 确定抽取个数.