内容正文:
考点20 随机抽样
考点一:统计的相关概念
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
考点二:简单随机抽样
定义
设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
方法
抽签法
把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本
随机数法
利用随机数表、随机数骰子或计算机产生的随机数进行抽样
抽签法与随机数法
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
考点三:分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
题型一:简单随机抽样的特征及适用条件
先抓住简单随机抽样的四大核心特征:总体个数有限、逐个抽取、不放回、等可能,满足全部才是简单随机抽样。适用总体个体数量较少、个体间差异不大的场景,不符合特征直接排除。
判断时逐一核对条件,重点区分“放回”与“不放回”、“等可能”与“不等可能”,有任意一条不满足就不属于此类抽样,不凭感觉判断。
【例1】(多选)下列说法中正确的有( )
A.抽签法是简单随机抽样
B.随机数表法是简单随机抽样
C.简单随机抽样要求被抽取样本的总体的个数有限
D.简单随机抽样可以从总体中一次性抽出样本
【答案】ABC
【详解】抽签法是简单随机抽样,所以A正确;
随机数表法是简单随机抽样,所以B正确;
简单随机抽样要求被抽取样本的总体的个数有限,所以C正确;
简单随机抽样要求从总体中逐个抽出样本,所以D错误.
故选:ABC.
【例2】(多选)下列抽样的方式属于简单随机抽样的是( )
A.从500个个体中一次性抽取50个作为样本
B.将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本
C.箱子共有100个零件,从中选出10个进行检验,在抽样操作中,从中任意取出一个零件进行检验后,再把它放回箱子
D.福利彩票用摇奖机摇奖
【答案】BD
【详解】根据简单随机抽样的概念:从有限总体中进行随机、不放回抽样,
可知 A不是逐个抽取,C不是不放回抽取,故不是简单随机抽样,BD是简单随机抽样.
故选:BD
【变式1-1】(多选)下列抽样中,不是简单随机抽样的为( )
A.从无数个个体中抽取50个个体作为样本
B.仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查
C.一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签
D.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里
【答案】AD
【详解】对于A,简单随机抽样的总体个数是有限个,所以A不是简单随机抽样,
对于B,一次性抽取与逐个不放回抽取等价,所以B是简单随机抽样,
对于D, 取出1个零件进行质量检验后,再把它放回箱子里,这违背了等可能性,所以不是简单随机抽样,
对于C,符合简单随机抽样,
故选:AD
【变式1-2】实验室的笼子里共有100只小白鼠,现要从中抽取10只做试验用.①每次不经任何挑选地抓一只,抓满10只为止;②将笼中的100只小白鼠按1~100编号,任意选取编号范围内的10个不重复数字,把相应编号的小白鼠作为试验用的小白鼠,则以上两种情况属于简单随机抽样的是________.
【答案】①②
【详解】简单随机抽样是一种从总体中抽取样本的方法,其特征包括:1、总体中的个体数有限;2、从总体中逐个地进行抽取;3、不放回抽样;4、每个个体抽到的机会均等.以上两个抽样,逐个分析,都满足简单随机抽样的特征.
故答案为:①②
【变式1-3】下列抽取样本的方法是简单随机抽样吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本.
(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里.
(3)从50个个体中一次性抽取5个个体作为样本.
【答案】(1)不是简单随机抽样,理由见解析
(2)是简单随机抽样,理由见解析
(3)是简单随机抽样,理由见解析
【详解】(1)不是简单随机抽样,因为被抽取的样本的总体的个数是无限的而不是有限的.
(2)是简单随机抽样,因为有放回随机抽样与不放回随机抽样都是简单随机抽样.
(3)是简单随机抽样,因为一次性抽取5个个体,与“逐个”抽取5个个体是等价的,都是简单随机抽样.
题型二:抽签法
先明确抽签法适用总体个数少的场景,步骤为:编号→制签→搅匀→抽取→得到样本,全程保证等概率。操作关键是充分搅拌均匀,确保每个签被抽到的机会相同,避免人为干扰。
解题时牢记抽签法属于不放回、等可能抽样,步骤固定且简单,常考判断是否为抽签法、步骤正误,注意编号不重复、抽取不放回。
【例3】下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【答案】B
【详解】选项A,总体中的个体数较大,样本容量也较大,不适合用抽签法,故A不符合题意;
选项B,总体中的个体数较小,样本容量也较小,
且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法,故B符合题意;
选项C,甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法,故C不符合题意;
选项D,总体中的个体数较大,不适合用抽签法,故D不符合题意.
故选:B
【例4】某校二年级一班有40名学生,从中随机抽取3名学生进行视力测试,请选择合适的抽样方法,写出抽样过程.
【答案】答案见解析
【详解】抽签法:步骤如下
(1)将40名学生编号,号码是01,02,…,40;
(2)将号码分别写在大小相同的纸条上,揉成团,制成号签;
(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次抽取3个号签,并记录上面的编号;
(5)所得号码对应的3名学生就是要抽取的对象.
【变式2-1】用抽签法进行抽样有以下几个步骤:①把号码写在形状、大小相同的号签(号签可以用小球、卡片、纸条制作)上;②将总体中的个体编号;③从容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本;④将这些号签放在一个容器内并搅拌均匀.这些步骤的先后顺序应为_____.(填序号)
【答案】②①④③
【详解】用抽签法进行抽样的第一步要对总体中的个体进行编号,然后做号签,放入容器并搅拌均匀,最后逐个不放回地抽取号签,取出的号签所对应的个体作为样本,所以这些步骤的先后顺序为②①④③.
故答案为:②①④③.
【变式2-2】上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是________.
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
【答案】①
【详解】①满足抽签法的特征,是抽签法;
②不是抽签法,因为抽签法要求所有的号签编号互不相同,而②中39个白球无法相互区分.
故答案为:①.
【变式2-3】某单位拟从40名员工中选5人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取5个号签,与这个号签编号一致的员工是幸运人选;
选法二:将35个白球与5个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选,试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能是否相等?
【答案】(1)答案见解析
(2)答案见解析
【详解】(1)选法一满足抽签法的特征,是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的35个白球,5个红球均无法相互区分.
(2)由于选法一中抽取每个号签和选法二中摸到每个球都是等可能的,因此这两种选法中每名员工被选中的可能性相等.
题型三:随机数表法
使用时先给总体统一编号,保证位数一致(两位/三位),再选定起点与读数方向,按位数依次读取。遇到重复编号、超出范围编号直接跳过,直到取满样本容量,不重复、不遗漏。
解题重点在读数规则:方向固定、位数固定、去重去超范围,常考抽取样本编号、判断操作正误,严格按规则提取有效编号。
【例5】自2016年起,每年4月24日设立为“中国航天日”,以纪念1970年4月24日长征一号火箭将我国第一颗人造地球卫星“东方红一号”成功送入太空.2025年4月24日是第10个“中国航天日”,搭乘陈冬、 陈中瑞、王杰3名航天员的神舟二十号载人飞船成功发射,以更有纪念意义的太空行动完成了对中国第10个航天日的庆祝活动,同时神舟十九号载人飞船航天员蔡旭哲、宋令东、王浩泽也于五一国际劳动节前夕凯旋回家.
某学校举行了“我向航天员提问”的趣味活动,同学们踊跃参与了活动.现从同学们提出的问题中初选40个不同类型问题进行连续编号(每个编号都由两个数字组成):01,02,03,…39,40,从中随机抽取5个问题请大家投票排名.从下列随机数表第1行第16个数字2开始由左向右依次选取两个数字,重复的跳过,则选出的5个问题编号依次为( )
A.28,03,36,24,40 B.03,36,24,40,04
C.28,03,65,67,52 D.28, 03,40,01,11
【答案】D
【详解】从随机数表第1行第16个数字2开始由左向右依次选取两个数字为:28,03,65(舍去),67(舍去),52(舍去),40,44(舍去),01,85(舍去),11.
所以选出的5个问题编号依次为:28,03,40,01,11.
故选:D
【例6】设总体由编号为00,01…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.
5044664421 6606580562 6165643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
【答案】43
【详解】从该随机数表第1行的第6个数字6开始,由左到右依次选取两个数字,
读取的数字对依次为:64(大于59,舍去),42(选取,第1个),16(选取,第2个),
60(大于59,舍去),65(大于59,舍去),80(大于59,舍去),56(选取,第3个),
26(选取,第4个),16(重复,舍去),56(重复,舍去),43(选取,第5个),
故选出来的第5个个体的编号为43.
【变式3-1】(多选)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,如下提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到前4个编号中的是( )
3221183429 7864540732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073286 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A.328 B.457 C.253 D.007
【答案】BCD
【详解】从第5行第6列开始向右读取数据,
第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,第四个是007,
故得到的前4个编号是253,313,457,007.
故选:BCD.
【变式3-2】现从编号为的支水笔中抽取支水笔进行书写长度检测,若从以下随机数表第个数字开始由左向右读取,则抽取的第支水笔的编号为__________.
【答案】
【详解】随机数表法
先从随机数表第个数字开始读取:
随机数表:
第个数字是(来自第一组 ),从左向右依次读取两位数字,并筛选出在范围内且不重复的编号:
第个: → 有效,对应编号 第个: → 无效(),跳过
第个: → 有效,对应编号 第个: → 无效(),跳过
第个: → 无效(),跳过 第个: → 有效,对应编号
所以,抽取的第支水笔的编号为.
【变式3-3】现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…499,利用随机数表抽取样本,从下表第1行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则抽出的第三袋牛奶的编号是_______.
35025 83921 20676 63016 47859 16955 56719
98105 07185 12867 35807 44395 23879 33211
【答案】
【详解】根据随机数表,依次被抽取到的编号为:,
所以抽出的第三袋牛奶的编号是.
题型四:简单随机抽样估计总体、计算概率
以等可能性为核心,样本中某类个体频率可近似估计总体对应比例,频率=频数÷样本容量。计算概率时,直接用符合条件个体数除以总体总数,结果为定值概率。
先确定样本与总体数量,用样本频率估计总体时保留合理精度,概率计算紧扣等可能抽样,不额外加权,直接按古典概型计算。
【例7】采用简单随机抽样的方法,从含有25个个体的总体中抽取1个容量为10的样本,则某个个体被抽到的概率为( )
A. B. C. D.
【答案】B
【详解】由于每个个体被抽到的概率相等,
所以每个个体被抽到的概率是.
故选:B
【例8】统计学中,常以前个区间的平均长度估计所有区间的平均长度.某工厂生产的零件以个为一箱,成箱出售().每箱中的零件按照生产顺序,从1到连续编号.现从一箱中随机抽取6个零件,发现上面的编号从小到大依次为:12,15,33,38,55,60,则下列4个选项中,作为的估计值,最合适的一项是( )
A.61 B.70 C.98 D.120
【答案】B
【详解】根据已知从1到连续编号.现从一箱中随机抽取6个零件,发现上面的编号从小到大依次为:12,15,33,38,55,60,
则,所以.
【变式4-1】为了了解某小区2000户居民缴纳社保情况,从中抽取了100户居民进行调查.该小区每位居民被抽到的可能性为( )
A. B. C. D.
【答案】C
【详解】由题意可知为了了解某小区2000户居民缴纳社保情况,
从中抽取了100户居民进行调查,该小区每位居民被抽到的可能性都是相同的,
故可能为.
故选:C
【变式4-2】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
【答案】C
【详解】设这批米内夹谷约为石,根据样本的性质可得,求得,
即这批米内夹谷约为230石,
故选:C.
【变式4-3】为了估计某自然保护区中天鹅的数量,使用以下方法:先从该保护区中捕出一定数量的天鹅,例如200只,给每只天鹅做上记号,不影响其存活,然后放回保护区,经过适当的时间,让其和保护区中其余的天鹅充分混合;再从保护区中捕捉一定数量的天鹅,例如150只,查看其中有记号的天鹅,设有20只.根据上述数据,估计该自然保护区中天鹅的数量为________.
【答案】1500只
【详解】由题可设该自然保护区中天鹅的数量的估计值为,
从而可得,解得,
故该自然保护区中天鹅的数量估计值为1500只.
故答案为:1500只.
题型五:分层抽样的特征及适用条件
【例9】为了了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男、女生视力情况差异不大.则下列抽样方法最合理的是( )
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.按性别或学段分层抽样都行
【答案】C
【详解】因为已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男、女生视力情况差异不大,所以为了了解该地区中小学生的视力情况,应按学段分层抽样,这种方式具有代表性,比较合理.
【例10】(多选)下列问题中不适合用分层随机抽样法抽样的是:( )
A.某会堂有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽取3台进行质量检查
C.某地农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计该地农田平均产量
D.从50个零件中抽取5个做质量检验
【答案】ABD
【详解】选项A,总体中的个体无明显差异,且总体容量较大,故不宜采用分层随机抽样法;
选项B,总体容量较小,用简单随机抽样法比较方便,不宜采用分层随机抽样;
选项C,总体容量较大,且各类农田的产量有明显差别,宜采用分层随机抽样;
选项D,总体中的个体无明显差异,总体容量较小,宜采用随机抽样法.
故选:ABD
【变式5-1】为了保证采用分层随机抽样方法时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
C.每层抽取的比例为(其中n为抽取的样本容量,N是总体容量)
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
【答案】C
【详解】分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样,
A中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故A不正确;
B中,由于每层的个体数不一定相等,每层抽取同样多的个体数,
显然从总体来看,各层的个体被抽取的可能性就不相等了,因此B也不正确;
C中,按照这个比例抽取,对于每个个体来说,被抽取为样本的可能性是相同的,故C正确;
D显然不正确.
故选:C.
【变式5-2】某公司有160名员工,其中研发部120名,销售部16名,客服部24名,为调查他们的收入情况,从中抽取一个容量为20的样本,较为合适的抽样方法是____.
【答案】分层抽样
【详解】略
【变式5-3】下列两项调查适宜采用的抽样方法依次是( )
①一项对“中兴事件”(2018年4月16日,美国对中兴通讯施行惩罚措施,引起国内关于国产芯片的讨论)影响的调查中有10000人认为这是美国贸易保护主义,对世界经济会产生比较负面的影响:有9000人认为这只是一个孤立事件,对世界经济大格局不会产生太大影响:有1000人没有发表自己的看法.现要从这20000人中随机抽取200人做进一步调查.
②从某中学高二年级的15名艺术特长生中选出3名调查学习负担情况.
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
【答案】B
【详解】解:对于①,总体中明显存在差异,则用分层随机抽样;
对于②,总体个数较少,则用简单随机抽样,
故选:B
题型六:分层数据的计算
【例11】某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且,全校参加登山的人数占总人数的.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进行调查,则应从高三年级参加跑步的学生中抽取( )
A.15人 B.30人 C.40人 D.45人
【答案】D
【详解】解:由题意,可知全校参加跑步的人数为,
所以.因为,所以.
因为按分层抽样的方法从中抽取一个容量为200的样本,
所以应从高三年级参加跑步的学生中抽取的人数为.
故选:D
【例12】为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中O型血的人数比AB型血的人数多20,则( )
A.100 B.120 C.200 D.240
【答案】B
【详解】解:因为感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,
所以,抽取样本量为的样本中,O型血的人数为, AB型血的人数为,
所以,,解得
故选:B
【变式6-1】已知某地区有小学生12000人,初中生11000人,高中生9000人,现在要了解该地区学生的近视情况,准备抽取320人进行调查,则应该抽取小学生、初中生、高中生的人数分别是______.
【答案】120,110,90
【详解】小学生,初中生,高中生人数的比例为,
故抽取的小学生,初中生,高中生的人数分别为.
故答案为:120,110,90.
【变式6-2】某校高一年级三个班共有学生120名,这三个班的男女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则_________.现用分层抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为________.
一班
二班
三班
女生人数
20
男生人数
20
20
【答案】 24 9
【详解】由题意可得,解得.
三班总人数为,用分层抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为,
故应从三班抽取的人数为,
故答案为: 24; 9.
【点睛】本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.
【变式6-3】某人工智能公司为训练垃圾分类识别模型,需对采集的4000张图片进行人工标注,图片分为可回收物、厨余垃圾、有害垃圾、其他垃圾四类,已知四类图片的数量之比为,现采用分层抽样的方法抽取容量为n的样本对标注情况进行抽检,若抽到的厨余垃圾图片比有害垃圾图片多25张,则( )
A.80 B.100 C.120 D.160
【答案】B
【详解】已知四类图片的数量之比为,则厨余垃圾图片占总图片数量的比例为,
有害垃圾图片占总图片数量的比例为.
因为采用分层抽样的方法抽取容量为n的样本,所以抽到的厨余垃圾图片数量为,
抽到的有害垃圾图片数量为.
由题意可得,解得.
题型七:总体和样本
明确总体是调查对象全体,个体是每一个对象,样本是抽取的部分个体,样本容量是个体数目(无单位)。重点区分样本(集合)与样本容量(数值),不混淆概念。
解题时先圈出调查对象,准确界定总体范围,再判断样本与容量,常考概念判断、填空,注意表述规范,容量只写数字不加单位。
【例13】在国际经合组织主持的国际学生评估项目(Program for International Student Assessment,简称PISA)研究中,上海15岁初中生多次获得全球第一.2024年上海近600所学校的约4000名学生代表全市各类中学约12.8万名15岁初中生参加测试,某研究人员想利用2024年PISA的数据库考察上海市15岁初中生的数学成绩.在该研究人员的研究中,总体是______________.
【答案】全市各类中学约12.8万名15岁初中生的数学成绩.
【详解】由题意,此项研究中,统计总体为全市各类中学约12.8万名15岁初中生的数学成绩.
故答案为:全市各类中学约12.8万名15岁初中生的数学成绩.
【例14】为了解某市参加升学考试的学生的数学成绩,从参加考试的学生中随机抽取1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生
B.样本指的是抽取的1000名学生的数学成绩
C.样本量指的是抽取的1000名学生
D.个体指的是抽取的1000名学生中的每一名学生
【答案】B
【详解】对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;
对于B,样本指的是抽取的1000名学生的数学成绩,故B正确;
对于C,样本量是1000,故C错误;
对于D,个体指的是抽取的1000名学生中每名学生的数学成绩,故D错误.
故选:B.
【变式7-1】某学校教学管理人员希望调查该校学生平均每天用于体锻的时间,他抽样调查了150名同学,发现他们每天的平均体锻时间是.请问,在前面这个情境中本次调查的总体是__________.
【答案】该校所有学生的平均每天用于体锻的时间
【详解】因为调查对象的总体为该校所有学生的平均每天用于体锻的时间,
因此总体应是:该校所有学生的平均每天用于体锻的时间.
故答案为:该校所有学生的平均每天用于体锻的时间
【变式7-2】为了解某中学高一年级600名学生的身高情况,抽查了其中100名学生的身高进行统计分析.下列叙述错误的是( )
A.以上调查属于全面调查
B.每名学生的身高是总体的一个个体
C.100名学生的身高是总体的一个样本
D.600名学生的身高是总体
【答案】A
【详解】A.以上调查属于抽样调查,故符合题意;
B.每名学生的身高情况是总体的一个个体,故不符合题意;
C.100名学生的身高是总体的一个样本,故不符合题意;
D.600名学生的身高情况是总体,故不符合题意;
故选:A.
【变式7-3】(多选)为了了解参加运动会的1000名运动员的年龄情况,从中随机抽取了100名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有( )
A.1000名运动员是总体 B.每名运动员的年龄是个体
C.样本容量为100 D.所抽取的100名运动员的年龄是样本
【答案】BCD
【详解】对于A,所抽取的1000名运动员的年龄是总体,A错误;
对于B,每名运动员的年龄是个体,B正确;
对于C,样本容量为100,C正确;
对于D,所抽取的100名运动员的年龄是样本,D正确.
故选:BCD.
题型八:随机抽样的综合问题
【例15】随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从年月到该地旅游的游客中随机抽取部分游客进行调查,得到各年龄段游客的人数比例和各年龄段中自助游的比例,如图,则下列说法错误的是( )
A.若调查的游客中青年人有人,则一共调查了人
B.估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的
C.用分层随机抽样的方法对所调查游客进行抽样,若老年人有人,则中年人有人
D.估计年月到该地旅游且选择自助游的游客中青年人不超过一半
【答案】D
【详解】设年月到该地旅游的游客总人数为.
由题意,游客中老年人、中年人、青年人的人数分别为,
其中选择自助游的老年人、中年人、青年人的人数分别为.
对于A,,解得,即一共调查的游客人数是人,故A正确;
对于B,估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的,故B正确;
对于C,设中年人应抽取人,依题意得,解得,即中年人应抽取人,故C正确;
对于D,因为年月到该地旅游且选择自助游的游客的人数为,其中青年人的人数为,所以选择自助游的游客中青年人超过一半,故D错误.
【例16】劳动力调查是一项抽样调查.2024年的劳动力调查以第八次人口普查的最新数据为基础抽取相关住户进入样本,并且采用样本轮换模式.劳动力调查的轮换是按照“2—10—2”模式进行,即一个住户连续2个月接受调查,在接下来的10个月中不接受调查,然后再接受连续2个月的调查,经历四次调查之后退出样本.调查进行时保持每月进入样本接受第一次调查的新住户数量相同.若从第k个月开始,每个月都有的样本是接受第一次调查,的样本是接受第二次调查,的样本是接受第三次调查,的样本是接受第四次调查,则k的值为_________.
【答案】14
【详解】假设从1月开始每月抽查1人,编号依次为1,2,3,4,…,
第一个月1号第一次抽查,第二个月1号第二次抽查,2号第一次抽查,
第三个月2号第二次抽查,3号第一次抽查,…,
第十四个月14号第一次抽查,13号第二次抽查,2号第三次抽查,1号第四次抽查各占.
即.
故答案为:14.
【变式8-1】2021年元月份,河北、黑龙江等地相继出现疫情,学生春节放寒假期间,某大学鼓励大学生积极参加到各个社区作为志愿者抗击疫情,下面是新学期开学后学校随机抽取100人,对其参加志愿者的天数统计,得到如下统计表:
参加志愿者的天数
人数
10
70
20
若以这100人参加志愿者天数位于各区间的频率代替该大学所有学生参加志愿者天数位于该区间的概率.根据上表,用分层抽样的方法从这100人中随机抽取20人,则抽取的20人中“参加社会志愿者天数不多于5天和不少于10天”的人数为( )
A.6 B.8 C.10 D.12
【答案】A
【详解】由题意得选中“参加社会志愿者天数不多于5天和不少于10天”的人概率为,
由分层抽样性质得,抽取的20人中“参加社会志愿者天数不多于5天和不少于10天”的人数为,显然A正确.
故选:A
【变式8-2】已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
【答案】9.5
【详解】根据题意,不妨设抽取的样本容量分别为,,,
设三条流水线的样本平均数分别为,总体样本平均数为,
则
根据样本平均数公式可得,
解得,所以流水线1的样本平均数为9.5.
【变式8-3】为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
【答案】(1)方式1采用的是简单随机抽样法,方式2采用的是分层抽样法;
(2)答案见解析;
【分析】
【详解】(1)根据题意可知,方式1采用的是简单随机抽样法,方式2采用的是分层抽样法;
(2)方式1抽样的步骤如下:
在全年级10个班中用抽签法任意抽取一个班级,考察他们的成绩;
方式2抽样的步骤如下:
第一步:分层
把该校高三年级的学生按成绩分成优秀、良好、普通三个级别;
第二步:确定各个层抽取的人数
由于样本容量与总体个数比值为,
所以每层抽取的个体数依次为人,人,人;
第三步:按层分别抽取样本人数
在优秀学生中用简单随机抽样法抽取6人,
在良好学生中用简单随机抽样法抽取18人,
在普通学生中用简单随机抽样法抽取16人,
一、单选题
1.总体是由编号为000,001,002,……,198,199的200个个体组成. 利用下列随机数表,从200个体中选取5个个体选取方法:从随机数表的第1行第3列开始,从左至右依次选取三个数字(作为个体编号),则选出的第5个个体编号是( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 0807 3613 4869 6938 7481
A.080 B.198 C.023 D.134
【答案】D
【详解】从随机数表的第1行第3列开始选,个体编号依次为:166,080,140,198,080(重复剔除),134,第5个编号为134.
2.使用简单随机抽样从1000件产品中抽出50件进行某项检查,合适的抽样方法是( )
A.抽签法 B.随机数法 C.系统抽样法 D.以上都不对
【答案】B
【详解】由于总体相对较大,样本量较小,故采用随机数法较为合适.
故选:B.
3.某市有大型超市15家,中型超市75家,小型超市165家.为掌握全市超市的营业情况,现按大型超市、中型超市、小型超市进行分层,通过分层随机抽样的方法抽取一个容量为68的样本,则应抽取中型超市( )家
A.20 B.30 C.40 D.50
【答案】A
【详解】根据题意:中型超市应抽取:.
4.在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
【答案】B
【详解】全面调查是对调查对象的所有单位一一进行调查的调查方式,
A. 查一个水库所有鱼中草鱼所占的比例.,调查数目较多,不适合全面调查;
B. 调查一个县各村的粮食播种面积适合全面调查;
C.调查一批炮弹的杀伤半径,调查数目较多,可以使用抽样调查;
D. 调查一批玉米种子的发芽率,调查数目较多,且具有破坏性,不适合全面调查.
故选:B.
5.下面情况中,更适合用抽样调查的有( )
①某学校全体学生体质健康检测 ②某小区全体住户燃气、水电设施安全检查
③一批待售袋装牛奶的细菌数调查 ④调查一个县各村的粮食播种面积
⑤调查一条河流的水质 ⑥某连锁酒店顾客满意度的调查
A.②③④ B.②③⑤⑥ C.③④⑤⑥ D.③⑤⑥
【答案】D
【详解】①某学校全体学生体质健康检测学校学生人数有限,且体质健康检测需要准确结果,适合普查;
②某小区全体住户燃气、水电设施安全检查关系到住户生命财产安全,必须确保全覆盖,适合普查;
③一批待售袋装牛奶的细菌数调查检测细菌数需要破坏牛奶样本(具有破坏性),无法对所有牛奶进行检测,适合抽样调查;
④调查一个县各村的粮食播种面积数据需要精确统计,且县内村庄数量有限,适合普查;
⑤调查一条河流的水质河流范围广,无法对全部水体进行检测,只需抽取不同点位的水样即可推断整体水质,适合抽样调查;
⑥某连锁酒店顾客满意度的调查 连锁酒店顾客数量庞大,全面调查成本高,只需抽取部分顾客即可反映整体满意度,适合抽样调查.
故选:D.
6.我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡四百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有400人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200 B.100 C.120 D.140
【答案】C
【详解】设北面共有人,则由题意可得
,解得
所以北面共有120人,
故选:C
7.某地政府为了促进当地旅游,从到达该地旅游的游客中随机选取了400人进行调查,其中青年人、中年人、老年人三个年龄段的占比饼状图如图①所示,各年龄段游客的性别占比条形图如图②所示,则下列说法正确的是( )
A.估计到达该地旅游的女性占比约为55%
B.从调查的游客中,随机抽取一位进行深入调研,则抽到中年男性的概率为0.175
C.若按年龄进行分层,用分层随机抽样的方法从调查的游客中抽出20人分发纪念品,则中年人中应抽取8人
D.从调查的游客中选取一位作为幸运游客,在已知该幸运游客是青年人的条件下,其是女性的概率为0.6
【答案】B
【详解】对于A,估计到达该地旅游的女性占比约为
,故A错误;
对于B,从调查的400人中,随机抽取一位进行深入调研,
则抽到中年男性的概率为,故B正确;
对于C,若按年龄进行分层,用分层随机抽样的方法从调查的游客中抽出20人分发纪念品,
则中年人中应抽取(人),故C错误;
对于D,从调查的游客中选取一位作为幸运游客,在已知该幸运游客是青年人的条件下,
其是女性的概率为0.7,故D错误.
故选:B.
8.唐代以来,牡丹之盛,以“洛阳牡丹甲天下”的美名流传于世.唐已知根据花瓣类型可将牡丹分为单瓣类、重瓣类、千瓣类三类,现有牡丹花n朵,千瓣类比单瓣类多30朵,采用分层抽样方法从中选出12朵牡丹进行观察研究,其中单瓣类有4朵,重瓣类有2朵,千瓣类有6朵,则n=( )
A.360 B.270 C.240 D.180
【答案】D
【详解】根据分层抽样的特点,设单瓣类、重瓣类、千瓣类的朵数分别为,
由题意可得,解得,所以.
故选:D.
二、多选题
9.从500名学生中随机抽取60名学生进行体重调查,下列说法正确的是( )
A.样本量是60 B.抽取的60名学生的体重是样本数据
C.500名学生是总体 D.每个学生的体重是个体
【答案】ABD
【详解】对于A,从500名学生中随机抽取60名学生进行体重调查,样本量是60,故A正确,
对于B,抽取的60名学生的体重是样本数据,故B正确,
对于C,500名学生的体重是总体,故C错误,
对于D,每个学生的体重是个体,故D正确.
故选:ABD.
10.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为的样本进行调查,其中从丙车间的产品中抽取了3件,则下列说法正确的是( )
A.甲车间应抽取6件 B.乙车间应抽取8件
C. D.该抽样方法是随机抽样
【答案】AC
【详解】由分层抽样可得,解得,故C正确.
则甲车间应抽取,故A正确.
乙车间应抽取,故B错误.
分层抽样属于概率抽样,随机抽样一般指简单随机抽样,二者概念不同,故D错误.
三、填空题
11.某校高一年级共有500名学生参加学校组织的活动(每人只参加一项活动),其中参加“党团队一体化公益实践活动”的有125人,参加“心理健康游园活动”的有人、参加“湿地奔跑活动”的有人,现用分层抽样的方法,从中抽取100名学生了解他们的健康情况;如果已知参加“心理健康游园活动”的学生抽取了56人,则参加“湿地奔跑活动”的学生要抽取的人数为________.
【答案】19
【详解】分层抽样中,总体共500名学生,抽取100人,因此抽样比为,
由题意得:,因此:,
根据抽样比得:,解得,
因此:,
故参加“湿地奔跑活动”抽取人数为.
12.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 15 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第5列开始向右依次读取数据,则得到的第4个样本编号是_____.
【答案】15
【详解】从随机数表第1行的第5列数字开始由左向右每次连续读取2个数字,
删除超出范围及重复的编号,符合条件的编号有40,37,14,15,
所以选出来的第4个个体的编号为15.
故答案为:15.
13.重庆一中高一,高二,高三的模联社团的人数分别为25,15,10,现采用分层抽样的方法从中抽取部分学生参加模联会议,已知在高二年级和高三年级中共抽取5名同学,若从这5名同学中再随机抽取2名同学承担文件翻译工作,则抽取的两名同学来自同一年级的概率为__________.
【答案】
【详解】解:高二高三抽取人数之比为,所以5名同学中高二有3人,高三有2人,
设高二3人为,高三2人为,则随机抽取2名同学的可能有
共十种可能,
其中抽取的两名同学来自同一年级的有四种可能,则
抽取的两名同学来自同一年级的概率为,
故答案为:.
【点睛】本题考查了分层抽样,考查了古典概型概率的求解.本题的关键是求出高二、高三各抽出的人数.
四、解答题
14.下面的抽样中适合用简单随机抽样的有哪些?
(1)某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈;
(2)从10台冰箱中抽出3台进行质量检查;
(3)某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个容量为20的样本;
(4)某乡农田有:山地800公顷,丘陵1200公顷,平地2400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量.
【答案】(1)不适合
(2)适合
(3)不适合
(4)不适合
【分析】
【详解】(1)总体容量较大,用简单随机抽样法比较麻烦;
(2)总体容量较少,用简单随机抽样法比较方便;
(3)由于学校各类人员对这一问题的看法可能差异很大,不宜采用简单随机抽样法;
(4)总体容量大,且各类田地的差别很大,不宜采用简单随机抽样法.
15.当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测.
(1)在这个问题中,总体、样本各是什么?
(2)为深入了解这50名学生的视力情况,从中随机抽取6人,分别写出利用抽签法和随机数法抽取该样本的过程.
【答案】(1)答案见解析;
(2)答案见解析.
【分析】
【详解】(1)总体是该中学高三年级400名学生的视力,样本是所抽取的50名学生的视力;
(2)利用抽签法步骤如下:
第一步:将这50名学生编号,编号为1,2,3,…,50.
第二步:将50个号码分别写在纸条上,并揉成团,制成号签.
第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.
第四步:从容器中逐一抽取6个号签,并记录上面的号码.
对应上面6个号码的学生就是抽取的学生;
利用随机数法步骤如下:
第一步:将这50名学生编号,编号为.
第二步:用计算机产生范围内的整数随机数,把产生的随机数作为抽中的编号.
第三步:重复第二步的过程,若出现重复的号码,则舍去,直到抽足6个号码.
对应上面6个号码的学生就是抽取的学生.
16.某机构美术类艺体生的专业测试和文化测试成绩随机抽样统计如下(单位:人):
文化成绩
专业成绩
优秀
良好
及格
优秀
6
4
8
良好
m
3
n
及格
4
3
5
已知样本中恰有10%的考生专业和文化成绩均为及格,恰有30%的考生专业成绩为优秀.
(1)求m,n的值;
(2)在抽取的专业成绩为优秀和良好的学生中,用分层随机抽样的方法抽取5人,分别求抽取的5人中专业成绩为优秀和良好的人数.
【答案】(1),
(2)优秀有3人,良好有2人
【分析】
【详解】(1)样本中专业和文化成绩均为及格的有5人,占10%,
∴样本量为,
∴专业成绩为优秀的人数为,
∴,解得.
∵,∴.
(2)专业成绩为优秀的有15人,良好的有10人,
按分层随机抽样的方法抽取5人,抽样比为,
∴5人中专业成绩为优秀的有(人),良好的有(人).
1 / 10
学科网(北京)股份有限公司
$
考点20 随机抽样
考点一:统计的相关概念
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
考点二:简单随机抽样
定义
设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
方法
抽签法
把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本
随机数法
利用随机数表、随机数骰子或计算机产生的随机数进行抽样
抽签法与随机数法
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
考点三:分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
题型一:简单随机抽样的特征及适用条件
先抓住简单随机抽样的四大核心特征:总体个数有限、逐个抽取、不放回、等可能,满足全部才是简单随机抽样。适用总体个体数量较少、个体间差异不大的场景,不符合特征直接排除。
判断时逐一核对条件,重点区分“放回”与“不放回”、“等可能”与“不等可能”,有任意一条不满足就不属于此类抽样,不凭感觉判断。
【例1】(多选)下列说法中正确的有( )
A.抽签法是简单随机抽样
B.随机数表法是简单随机抽样
C.简单随机抽样要求被抽取样本的总体的个数有限
D.简单随机抽样可以从总体中一次性抽出样本
【例2】(多选)下列抽样的方式属于简单随机抽样的是( )
A.从500个个体中一次性抽取50个作为样本
B.将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本
C.箱子共有100个零件,从中选出10个进行检验,在抽样操作中,从中任意取出一个零件进行检验后,再把它放回箱子
D.福利彩票用摇奖机摇奖
【变式1-1】(多选)下列抽样中,不是简单随机抽样的为( )
A.从无数个个体中抽取50个个体作为样本
B.仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查
C.一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签
D.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里
【变式1-2】实验室的笼子里共有100只小白鼠,现要从中抽取10只做试验用.①每次不经任何挑选地抓一只,抓满10只为止;②将笼中的100只小白鼠按1~100编号,任意选取编号范围内的10个不重复数字,把相应编号的小白鼠作为试验用的小白鼠,则以上两种情况属于简单随机抽样的是________.
【变式1-3】下列抽取样本的方法是简单随机抽样吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本.
(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里.
(3)从50个个体中一次性抽取5个个体作为样本.
题型二:抽签法
先明确抽签法适用总体个数少的场景,步骤为:编号→制签→搅匀→抽取→得到样本,全程保证等概率。操作关键是充分搅拌均匀,确保每个签被抽到的机会相同,避免人为干扰。
解题时牢记抽签法属于不放回、等可能抽样,步骤固定且简单,常考判断是否为抽签法、步骤正误,注意编号不重复、抽取不放回。
【例3】下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【例4】某校二年级一班有40名学生,从中随机抽取3名学生进行视力测试,请选择合适的抽样方法,写出抽样过程.
【变式2-1】用抽签法进行抽样有以下几个步骤:①把号码写在形状、大小相同的号签(号签可以用小球、卡片、纸条制作)上;②将总体中的个体编号;③从容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本;④将这些号签放在一个容器内并搅拌均匀.这些步骤的先后顺序应为_____.(填序号)
【变式2-2】上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是________.
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
【变式2-3】某单位拟从40名员工中选5人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取5个号签,与这个号签编号一致的员工是幸运人选;
选法二:将35个白球与5个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选,试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能是否相等?
题型三:随机数表法
使用时先给总体统一编号,保证位数一致(两位/三位),再选定起点与读数方向,按位数依次读取。遇到重复编号、超出范围编号直接跳过,直到取满样本容量,不重复、不遗漏。
解题重点在读数规则:方向固定、位数固定、去重去超范围,常考抽取样本编号、判断操作正误,严格按规则提取有效编号。
【例5】自2016年起,每年4月24日设立为“中国航天日”,以纪念1970年4月24日长征一号火箭将我国第一颗人造地球卫星“东方红一号”成功送入太空.2025年4月24日是第10个“中国航天日”,搭乘陈冬、 陈中瑞、王杰3名航天员的神舟二十号载人飞船成功发射,以更有纪念意义的太空行动完成了对中国第10个航天日的庆祝活动,同时神舟十九号载人飞船航天员蔡旭哲、宋令东、王浩泽也于五一国际劳动节前夕凯旋回家.
某学校举行了“我向航天员提问”的趣味活动,同学们踊跃参与了活动.现从同学们提出的问题中初选40个不同类型问题进行连续编号(每个编号都由两个数字组成):01,02,03,…39,40,从中随机抽取5个问题请大家投票排名.从下列随机数表第1行第16个数字2开始由左向右依次选取两个数字,重复的跳过,则选出的5个问题编号依次为( )
A.28,03,36,24,40 B.03,36,24,40,04
C.28,03,65,67,52 D.28, 03,40,01,11
【例6】设总体由编号为00,01…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.
5044664421 6606580562 6165643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
【变式3-1】(多选)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,如下提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到前4个编号中的是( )
3221183429 7864540732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073286 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A.328 B.457 C.253 D.007
【变式3-2】现从编号为的支水笔中抽取支水笔进行书写长度检测,若从以下随机数表第个数字开始由左向右读取,则抽取的第支水笔的编号为__________.
【变式3-3】现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…499,利用随机数表抽取样本,从下表第1行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则抽出的第三袋牛奶的编号是_______.
35025 83921 20676 63016 47859 16955 56719
98105 07185 12867 35807 44395 23879 33211
题型四:简单随机抽样估计总体、计算概率
以等可能性为核心,样本中某类个体频率可近似估计总体对应比例,频率=频数÷样本容量。计算概率时,直接用符合条件个体数除以总体总数,结果为定值概率。
先确定样本与总体数量,用样本频率估计总体时保留合理精度,概率计算紧扣等可能抽样,不额外加权,直接按古典概型计算。
【例7】采用简单随机抽样的方法,从含有25个个体的总体中抽取1个容量为10的样本,则某个个体被抽到的概率为( )
A. B. C. D.
【例8】统计学中,常以前个区间的平均长度估计所有区间的平均长度.某工厂生产的零件以个为一箱,成箱出售().每箱中的零件按照生产顺序,从1到连续编号.现从一箱中随机抽取6个零件,发现上面的编号从小到大依次为:12,15,33,38,55,60,则下列4个选项中,作为的估计值,最合适的一项是( )
A.61 B.70 C.98 D.120
【变式4-1】为了了解某小区2000户居民缴纳社保情况,从中抽取了100户居民进行调查.该小区每位居民被抽到的可能性为( )
A. B. C. D.
【变式4-2】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2020石(石,古代质量单位),验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为(假设一粒谷和一粒米的质量近似相同)( )
A.210石 B.220石 C.230石 D.240石
【变式4-3】为了估计某自然保护区中天鹅的数量,使用以下方法:先从该保护区中捕出一定数量的天鹅,例如200只,给每只天鹅做上记号,不影响其存活,然后放回保护区,经过适当的时间,让其和保护区中其余的天鹅充分混合;再从保护区中捕捉一定数量的天鹅,例如150只,查看其中有记号的天鹅,设有20只.根据上述数据,估计该自然保护区中天鹅的数量为________.
题型五:分层抽样的特征及适用条件
【例9】为了了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男、女生视力情况差异不大.则下列抽样方法最合理的是( )
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.按性别或学段分层抽样都行
【例10】(多选)下列问题中不适合用分层随机抽样法抽样的是:( )
A.某会堂有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈
B.从10台冰箱中抽取3台进行质量检查
C.某地农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计该地农田平均产量
D.从50个零件中抽取5个做质量检验
【变式5-1】为了保证采用分层随机抽样方法时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
C.每层抽取的比例为(其中n为抽取的样本容量,N是总体容量)
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
【变式5-2】某公司有160名员工,其中研发部120名,销售部16名,客服部24名,为调查他们的收入情况,从中抽取一个容量为20的样本,较为合适的抽样方法是____.
【变式5-3】下列两项调查适宜采用的抽样方法依次是( )
①一项对“中兴事件”(2018年4月16日,美国对中兴通讯施行惩罚措施,引起国内关于国产芯片的讨论)影响的调查中有10000人认为这是美国贸易保护主义,对世界经济会产生比较负面的影响:有9000人认为这只是一个孤立事件,对世界经济大格局不会产生太大影响:有1000人没有发表自己的看法.现要从这20000人中随机抽取200人做进一步调查.
②从某中学高二年级的15名艺术特长生中选出3名调查学习负担情况.
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
题型六:分层数据的计算
【例11】某学校在校学生有2000人,为了增强学生的体质,学校举行了跑步和登山比赛,每人都参加且只参加其中一项比赛,高一、高二、高三年级参加跑步的人数分别为a,b,c,且,全校参加登山的人数占总人数的.为了了解学生对本次比赛的满意程度,按分层抽样的方法从中抽取一个容量为200的样本进行调查,则应从高三年级参加跑步的学生中抽取( )
A.15人 B.30人 C.40人 D.45人
【例12】为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中O型血的人数比AB型血的人数多20,则( )
A.100 B.120 C.200 D.240
【变式6-1】已知某地区有小学生12000人,初中生11000人,高中生9000人,现在要了解该地区学生的近视情况,准备抽取320人进行调查,则应该抽取小学生、初中生、高中生的人数分别是______.
【变式6-2】某校高一年级三个班共有学生120名,这三个班的男女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则_________.现用分层抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为________.
一班
二班
三班
女生人数
20
男生人数
20
20
【变式6-3】某人工智能公司为训练垃圾分类识别模型,需对采集的4000张图片进行人工标注,图片分为可回收物、厨余垃圾、有害垃圾、其他垃圾四类,已知四类图片的数量之比为,现采用分层抽样的方法抽取容量为n的样本对标注情况进行抽检,若抽到的厨余垃圾图片比有害垃圾图片多25张,则( )
A.80 B.100 C.120 D.160
题型七:总体和样本
明确总体是调查对象全体,个体是每一个对象,样本是抽取的部分个体,样本容量是个体数目(无单位)。重点区分样本(集合)与样本容量(数值),不混淆概念。
解题时先圈出调查对象,准确界定总体范围,再判断样本与容量,常考概念判断、填空,注意表述规范,容量只写数字不加单位。
【例13】在国际经合组织主持的国际学生评估项目(Program for International Student Assessment,简称PISA)研究中,上海15岁初中生多次获得全球第一.2024年上海近600所学校的约4000名学生代表全市各类中学约12.8万名15岁初中生参加测试,某研究人员想利用2024年PISA的数据库考察上海市15岁初中生的数学成绩.在该研究人员的研究中,总体是______________.
【例14】为了解某市参加升学考试的学生的数学成绩,从参加考试的学生中随机抽取1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生
B.样本指的是抽取的1000名学生的数学成绩
C.样本量指的是抽取的1000名学生
D.个体指的是抽取的1000名学生中的每一名学生
【变式7-1】某学校教学管理人员希望调查该校学生平均每天用于体锻的时间,他抽样调查了150名同学,发现他们每天的平均体锻时间是.请问,在前面这个情境中本次调查的总体是__________.
【变式7-2】为了解某中学高一年级600名学生的身高情况,抽查了其中100名学生的身高进行统计分析.下列叙述错误的是( )
A.以上调查属于全面调查
B.每名学生的身高是总体的一个个体
C.100名学生的身高是总体的一个样本
D.600名学生的身高是总体
【变式7-3】(多选)为了了解参加运动会的1000名运动员的年龄情况,从中随机抽取了100名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有( )
A.1000名运动员是总体 B.每名运动员的年龄是个体
C.样本容量为100 D.所抽取的100名运动员的年龄是样本
题型八:随机抽样的综合问题
【例15】随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从年月到该地旅游的游客中随机抽取部分游客进行调查,得到各年龄段游客的人数比例和各年龄段中自助游的比例,如图,则下列说法错误的是( )
A.若调查的游客中青年人有人,则一共调查了人
B.估计年月到该地旅游的游客中选择自助游的青年人占总游客人数的
C.用分层随机抽样的方法对所调查游客进行抽样,若老年人有人,则中年人有人
D.估计年月到该地旅游且选择自助游的游客中青年人不超过一半
【例16】劳动力调查是一项抽样调查.2024年的劳动力调查以第八次人口普查的最新数据为基础抽取相关住户进入样本,并且采用样本轮换模式.劳动力调查的轮换是按照“2—10—2”模式进行,即一个住户连续2个月接受调查,在接下来的10个月中不接受调查,然后再接受连续2个月的调查,经历四次调查之后退出样本.调查进行时保持每月进入样本接受第一次调查的新住户数量相同.若从第k个月开始,每个月都有的样本是接受第一次调查,的样本是接受第二次调查,的样本是接受第三次调查,的样本是接受第四次调查,则k的值为_________.
【变式8-1】2021年元月份,河北、黑龙江等地相继出现疫情,学生春节放寒假期间,某大学鼓励大学生积极参加到各个社区作为志愿者抗击疫情,下面是新学期开学后学校随机抽取100人,对其参加志愿者的天数统计,得到如下统计表:
参加志愿者的天数
人数
10
70
20
若以这100人参加志愿者天数位于各区间的频率代替该大学所有学生参加志愿者天数位于该区间的概率.根据上表,用分层抽样的方法从这100人中随机抽取20人,则抽取的20人中“参加社会志愿者天数不多于5天和不少于10天”的人数为( )
A.6 B.8 C.10 D.12
【变式8-2】已知某工厂有三条流水线用于生产同一种产品,三条流水线的产量之比为,根据比例分层抽样得到流水线2的样本平均数为9.0,流水线3的样本平均数为9.4,所有样本的平均数为9.3,则流水线1的样本平均数为_____.
【变式8-3】为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
一、单选题
1.总体是由编号为000,001,002,……,198,199的200个个体组成. 利用下列随机数表,从200个体中选取5个个体选取方法:从随机数表的第1行第3列开始,从左至右依次选取三个数字(作为个体编号),则选出的第5个个体编号是( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 0807 3613 4869 6938 7481
A.080 B.198 C.023 D.134
2.使用简单随机抽样从1000件产品中抽出50件进行某项检查,合适的抽样方法是( )
A.抽签法 B.随机数法 C.系统抽样法 D.以上都不对
3.某市有大型超市15家,中型超市75家,小型超市165家.为掌握全市超市的营业情况,现按大型超市、中型超市、小型超市进行分层,通过分层随机抽样的方法抽取一个容量为68的样本,则应抽取中型超市( )家
A.20 B.30 C.40 D.50
4.在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
5.下面情况中,更适合用抽样调查的有( )
①某学校全体学生体质健康检测 ②某小区全体住户燃气、水电设施安全检查
③一批待售袋装牛奶的细菌数调查 ④调查一个县各村的粮食播种面积
⑤调查一条河流的水质 ⑥某连锁酒店顾客满意度的调查
A.②③④ B.②③⑤⑥ C.③④⑤⑥ D.③⑤⑥
6.我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡四百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有400人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200 B.100 C.120 D.140
7.某地政府为了促进当地旅游,从到达该地旅游的游客中随机选取了400人进行调查,其中青年人、中年人、老年人三个年龄段的占比饼状图如图①所示,各年龄段游客的性别占比条形图如图②所示,则下列说法正确的是( )
A.估计到达该地旅游的女性占比约为55%
B.从调查的游客中,随机抽取一位进行深入调研,则抽到中年男性的概率为0.175
C.若按年龄进行分层,用分层随机抽样的方法从调查的游客中抽出20人分发纪念品,则中年人中应抽取8人
D.从调查的游客中选取一位作为幸运游客,在已知该幸运游客是青年人的条件下,其是女性的概率为0.6
8.唐代以来,牡丹之盛,以“洛阳牡丹甲天下”的美名流传于世.唐已知根据花瓣类型可将牡丹分为单瓣类、重瓣类、千瓣类三类,现有牡丹花n朵,千瓣类比单瓣类多30朵,采用分层抽样方法从中选出12朵牡丹进行观察研究,其中单瓣类有4朵,重瓣类有2朵,千瓣类有6朵,则n=( )
A.360 B.270 C.240 D.180
二、多选题
9.从500名学生中随机抽取60名学生进行体重调查,下列说法正确的是( )
A.样本量是60 B.抽取的60名学生的体重是样本数据
C.500名学生是总体 D.每个学生的体重是个体
10.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为的样本进行调查,其中从丙车间的产品中抽取了3件,则下列说法正确的是( )
A.甲车间应抽取6件 B.乙车间应抽取8件
C. D.该抽样方法是随机抽样
三、填空题
11.某校高一年级共有500名学生参加学校组织的活动(每人只参加一项活动),其中参加“党团队一体化公益实践活动”的有125人,参加“心理健康游园活动”的有人、参加“湿地奔跑活动”的有人,现用分层抽样的方法,从中抽取100名学生了解他们的健康情况;如果已知参加“心理健康游园活动”的学生抽取了56人,则参加“湿地奔跑活动”的学生要抽取的人数为________.
12.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 15 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第5列开始向右依次读取数据,则得到的第4个样本编号是_____.
13.重庆一中高一,高二,高三的模联社团的人数分别为25,15,10,现采用分层抽样的方法从中抽取部分学生参加模联会议,已知在高二年级和高三年级中共抽取5名同学,若从这5名同学中再随机抽取2名同学承担文件翻译工作,则抽取的两名同学来自同一年级的概率为__________.
四、解答题
14.下面的抽样中适合用简单随机抽样的有哪些?
(1)某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈;
(2)从10台冰箱中抽出3台进行质量检查;
(3)某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了解在编人员对学校机构改革的意见,要从中抽取一个容量为20的样本;
(4)某乡农田有:山地800公顷,丘陵1200公顷,平地2400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量.
15.当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测.
(1)在这个问题中,总体、样本各是什么?
(2)为深入了解这50名学生的视力情况,从中随机抽取6人,分别写出利用抽签法和随机数法抽取该样本的过程.
16.某机构美术类艺体生的专业测试和文化测试成绩随机抽样统计如下(单位:人):
文化成绩
专业成绩
优秀
良好
及格
优秀
6
4
8
良好
m
3
n
及格
4
3
5
已知样本中恰有10%的考生专业和文化成绩均为及格,恰有30%的考生专业成绩为优秀.
(1)求m,n的值;
(2)在抽取的专业成绩为优秀和良好的学生中,用分层随机抽样的方法抽取5人,分别求抽取的5人中专业成绩为优秀和良好的人数.
1 / 10
学科网(北京)股份有限公司
$