内容正文:
第12讲 随机抽样
【人教A版2019】
模块一
简单随机抽样
1.抽样调查的必要性
(1)相关概念
名称
定义
全面调查(普查)
对每一个调查对象都进行调查的方法.
抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体
调查对象的全体.
个体
从总体中抽取的那部分个体.
样本
从总体中抽取的那部分个体.
样本量
样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法
优点
缺点
适用范围
抽签法
简单易行.
总体量较大时,操作起来比较麻烦.
适用于总体中个体数不多的情形.
随机数法
简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题.
总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便.
总体量较大,样本量较小的情形.
4.总体平均数与样本平均数
(1)概念
名称
定义
总体均值(总体平均数)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式.
样本均值(样本平均数)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数;
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
(2)求和符号∑的性质
①;
②,其中k为常数.
【题型1 简单随机抽样的特征及适用条件】
【例1.1】(2025高三·全国·专题练习)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
【解题思路】按照简单随机抽样的定义判断即可.
【解答过程】解:①从无限多个个体中抽取100个个体作为样本,不满足总体个数为有限个;
②从20件玩具中一次性抽取3件进行质量检验,不满足逐个抽取;
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛,不满足随机抽取;
④盒子中共有80个零件,从中选出5个零件进行质量检验,
在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里,满足有放回简单随机抽样.
综上可得以上满足简单随机抽样的定义的仅有④.
故选:B.
【例1.2】(2024高三·全国·专题练习)下列抽样的方式属于简单随机抽样的个数为( )
①从500个个体中一次性抽取50个作为样本;
②将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;
③某班有55个同学,指定个子最高的5名同学参加学校组织的篮球赛;
④福利彩票用摇奖机摇奖.
A.1 B.2 C.3 D.4
【解题思路】由简单随机抽样的定义对各个抽取方式进行判断即可得到结论.
【解答过程】①不是逐个抽取,③不是等可能抽取,故不是简单随机抽样,②④是简单随机抽样.
故选:B.
【变式1.1】(2024高一下·全国·专题练习)判断下面的抽样方法是否为简单随机抽样,并说明理由.
(1)某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向10个顾客询问是否购买了该商品
(2)某班45名同学,指定个子最矮的5名同学参加学校组织的某项活动;
(3)从20个相同的零件中一次性抽出3个进行质量检查
【解题思路】(1)由简单随机抽样的定义判断即可;
(2)由简单随机抽样的定义判断即可;
(3)由简单随机抽样的定义判断即可;
【解答过程】(1)不是简单随机抽样;被抽取的样本的总体个数不确定.
(2)不是简单随机抽样;因为指定个子最矮的5名同学,是在45名同学中特指的,不是等可能抽样.
(3)不是简单随机抽样;因为一次性抽取3个不是逐个抽取,不符合简单随机抽样的特征.
【变式1.2】(2024高一下·全国·专题练习)判断下列抽取样本的方式是否属于简单随机抽样?
(1)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
(2)从20件玩具中一次性抽取3件进行质量检验;
(3)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛;
(4)环保人员在上游取河水进行化验,了解河流的污染状况;
(5)从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号).
【解题思路】(1)(2)(3)(4)(5)根据简单随机抽样的特征逐个分析即可.
【解答过程】(1)不是,该抽样是放回抽样;
(2)不是,因为题中是“一次性”抽取,而不是“逐个”抽取;
(3)不是,因为题中“指定个子最高的5名同学”不存在随机性,不是等可能抽样;
(4)不是,因为题中“在上游”不具有代表性也没有随机性和等可能性;
(5)是简单随机抽样,符合简单随机抽样特征.
【题型2 抽签法及其应用】
【例2.1】(23-24高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【解题思路】根据抽签法的适用条件,结合选项依次判断即可.
【解答过程】选项A,总体中的个体数较大,样本容量也较大,不适合用抽签法,故A不符合题意;
选项B,总体中的个体数较小,样本容量也较小,
且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法,故B符合题意;
选项C,甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法,故C不符合题意;
选项D,总体中的个体数较大,不适合用抽签法,故D不符合题意.
故选:B.
【例2.2】(2024高三·全国·专题练习)在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【解题思路】根据随机抽样的特征,即可判断出结果.
【解答过程】由于第一次剔除时采用抽签法,对每个人来说可能性相等,
然后随机抽取10人对每个人的机会也是均等的,
所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.
故选:B.
【变式2.1】(23-24高一上·全国·课后作业)要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.
【解题思路】由于总体和样本都比较少,可以选择简单随机抽样的方法.
【解答过程】抽签法:步骤如下
(1)将30辆汽车编号,号码是01,02,…,30;
(2)将号码分别写在大小相同的纸条上,揉成团,制成号签;
(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次抽取3个号签,并记录上面的编号;
(5)所得号码对应的3辆汽车就是要抽取的对象.
【变式2.2】(24-25高一上·全国·课前预习)某单位拟从40名员工中选5人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取5个号签,与这个号签编号一致的员工是幸运人选;
选法二:将35个白球与5个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选,试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能是否相等?
【解题思路】根据抽签法的特征,进行求解即可.
【解答过程】(1)选法一满足抽签法的特征,是抽签法,选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的35个白球,5个红球均无法相互区分.
(2)由于选法一中抽取每个号签和选法二中摸到每个球都是等可能的,因此这两种选法中每名员工被选中的可能性相等.
【题型3 随机数法及其应用】
【例3.1】(23-24高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,,649,650.从中抽取50个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
【解题思路】按照随机数表提供的数据,三位一组的读数,并取001到650内的数,重复的只取一次,读取到第4个即可.
【解答过程】从第5行第6列开始向右读取数据,
第一个数为253,第二个数是313,
第三个数是457,下一个数是860,不符合要求,
下一个数是736,不符合要求,下一个是253,重复,
第四个是007,故A正确.
故选:A.
【例3.2】(2024·陕西·一模)我校高三年级为了学生某项身体指标,利用随机数表对650名学生进行抽样,先将650进行编号,001,002,,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第7个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
【解题思路】依据随机数表的读取规则求解即可.
【解答过程】从表中第5行第6列开始向右读取数据,
前7个数据分别是253,313,457,007,328,623,072.
故选:C.
【变式3.1】(23-24高二·上海·课堂例题)某校为了解高二年级学生对于某知识点的掌握情况,在一次数学考试后,按照1:30的比例抽取一组样本试卷进行分析.该校高二年级有12个班,共540人,每班人数如下表所示.请利用随机数表法进行抽取,并写出过程.
班级
一班
二班
三班
四班
五班
六班
人数
43
47
47
43
47
43
班级
七班
八班
九班
十班
十一班
十二班
人数
44
47
46
43
47
43
【解题思路】计算出所需抽取人数后,将540人编号,而后从随机数表定开始位,然后依次按规则开始选取编号数,超过或重复的去掉,最后保留所需个数即可.
【解答过程】,即需抽取18人,
第一步:将540人从一班开始编号为001,002,003,,539,540;
第二步,选定随机数表中的某一个数作为开始位;
第三步,从选定的数字开始,按三个数字一组向右读下去,
一行读完时转下一行自左向右继续读,不在001至540之间的数跳过,
已读过的重复数字去掉,直到取足18个数字为止;
以上18个数字编号对应学生作为抽取的样本.
【变式3.2】(2024高一下·全国·专题练习)某市质监局要检查某公司某个时间段生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取10袋进行检验.
(1)利用随机数法抽取样本时,应如何操作?
(2)如果用随机数法生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.
162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567,199,810,507,175,128,673,580,667.
【解题思路】(1)根据随机数法抽取样本的原则操作即可;
(2)根据随机数与编号相对应,一次写出即可;
【解答过程】(1)第一步,将500袋牛奶编号为001,002,…,500.
第二步,用随机数工具产生1~500范围内的整数随机数.
第三步,把产生的随机数作为抽中的编号,使与编号对应的袋装牛奶进入样本.
第四步,重复上述过程,直到产生10个不同编号为止.
(2)应抽取的袋装牛奶的编号为162,277,354,384,263,491,175,331,455,068.
【题型4 简单随机抽样估计总体】
【例4.1】(24-25高一上·辽宁·期末)我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.133石 B.159石 C.336石 D.168石
【解题思路】根据254粒内夹谷28粒可得比例,即可解决.
【解答过程】由题意得,这批米内夹谷约为石,
故选:D.
【例4.2】(2024·河南·三模)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶,2022年2月4日北京冬奥会开幕式,以二十四节气的方式开始倒计时,惊艳全球.某小学一年级随机抽查100名学生并提问“二十四节气歌”,只能说出两句的有32人,能说出三句或三句以上的有45人,据此估计该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为( )
A.23 B.92 C.128 D.180
【解题思路】先计算100名学生中能说出一句或一句也说不出的人数,根据抽样比例计算即可
【解答过程】由题意,100名学生中能说出一句或一句也说不出的人数为人
故该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为人
故选:B.
【变式4.1】(23-24高一下·江苏常州·期末)为估计某草场内兔子的数量,使用以下方法:先随机从草场中捕捉兔子100只,在每只兔子的尾巴上作上记号后放回草场.再随机从草场中捕捉60只,若尾巴上有记号的兔子共有10只,估计此草场内约有兔子 只.
【解题思路】利用简单随机抽样,结合样本估计总体可解.
【解答过程】假设草场约有n只兔子,则,则.
故答案为:600.
【变式4.2】(23-24高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为 24 .
【解题思路】根据统计学家利用的方法列比例式计算,即可求得答案.
【解答过程】由于用前n个区间的平均长度估计所有个区间的平均长度,
而缴获坦克的编号是3,5,12,18,20,即,
故,
即则统计学家利用上述方法估计德军每月生产的坦克数为24,
故答案为:24.
模块二
分层随机抽样
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即
①=;
②=.
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和
为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,第1层、第2层的样本平均数分别为,总体平均数为,样本平均数为,则.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
又==,
所以.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【题型5 抽样方法的选取】
【例5.1】(2024高一下·全国·专题练习)①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【解题思路】根据分层抽样和简单随机抽样的特点判断即可.
【解答过程】对于①:考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
对于②:总体包含的个体较少,用简单随机抽样比较恰当.
故选:A.
【例5.2】(23-24高一上·全国·课后作业)现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查.
③某中学共有320名教职工,其中教师240名,行政人员32名,后勤人员48名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为40的样本.
较为合理的抽样方法的选择是( )
A.①简单随机抽样,②分层随机抽样,③分层随机抽样
B.①简单随机抽样,②分层随机抽样,③简单随机抽样
C.①分层随机抽样,②简单随机抽样,③分层随机抽样
D.①分层随机抽样,②抽签法,③简单随机抽样
【解题思路】根据抽样定义判断各个小题即可.
【解答过程】①总体和样本量都很小,用简单随机抽样;
②③总体由差异明显的几部分构成,用分层随机抽样.
故选:A.
【变式5.1】(24-25高一·湖南·课后作业)某公司甲、乙、丙、丁四个地区分别有150个,120个,180个,150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.完成①②这两项调查时,宜分别采用何种抽样方法?
【解题思路】①根据甲、乙、丙、丁四个地区有明显差异求解;②数量较小,且无差异求解.
【解答过程】①因为甲、乙、丙、丁四个地区情况不同,
所以宜采用分层抽样方法;
②因为从丙地区20个特大型销售点中抽7个,数量较小,且无差异,
所以宜采用简单随机抽样方法.
【变式5.2】(24-25高一·全国·课堂例题)下列问题中,采用哪种抽样方法较为合理?
(1)某微波炉厂质量检查组为了解某批次1000台微波炉的使用寿命.
(2)每年6月6日是“全国爱眼日”.某县卫生部门要调查该县中小学生视力保护情况,已知该县有小学生12000名,初中生10000名,高中生6000名.
(3)某校要调查该校九年级400名学生身高和体重情况,以供该校营养师参考进而指导食堂伙食营养搭配.
【解题思路】根据随机数法,抽签法和分层抽样的概念与特征分析判断.
【解答过程】(1)由于总体容量较大,可采用随机数法进行抽样.
(2)由于总体容量大,并且具有明显的分层性,因而应当先采用分层抽样,然后再在每层采用随机数法进行抽样.
(3)由于总体容量较大,男女学生在身高和体重方面又有较大的差异,所以应当先采用分层抽样,然后对男生和女生分别用抽签法进行抽样.
【题型6 抽样比、样本总量、各层总数、总体容量的计算】
【例6.1】(24-25高三上·江西景德镇·阶段练习)我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡四百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有400人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200 B.100 C.120 D.140
【解题思路】根据分层抽样的定义结合题意列方程求解即可
【解答过程】设北面共有人,则由题意可得
,解得
所以北面共有120人,
故选:C.
【例6.2】(23-24高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,高二,高三共有学生6000名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这6000名学生中抽取一个容量60的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
【解题思路】根据分层抽样的性质,结合样本容量进行求解即可.
【解答过程】因为从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,
所以设高三抽取的人数为,则高二抽取的人数为,高一抽取的人数为,
因为样本容量为60,所以,
设我校高二年级的人数为,
根据分层抽样得:,
故选:C.
【变式6.1】(2024高一·全国·专题练习)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为175,方差为20,女生样本均值为165,方差为30
(1)如果已知男、女的样本量按比例分配,请计算总样本的均值为多少?
(2)如果已知男、女的样本量都是25,请计算总样本均值为多少?
【解题思路】(1)分析题意,得到分层比,再进行计算均值即可
(2)首先找出男、女的样本量都是25,进行总样本均值计算即可.
【解答过程】(1)男、女的样本量按比例分配,
总样本的均值为cm.
(2)男、女的样本量都是25,
总样本的均值为cm.
【变式6.2】(24-25高一下·全国·课后作业)某大型企业针对改善员工福利的,,三种方案进行了问卷调查,调查结果如下:
支持方案
支持方案
支持方案
35岁以下的人数
200
400
800
35岁及以上的人数
100
100
400
(1)从所有参与调查的人中,用分层随机抽样的方法抽取人,已知从支持方案的人中抽取了6人,求的值.
(2)从支持方案的人中,用分层随机抽样的方法抽取5人,这5人中年龄在35岁及以上的人数是多少?年龄在35岁以下的人数是多少?
【解题思路】(1)根据分层抽样时,各层的抽样比相等,结合已知构造关于n的方程,解方程可得n值;
(2)根据抽样比即可求出年龄在35岁以下,及年龄在35岁及以上的人数.
【解答过程】(1)由题意得,解得.
(2)年龄在35岁以下的人数为,
年龄在35岁及以上的人数为.
【题型7 分层抽样的概率计算】
【例7.1】(2024·湖北·模拟预测)从一个容量为的总体中抽取一个容量为3的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
【解题思路】由简单随机和随机抽样,每个个体被抽中的概率相等的特点可得答案.
【解答过程】
∵随机抽样每个个体被抽到的概率相等,
∴选取分层抽样抽取样本时总体中每个个体被抽中的概率仍为,
故选:A.
【例7.2】(24-25高三上·江西吉安·期末)垃圾分类,人人有责.北京市从2020年5月1日开始实施《北京市生活垃圾管理条例》,北京将生活垃圾分为有害垃圾、可回收物、厨余垃圾和其他垃圾四类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了某区四类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):
“有害垃圾”箱
“可回收物”箱
“厨余垃圾”箱
“其他垃圾”箱
有害垃圾
60
5
5
10
可回收物
5
185
10
10
厨余垃圾
10
40
540
10
其他垃圾
5
15
10
80
则下列结论中不正确的是( )
A.厨余垃圾占垃圾总量的60% B.有害垃圾投放正确的概率为75%
C.厨余垃圾投放正确的概率为90% D.生活垃圾投放错误的概率为15%
【解题思路】根据表中数据计算出厨余垃圾、垃圾总量可判断A;计算出正确投放有害垃圾的总量和有害垃圾的总量可判断B;计算出正确投放厨余垃圾的总量和厨余垃圾的总量可判断C;先计算出生活垃圾投放正确的概率再用1减去这个值,可得生活垃圾投放错误的概率可判断D.
【解答过程】厨余垃圾共(吨),占垃圾总量的60%,选项A正确;
有害垃圾投放正确的概率为,选项B正确;
厨余垃圾投放正确的概率为,选项C正确;
生活垃圾投放正确的概率为,生活垃圾投放错误的概率为13.5%,选项D错误.
故选:D.
【变式7.1】(23-24高一下·天津滨海新·期末)从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
【解题思路】根据简单随机抽样、分层抽样的定义即可得到结论.
【解答过程】根据抽样调查的原理可得简单随机抽样,分层抽样都必须满足每个个体被抽到的概率相等,即.
故选:B.
【变式7.2】(2024·广西柳州·模拟预测)某高中高一学生从物化生政史地六科中选三科组合,其中选物化生组合的学生有600人,选物化地组合的学生有400人,选政史地组合的学生有250人,现从高一学生中选取25人作样本调研情况.为保证调研结果相对准确,下列判断错误的是( )
A.用分层抽样的方法抽取物化生组合的学生12人
B.用分层抽样的方法抽取政史地组合的学生5人
C.物化生组合学生小张被选中的概率比物化地组合学生小王被选中的概率大
D.政史地组合学生小刘被选中的概率为
【解题思路】根据分层抽样,计算各层抽取的人数以及抽样比,即可得出答案.
【解答过程】对于A项,用分层抽样的方法抽取物化生组合的学生为 人,故A项正确;
对于B项,用分层抽样的方法抽取政史地组合的学生为,故B项正确;
对于C项,根据分层抽样的特征知,每位同学被选中的概率相等,均为,故C项错误;
对于D项,由C知,每位同学被选中的概率均为,故D项正确.
故选:C.
模块三
获取数据的途径
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型8 普查与抽样】
【例8.1】(24-25高一上·江西·阶段练习)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
【解题思路】根据全面调查的定义可得出合适的选项.
【解答过程】全面调查是对调查对象的所有单位一一进行调查的调查方式,
A. 查一个水库所有鱼中草鱼所占的比例.,调查数目较多,不适合全面调查;
B. 调查一个县各村的粮食播种面积适合全面调查;
C.调查一批炮弹的杀伤半径,调查数目较多,可以使用抽样调查;
D. 调查一批玉米种子的发芽率,调查数目较多,且具有破坏性,不适合全面调查.
故选:B.
【例8.2】(23-24高一下·北京顺义·期末)在以下4项调查中:
①调查一个40人班级的学生每周的体育锻炼时间;
②调查某省的一种结核病的发病率;
③调查一批食品的合格率;
④调查一个水库所有鱼中草鱼所占的比例;
适合用全面调查的是( )
A.① B.② C.③ D.④
【解题思路】根据全面调查的定义判断即可.
【解答过程】根据全面调查的定义可知,①适合用全面调查,②③④适合用抽样调查.
故选:A.
【变式8.1】(24-25高二上·上海·课后作业)某班班长就全班同学的学习习惯进行了一次普查,他向同学们询问了以下三个问题:
(1)你每天有多少时间来写作业?
(2)你上课认真听讲吗?
(3)你抄袭其他同学的作业吗?
试分析他设计的这三个问题有什么不足之处.
【解题思路】根据普查的特点分别分析存在的问题即可.
【解答过程】(1)每天做作业的时间不一定相同,这个问题应该用平均时间.
(2)上课时走神是很多人都会有的习惯,只是程度不同,宜设计为选择题,选择设置为一直认真听讲、偶尔走神、经常走神.
(3)抄袭作业是不好的习惯,很多人不愿意正面回答,调查问卷应该设计为不记名问卷.
【变式8.2】(23-24高一上·全国·课后作业)为调查某小区平均每户居民的月用水量,下面是2名同学设计的方案:
学生甲:我把这个小区用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;
学生乙:我给我们居民小区的每一个住户发一张用水量调查表,大概需要一周左右的时间就可以统计出小区平均每户居民的月用水量.
请你分析上述2名学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?
【解题思路】甲同学的方案收集的数据针对性较差些,乙同学的方案用时长,但是数据较为准确.
【解答过程】学生甲的方案得到的样本不能够反映不上网的居民的用水情况,它是一种方便样本,所得到的样本代表性差,不能准确地获得平均每户居民的月用水量.
学生乙的方案实际上是普查,花费的人力、物力更多一些,但是只要统计过程不出错,就可以准确地得到平均每户居民的月用水量.
一、单选题
1.(23-24高二·上海·课堂例题)下列抽样方法中,属于简单随机抽样的是( )
A.某社团为调查本校学生的环保知识水平,向在图书馆某楼层自习的所有学生发放问卷,隔5分钟后回收;
B.某次科普讲座之前,主持人抽取座位尾号为1的听众进行提问;
C.一车间主任从堆放的100件产品中抽取了摆放在最上面的10件产品进行检查;
D.销售部经理将一个放有部门所有员工工号牌的箱子均匀摇晃后,从中抽取5个工号牌.
【解题思路】根据简单随机抽样的特点逐项判断即可.
【解答过程】对于A项,人数较多,且图书馆的学生不能代表本校全体学生,故A项错误;
对于B项,按照相同间隔抽取的方法,是系统抽样,不是简单抽样,故B项错误;
对于C项,抽取的产品不具有代表性,故C项错误;
对于D项,符合简单随机抽样的定义,故D项正确.
故选D.
2.(24-25高一·全国·单元测试)某市场监管局对所管辖的某超市在售的40种冷冻饮品中抽取了20种冷冻饮品,对其质量进行了抽检,则( )
A.该市场监管局的调查方法是普查
B.样本的个体是每种冷冻饮品的质量
C.样本的总体是超市在售的40种冷冻饮品
D.样本容量是该超市的20种冷冻饮品数
【解题思路】根据抽样方法、样本、总体、个体的概念可得答案.
【解答过程】该市场监管局的调查方法是随机抽样,A错误;
样本的个体是每种冷冻饮品的质量,B正确;
样本的总体是超市在售的40种冷冻饮品的质量,C错误;
样本容量是20,D错误,
故选:B.
3.(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【解题思路】根据条件,利用简单随机抽样的定义,即可求解.
【解答过程】总体有个个体,每个个体被抽到的概率相同,均为,
故选:D.
4.(24-25高二上·广东佛山·期末)甲乙两名同学参加羽毛球单打比赛,比赛规则是3局2胜制.现通过设计模拟实验估算概率,用1,3,5表示一局比赛甲获胜,用2,4表示一局比赛乙获胜.利用计算机产生20组随机数:
423 123 423 344 114 453 525 332 152 342
534 443 512 541 125 432 334 151 314 254
由此估计甲赢得比赛的概率为( )
A.0.6 B.0.65 C.0.7 D.0.75
【解题思路】先根据题中数据得甲获胜的场数为13场,进而可得甲赢得比赛的概率为.
【解答过程】由题中数据可知甲获胜的场数为13场,
故甲赢得比赛的概率为,
故选:B.
5.(24-25高一下·全国·课堂例题)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.系统抽样法 B.简单随机抽样法
C.分层随机抽样法 D.随机数法
【解题思路】由分层抽样的适用条件即可判断;
【解答过程】由题意可知,总体由差异明显的三部分构成,所以选用分层随机抽样法.
故选:C
6.(24-25高三下·河南周口·阶段练习)某校高三年级共有2000人,其中男生1200人,女生800人,某次考试结束后,学校采用按性别分层随机抽样的方法抽取容量为的样本,已知样本中男生比女生人数多8人,则( )
A.20 B.30 C.40 D.48
【解题思路】利用分层抽样的性质直接求解.
【解答过程】根据分层抽样的性质可知,样本中男生人数为:,
样本中女生人数为:,
由题意,所以,
所以.
故选:C.
7.(2024·四川乐山·三模)为了解某中学三个年级的学生对食堂饭菜的满意程度,用分层随机抽样的方法抽取30%的学生进行调查,已知该中学学生人数和各年级学生的满意率分别如图1和图2所示,则样本容量和抽取的二年级学生中满意的人数分别为( )
A.800,360 B.600,108 C.800,108 D.600,360
【解题思路】由扇形图求出三个年级的学生总人数,进而求出样本容量,求出抽取的二年级学生人数,再结合二年级学生的满意率求解.
【解答过程】由扇形图可知,三个年级的学生总人数为人,
所以样本容量为人,
因为抽取的二年级学生人数为人,
所以抽取的二年级学生中满意的人数为人.
故选:B.
8.(2025·上海·模拟预测)标志重捕法是指的是在一定范围内,对活动能力强、活动范围较大的动物种群进行粗略估算的一种生物统计方法,是根据自由活动的生物在一定区域内被调查与自然个体数的比例关系对自然个体总数进行数学推断.在被调查种群的生存环境中,捕获一部分个体,将这些个体进行标志后再放回原来的环境,经过一段时间后进行重捕,根据重捕中标志个体占总捕获数的比例来估计该种群的数量.标志重捕法估算种群密度是基于以下几种假设:①标记个体与未标记个体在重捕时被捕获的概率相等;②在调查期内标记的个体没有死亡,没有迁出,标记物没有脱落;③标记个体在种群中均匀分布.若应用标志重捕法调查鱼的种群密度,则下列捕鱼过程会导致估算结果与实际情况误差较大的是( ).
A.第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼
B.第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
C.第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼
D.第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
【解题思路】先计算出理论数量,分别分析四个选项,结合公式,得到ABC选项,采用标志重捕法估算出的种群数量与实际种群数量大致相等;D选项,采用标志重捕法估算出的种群数量越等于种群中大鱼数量,与实际种群数量相比小.
【解答过程】理论计算公式为,其中为估算的种群数值,为第一次捕获并标记的个体,
为一段时间后,在原来的捕获点再次捕获的个体数,为二次捕获的个体中有标记的数量,
转换后得,
假设池塘中的鱼分为大鱼和小鱼,大鱼是指用大网和小网均能捕获的鱼,小鱼指仅能用小网能捕获的鱼,
A选项,第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼,
第一次用小网眼的渔网捕鱼,,其中为捕获并标记的大鱼,为捕获并标记的小鱼,
设为池塘中实际的大鱼数,为池塘中实际的小鱼数,为池塘中实际的鱼条数,
则,
标记后全部放回池塘后,池塘中被标记的大鱼占全部大鱼比例为,被标记的小鱼占全部小鱼比例为,
假设每条鱼被捕获的概率相等,故,
第二次捕获的大鱼条中,理论上含标记的大鱼有,
第二次捕获的小鱼条中,理论中含标记的小鱼有,
故,
故总的标记条数为,
所以,又,故,
结论:若两次捕鱼都用小网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
B选项,第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
第一次用小网眼的渔网捕鱼,,其中为捕获并标记的大鱼,为捕获并标记的小鱼,
设为池塘中实际的大鱼数,为池塘中实际的小鱼数,
标记后全部放回池塘后,池塘中被标记的大鱼占全部大鱼比例为,被标记的小鱼占全部小鱼比例为,
假设每条鱼被捕获的概率相等,故,其中为池塘中实际的鱼条数,
第二次用大网眼渔网捕鱼,捕获的全部是大鱼,即,
理论上,,故,又,故,
结论:第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
C选项,第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼,
第一次用大网眼的渔网捕鱼,,标记后将鱼全部放回到池塘后,
池塘中被标记的大鱼占全部大鱼比例为,
第二次用小网眼渔网捕鱼,捕获的鱼中既有大鱼也有小鱼,,
由于第一次用大网眼渔网捕鱼,标记的均为大鱼,故第二次捕获的鱼中,只有大鱼也有可能被标记,
理论上,,
其中,
因为每条鱼捕获的概率相等,所以第二次用小网眼渔网捕获的鱼中,
大鱼和小鱼的比例与池塘中的大鱼和小鱼的比例相等,即,
所以,
结论:第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼,
采用标志重捕法估算出的种群数量与实际种群数量大致相等;
D选项,第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
第一次用大网眼的渔网捕鱼,,标记后将鱼全部放回到池塘后,
池塘中被标记的大鱼占全部大鱼比例为,
第二次用大网眼渔网捕鱼,捕获的全部是大鱼,即,
理论上,,故,又,故,
结论:第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼,
采用标志重捕法估算出的种群数量约等于种群中大鱼数量,与实际种群数量相比小,误差大;
故选:D.
二、多选题
9.(23-24高一下·甘肃兰州·期中)为了了解参加运动会的1500名运动员的年龄情况,从中抽取了150名运动员的年龄进行调查,则下列说法正确的是( )
A.1500名运动员的年龄是总体
B.抽取到的150名运动员是样本
C.这个抽样方法可以采取随机数表法抽样
D.每个运动员被抽到的机会相等
【解题思路】根据总体、样本的定义,结合随机抽样的性质逐一判断即可.
【解答过程】1500名运动员是总体,故A错误;抽取到的150名运动员是样本,故B正确;随机数表法常常用于总体的个体较少时,当总体中的个体数较多时,编号复杂,将总体“傥拌均匀”也比较困难,用随机数表法产生的代表性不合理,故C错误;在简单的随机抽样时,每个运动员被抽到的机会是相等的,故D正确.
故选:BD.
10.(24-25高一·全国·课后作业)(多选)对下面三个事件最适宜采用的抽样方法判断正确的有( )
①从某厂生产的3000件产品中抽取600件进行质量检验;
②一次数学竞赛中,某班有10人的成绩在110分以上,40人的成绩在90~110分,10人的成绩低于90分,现在从中抽取12人的成绩了解有关情况;
③运动会服务人员为参加400m决赛的6名同学安排跑道.
A.①②适宜采用分层抽样 B.②③适宜采用分层抽样
C.②适宜采用分层抽样 D.③适宜采用简单随机抽样
【解题思路】根据简单随机抽样、分层抽样、系统抽样的特征进行判断.
【解答过程】对于①,从某厂生产的3000件产品中抽取600件进行质量检验,不满足分层抽样的条件,且样本容量比较大,适合采用等距抽样;
对于②,总体由差异明显且互不重叠的几部分组成,若要从中抽取12人的成绩了解有关情况,适合采用分层抽样的方法;
对于③,运动会服务人员为参加决赛的6名同学安排跑道,具有随机性,且样本容量小,适合用简单随机抽样.故A,B错误.
故选:CD.
11.(23-24高一下·江苏淮安·期末)某学校为了解学校学生视力健康状况,降低学生近视率,增强学生爱眼护眼意识,对三个年级的学生视力健康状况进行调研,已知高一、高二、高三的学生人数之比为4:3:3,现用分层抽样方法抽取一个容量为 n的样本,样本中高一年级学生人数为200人,则( )
A.该校三个年级总的学生数为5000人 B.样本容量n为500
C.该校高二年级总的学生数有1500人 D.样本中高二年级学生数为150人
【解题思路】利用分层抽样性质确定抽样比即可求解.
【解答过程】设样本中高二、高三的学生人数分别为a,b,
则,
则,故D正确,
故样本容量,故B正确;
无法确定该校三个年级总的学生数和该校高二年级总的学生数,故AC错误;
故选:BD.
三、填空题
12.(23-24高一上·江西上饶·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米3285石,验得米内有夹谷,抽样取米一把,数得261粒米内有夹谷29粒,则这批米内夹谷约为
石.
【解题思路】用样本频率估计总体频率,按比例计算.
【解答过程】设这批米内夹谷约为粒,则,解得,
则这批米内夹谷约为.
故答案为:.
13.(23-24高一下·福建宁德·阶段练习)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第7列开始向右依次读取数据,则得到的第5个样本编号是 09 .
【解题思路】结合随机数表法定义,按照题意依次读出前个数即可.
【解答过程】从随机数表第1行的第7列数字开始由左向右每次连续读取2个数字,
删除超出范围及重复的编号,符合条件的编号有37,14,05,11,09,
所以选出来的第5个个体的编号为09.
故答案为:09.
14.(23-24高一下·湖南永州·期末)某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 168 .
【解题思路】根据分层抽样的概念列式求解.
【解答过程】设抽取的学生中男生人数为a,女生人数为b,
则,且,解得a=96,b=72,
则被抽取的学生人数是96+72=168.
故答案为:168.
四、解答题
15.(2024高一下·全国·专题练习)在以下调查中,总体、个体各是什么?哪些适合用全面调查?哪些适合用抽样调查?
(1)调查一个班级学生每周的体育锻炼时间;
(2)调查一个地区结核病的发病率;
(3)调查一批炮弹的杀伤半径;
(4)调查一个水库所有鱼中草鱼所占的比例.
【解题思路】(1)(2)(3)(4)根据总体和个体概念以及普查和抽查的适用范围一一分析即可.
【解答过程】(1)总体是全班学生,个体是这个班的每一位学生,适合用全面调查,
(2)总体是整个地区的居民,个体是这个地区的每一位居民,适合用抽样调查,
(3)总体是这批炮弹,个体是这批炮弹的每一个炮弹,适合用抽样调查.
(4)总体是这个水库里所有的鱼,个体是这个水库里的每一条鱼,适合用抽样调查.
16.(2024高一下·全国·专题练习)某电视台举行颁奖典礼,邀请20名艺人演出,其中从甲地30名艺人中随机挑选10人,从乙地18名艺人中随机挑选6人,从丙地10名艺人中随机挑选4人.试分别用抽签法和随机数法确定选中的艺人.
【解题思路】根据题意,分别按抽签法和随机数法的基本步骤依次分析,可得答案.
【解答过程】抽签法:
(1)将甲地30名艺人从01到30编号,然后用大小、质地完全相同的纸条做成30个号签,在每个号签上写上这些编号,揉成团,然后放入一个不透明小筒中摇匀,从中逐个不放回地抽出10个号签,则相应编号的艺人参加演出.
(2)运用相同的办法分别从乙地18名艺人中抽取6人,从丙地10名艺人中抽取4人.
随机数法:
(1)将甲地30名艺人从01到30编号,准备10个大小、质地完全一样的小球.小球上分别写上数字0,1,2,…,
把它们放入一个不透明的袋中,从袋中有放回地摸取2次,每次摸取前充分搅匀,并把第一次、第二次摸到的数字分别作为十位、个位数字,这样就生成了一个随机数,如果这个随机数在1~30范围内,就代表了对应编号的艺人被抽中,否则舍弃编号,重复抽取随机数,直到抽中10名艺人为止.
(2)运用相同的办法分别从乙地18名艺人中抽取6人,从丙地10名艺人中抽取4人.
17.(24-25高一·全国·随堂练习)为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
【解题思路】(1)根据抽样的定义即可合理选取不同的抽样方式;
(2)利用简单随机抽样和分层抽样的定义即可写出具体步骤;
【解答过程】(1)根据题意可知,方式1采用的是简单随机抽样法,方式2采用的是分层抽样法;
(2)方式1抽样的步骤如下:
在全年级10个班中用抽签法任意抽取一个班级,考察他们的成绩;
方式2抽样的步骤如下:
第一步:分层
把该校高三年级的学生按成绩分成优秀、良好、普通三个级别;
第二步:确定各个层抽取的人数
由于样本容量与总体个数比值为,
所以每层抽取的个体数依次为人,人,人;
第三步:按层分别抽取样本人数
在优秀学生中用简单随机抽样法抽取6人,
在良好学生中用简单随机抽样法抽取18人,
在普通学生中用简单随机抽样法抽取16人.
18.(23-24高一下·全国·课后作业)高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
【解题思路】(1)先计算抽样比例,得到男生人数和女生人数,再计算平均身高得到答案.
(2)根据(1)的计算公式计算得到答案.
【解答过程】(1)抽取男生人数为,抽取女生人数为.
高二年级全体学生的平均身高估计为(cm).
(2)仍按(1)方式进行估计,即(cm).
19.(23-24高一下·河北邢台·阶段练习)已知某高速服务区餐厅的窗口有四类:①自选快餐,平均每份取餐时长为1分钟;②商务套餐,平均每份取餐时长为0.5分钟;③现炒现做,平均每份取餐时长为5分钟;④自动售货机,平均每份取餐时长为1分钟.已知该高速服务区餐厅的取餐窗口(每台自动售货机按1个取餐窗口计算)一共有18个,就餐高峰期时有400名消费者在等待就餐.为了提高消费者的用餐满意度,该高速服务区工作人员选取了100名用餐的消费者进行问卷调查,其中有50人选择了自选快餐,30人选择了商务套餐,15人选择了现炒现做,5人选择了自动售货机.(注:为了方便计算,若某消费者选择两类或多类就餐类别,则按该消费者的主要就餐类别归类,每名消费者只统计为其中一类).
(1)根据以上的调查统计,用样本估计总体,如果设置10个自选快餐窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类取餐的窗口前队伍长度各自相等),试问选择自选快餐的消费者最长等待时长是多少分钟?
(2)根据以上的调查数据统计,用样本估计总体,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等,应如何设置各类取餐窗口数(结果采用四舍五入法保留整数)?并说明理由.
【解题思路】(1)计算就餐高峰期时选择自选快餐的总人数,再根据平均分布求解即可;
(2)设自选快餐窗口个,商务套餐窗口个,现炒现做窗口个,自售货机台,再分别计算自选快餐、商务套餐、现炒现做、自售货机的最长等待时间,再依题意,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等列式求解即可.
【解答过程】(1)由题意得,就餐高峰期时选择自选快餐的总人数为,
这200人平均分布在10个自选快餐窗口,平均每个窗口等待取餐的人数为,所以选择自选快餐的消费者的最长等待时长为分钟.
(2)设自选快餐窗口个,商务套餐窗口个,现炒现做窗口个,自售货机台.
自选快餐高峰期就餐总人数为,每个窗口等待人数为,最长等待时长为分钟;
商务套餐高峰期就餐总人数为,每个窗口等待人数为,最长等待时长为分钟;
现炒现做高峰期就餐总人数为,每个窗口等待人数为,最长等待时长为分钟;
自动售货机高峰期就餐总人数为,每台售货机等待人数为,最长等待时长为分钟.
依题意,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等,
则可得,即有.
因为.所以,,,.
故应设置自选快餐、商务套餐、现炒现做的取餐窗口分别为6个,2个,9个,自动售货机1台.
第 1 页 共 28 页
学科网(北京)股份有限公司
$$
第12讲 随机抽样
【人教A版2019】
模块一
简单随机抽样
1.抽样调查的必要性
(1)相关概念
名称
定义
全面调查(普查)
对每一个调查对象都进行调查的方法.
抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体
调查对象的全体.
个体
从总体中抽取的那部分个体.
样本
从总体中抽取的那部分个体.
样本量
样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法
优点
缺点
适用范围
抽签法
简单易行.
总体量较大时,操作起来比较麻烦.
适用于总体中个体数不多的情形.
随机数法
简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题.
总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便.
总体量较大,样本量较小的情形.
4.总体平均数与样本平均数
(1)概念
名称
定义
总体均值(总体平均数)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式.
样本均值(样本平均数)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数;
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
(2)求和符号∑的性质
①;
②,其中k为常数.
【题型1 简单随机抽样的特征及适用条件】
【例1.1】(2025高三·全国·专题练习)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
【例1.2】(2024高三·全国·专题练习)下列抽样的方式属于简单随机抽样的个数为( )
①从500个个体中一次性抽取50个作为样本;
②将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;
③某班有55个同学,指定个子最高的5名同学参加学校组织的篮球赛;
④福利彩票用摇奖机摇奖.
A.1 B.2 C.3 D.4
【变式1.1】(2024高一下·全国·专题练习)判断下面的抽样方法是否为简单随机抽样,并说明理由.
(1)某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向10个顾客询问是否购买了该商品
(2)某班45名同学,指定个子最矮的5名同学参加学校组织的某项活动;
(3)从20个相同的零件中一次性抽出3个进行质量检查
【变式1.2】(2024高一下·全国·专题练习)判断下列抽取样本的方式是否属于简单随机抽样?
(1)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
(2)从20件玩具中一次性抽取3件进行质量检验;
(3)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛;
(4)环保人员在上游取河水进行化验,了解河流的污染状况;
(5)从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号).
【题型2 抽签法及其应用】
【例2.1】(23-24高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【例2.2】(2024高三·全国·专题练习)在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【变式2.1】(23-24高一上·全国·课后作业)要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.
【变式2.2】(24-25高一上·全国·课前预习)某单位拟从40名员工中选5人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取5个号签,与这个号签编号一致的员工是幸运人选;
选法二:将35个白球与5个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选,试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能是否相等?
【题型3 随机数法及其应用】
【例3.1】(23-24高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,,649,650.从中抽取50个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
【例3.2】(2024·陕西·一模)我校高三年级为了学生某项身体指标,利用随机数表对650名学生进行抽样,先将650进行编号,001,002,,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第7个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
【变式3.1】(23-24高二·上海·课堂例题)某校为了解高二年级学生对于某知识点的掌握情况,在一次数学考试后,按照1:30的比例抽取一组样本试卷进行分析.该校高二年级有12个班,共540人,每班人数如下表所示.请利用随机数表法进行抽取,并写出过程.
班级
一班
二班
三班
四班
五班
六班
人数
43
47
47
43
47
43
班级
七班
八班
九班
十班
十一班
十二班
人数
44
47
46
43
47
43
【变式3.2】(2024高一下·全国·专题练习)某市质监局要检查某公司某个时间段生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取10袋进行检验.
(1)利用随机数法抽取样本时,应如何操作?
(2)如果用随机数法生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.
162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567,199,810,507,175,128,673,580,667.
【题型4 简单随机抽样估计总体】
【例4.1】(24-25高一上·辽宁·期末)我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.133石 B.159石 C.336石 D.168石
【例4.2】(2024·河南·三模)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶,2022年2月4日北京冬奥会开幕式,以二十四节气的方式开始倒计时,惊艳全球.某小学一年级随机抽查100名学生并提问“二十四节气歌”,只能说出两句的有32人,能说出三句或三句以上的有45人,据此估计该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为( )
A.23 B.92 C.128 D.180
【变式4.1】(23-24高一下·江苏常州·期末)为估计某草场内兔子的数量,使用以下方法:先随机从草场中捕捉兔子100只,在每只兔子的尾巴上作上记号后放回草场.再随机从草场中捕捉60只,若尾巴上有记号的兔子共有10只,估计此草场内约有兔子 只.
【变式4.2】(23-24高一下·黑龙江哈尔滨·期末)二战期间盟军的统计学家主要是将缴获的德军坦克序列号作为样本,用样本估计总体的方法得出德军某月生产的坦克总数.假设德军某月生产的坦克总数是N,缴获的该月生产的n辆坦克编号从小到大为,,…,,即最大编号为,且缴获的坦克是从所生产的坦克中随机获取的,因为生产坦克是连续编号的,所以缴获坦克的编号,,…,,,相当于从中随机抽取的n个整数,这n个数将区间分成个小区间,由于N是未知的,除了最右边的区间外,其他n个区间都是已知的.由于这n个数是随机抽取的,所以可以用前n个区间的平均长度估计所有个区间的平均长度,进而得到N的估计值.例如,缴获坦克的编号是3,5,12,18,20,则统计学家利用上述方法估计德军每月生产的坦克数为 .
模块二
分层随机抽样
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即
①=;
②=.
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和
为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,第1层、第2层的样本平均数分别为,总体平均数为,样本平均数为,则.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
又==,
所以.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【题型5 抽样方法的选取】
【例5.1】(2024高一下·全国·专题练习)①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【例5.2】(23-24高一上·全国·课后作业)现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查.
③某中学共有320名教职工,其中教师240名,行政人员32名,后勤人员48名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为40的样本.
较为合理的抽样方法的选择是( )
A.①简单随机抽样,②分层随机抽样,③分层随机抽样
B.①简单随机抽样,②分层随机抽样,③简单随机抽样
C.①分层随机抽样,②简单随机抽样,③分层随机抽样
D.①分层随机抽样,②抽签法,③简单随机抽样
【变式5.1】(24-25高一·湖南·课后作业)某公司甲、乙、丙、丁四个地区分别有150个,120个,180个,150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为②.完成①②这两项调查时,宜分别采用何种抽样方法?
【变式5.2】(24-25高一·全国·课堂例题)下列问题中,采用哪种抽样方法较为合理?
(1)某微波炉厂质量检查组为了解某批次1000台微波炉的使用寿命.
(2)每年6月6日是“全国爱眼日”.某县卫生部门要调查该县中小学生视力保护情况,已知该县有小学生12000名,初中生10000名,高中生6000名.
(3)某校要调查该校九年级400名学生身高和体重情况,以供该校营养师参考进而指导食堂伙食营养搭配.
【题型6 抽样比、样本总量、各层总数、总体容量的计算】
【例6.1】(24-25高三上·江西景德镇·阶段练习)我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡四百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有400人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200 B.100 C.120 D.140
【例6.2】(23-24高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,高二,高三共有学生6000名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这6000名学生中抽取一个容量60的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
【变式6.1】(2024高一·全国·专题练习)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为175,方差为20,女生样本均值为165,方差为30
(1)如果已知男、女的样本量按比例分配,请计算总样本的均值为多少?
(2)如果已知男、女的样本量都是25,请计算总样本均值为多少?
【变式6.2】(24-25高一下·全国·课后作业)某大型企业针对改善员工福利的,,三种方案进行了问卷调查,调查结果如下:
支持方案
支持方案
支持方案
35岁以下的人数
200
400
800
35岁及以上的人数
100
100
400
(1)从所有参与调查的人中,用分层随机抽样的方法抽取人,已知从支持方案的人中抽取了6人,求的值.
(2)从支持方案的人中,用分层随机抽样的方法抽取5人,这5人中年龄在35岁及以上的人数是多少?年龄在35岁以下的人数是多少?
【题型7 分层抽样的概率计算】
【例7.1】(2024·湖北·模拟预测)从一个容量为的总体中抽取一个容量为3的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
【例7.2】(24-25高三上·江西吉安·期末)垃圾分类,人人有责.北京市从2020年5月1日开始实施《北京市生活垃圾管理条例》,北京将生活垃圾分为有害垃圾、可回收物、厨余垃圾和其他垃圾四类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了某区四类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):
“有害垃圾”箱
“可回收物”箱
“厨余垃圾”箱
“其他垃圾”箱
有害垃圾
60
5
5
10
可回收物
5
185
10
10
厨余垃圾
10
40
540
10
其他垃圾
5
15
10
80
则下列结论中不正确的是( )
A.厨余垃圾占垃圾总量的60% B.有害垃圾投放正确的概率为75%
C.厨余垃圾投放正确的概率为90% D.生活垃圾投放错误的概率为15%
【变式7.1】(23-24高一下·天津滨海新·期末)从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
【变式7.2】(2024·广西柳州·模拟预测)某高中高一学生从物化生政史地六科中选三科组合,其中选物化生组合的学生有600人,选物化地组合的学生有400人,选政史地组合的学生有250人,现从高一学生中选取25人作样本调研情况.为保证调研结果相对准确,下列判断错误的是( )
A.用分层抽样的方法抽取物化生组合的学生12人
B.用分层抽样的方法抽取政史地组合的学生5人
C.物化生组合学生小张被选中的概率比物化地组合学生小王被选中的概率大
D.政史地组合学生小刘被选中的概率为
模块三
获取数据的途径
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型8 普查与抽样】
【例8.1】(24-25高一上·江西·阶段练习)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
【例8.2】(23-24高一下·北京顺义·期末)在以下4项调查中:
①调查一个40人班级的学生每周的体育锻炼时间;
②调查某省的一种结核病的发病率;
③调查一批食品的合格率;
④调查一个水库所有鱼中草鱼所占的比例;
适合用全面调查的是( )
A.① B.② C.③ D.④
【变式8.1】(24-25高二上·上海·课后作业)某班班长就全班同学的学习习惯进行了一次普查,他向同学们询问了以下三个问题:
(1)你每天有多少时间来写作业?
(2)你上课认真听讲吗?
(3)你抄袭其他同学的作业吗?
试分析他设计的这三个问题有什么不足之处.
【变式8.2】(23-24高一上·全国·课后作业)为调查某小区平均每户居民的月用水量,下面是2名同学设计的方案:
学生甲:我把这个小区用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;
学生乙:我给我们居民小区的每一个住户发一张用水量调查表,大概需要一周左右的时间就可以统计出小区平均每户居民的月用水量.
请你分析上述2名学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?
一、单选题
1.(23-24高二·上海·课堂例题)下列抽样方法中,属于简单随机抽样的是( )
A.某社团为调查本校学生的环保知识水平,向在图书馆某楼层自习的所有学生发放问卷,隔5分钟后回收;
B.某次科普讲座之前,主持人抽取座位尾号为1的听众进行提问;
C.一车间主任从堆放的100件产品中抽取了摆放在最上面的10件产品进行检查;
D.销售部经理将一个放有部门所有员工工号牌的箱子均匀摇晃后,从中抽取5个工号牌.
2.(24-25高一·全国·单元测试)某市场监管局对所管辖的某超市在售的40种冷冻饮品中抽取了20种冷冻饮品,对其质量进行了抽检,则( )
A.该市场监管局的调查方法是普查
B.样本的个体是每种冷冻饮品的质量
C.样本的总体是超市在售的40种冷冻饮品
D.样本容量是该超市的20种冷冻饮品数
3.(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
4.(24-25高二上·广东佛山·期末)甲乙两名同学参加羽毛球单打比赛,比赛规则是3局2胜制.现通过设计模拟实验估算概率,用1,3,5表示一局比赛甲获胜,用2,4表示一局比赛乙获胜.利用计算机产生20组随机数:
423 123 423 344 114 453 525 332 152 342
534 443 512 541 125 432 334 151 314 254
由此估计甲赢得比赛的概率为( )
A.0.6 B.0.65 C.0.7 D.0.75
5.(24-25高一下·全国·课堂例题)某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.系统抽样法 B.简单随机抽样法
C.分层随机抽样法 D.随机数法
6.(24-25高三下·河南周口·阶段练习)某校高三年级共有2000人,其中男生1200人,女生800人,某次考试结束后,学校采用按性别分层随机抽样的方法抽取容量为的样本,已知样本中男生比女生人数多8人,则( )
A.20 B.30 C.40 D.48
7.(2024·四川乐山·三模)为了解某中学三个年级的学生对食堂饭菜的满意程度,用分层随机抽样的方法抽取30%的学生进行调查,已知该中学学生人数和各年级学生的满意率分别如图1和图2所示,则样本容量和抽取的二年级学生中满意的人数分别为( )
A.800,360 B.600,108 C.800,108 D.600,360
8.(2025·上海·模拟预测)标志重捕法是指的是在一定范围内,对活动能力强、活动范围较大的动物种群进行粗略估算的一种生物统计方法,是根据自由活动的生物在一定区域内被调查与自然个体数的比例关系对自然个体总数进行数学推断.在被调查种群的生存环境中,捕获一部分个体,将这些个体进行标志后再放回原来的环境,经过一段时间后进行重捕,根据重捕中标志个体占总捕获数的比例来估计该种群的数量.标志重捕法估算种群密度是基于以下几种假设:①标记个体与未标记个体在重捕时被捕获的概率相等;②在调查期内标记的个体没有死亡,没有迁出,标记物没有脱落;③标记个体在种群中均匀分布.若应用标志重捕法调查鱼的种群密度,则下列捕鱼过程会导致估算结果与实际情况误差较大的是( ).
A.第一次用小网眼的渔网捕鱼,第二次用小网眼的渔网捕鱼
B.第一次用小网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
C.第一次用大网眼的渔网捕鱼,第二次用小网眼点渔网捕鱼
D.第一次用大网眼的渔网捕鱼,第二次用大网眼的渔网捕鱼
二、多选题
9.(23-24高一下·甘肃兰州·期中)为了了解参加运动会的1500名运动员的年龄情况,从中抽取了150名运动员的年龄进行调查,则下列说法正确的是( )
A.1500名运动员的年龄是总体
B.抽取到的150名运动员是样本
C.这个抽样方法可以采取随机数表法抽样
D.每个运动员被抽到的机会相等
10.(24-25高一·全国·课后作业)(多选)对下面三个事件最适宜采用的抽样方法判断正确的有( )
①从某厂生产的3000件产品中抽取600件进行质量检验;
②一次数学竞赛中,某班有10人的成绩在110分以上,40人的成绩在90~110分,10人的成绩低于90分,现在从中抽取12人的成绩了解有关情况;
③运动会服务人员为参加400m决赛的6名同学安排跑道.
A.①②适宜采用分层抽样 B.②③适宜采用分层抽样
C.②适宜采用分层抽样 D.③适宜采用简单随机抽样
11.(23-24高一下·江苏淮安·期末)某学校为了解学校学生视力健康状况,降低学生近视率,增强学生爱眼护眼意识,对三个年级的学生视力健康状况进行调研,已知高一、高二、高三的学生人数之比为4:3:3,现用分层抽样方法抽取一个容量为 n的样本,样本中高一年级学生人数为200人,则( )
A.该校三个年级总的学生数为5000人 B.样本容量n为500
C.该校高二年级总的学生数有1500人 D.样本中高二年级学生数为150人
三、填空题
12.(23-24高一上·江西上饶·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米3285石,验得米内有夹谷,抽样取米一把,数得261粒米内有夹谷29粒,则这批米内夹谷约为
石.
13.(23-24高一下·福建宁德·阶段练习)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第7列开始向右依次读取数据,则得到的第5个样本编号是 .
14.(23-24高一下·湖南永州·期末)某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 .
四、解答题
15.(2024高一下·全国·专题练习)在以下调查中,总体、个体各是什么?哪些适合用全面调查?哪些适合用抽样调查?
(1)调查一个班级学生每周的体育锻炼时间;
(2)调查一个地区结核病的发病率;
(3)调查一批炮弹的杀伤半径;
(4)调查一个水库所有鱼中草鱼所占的比例.
16.(2024高一下·全国·专题练习)某电视台举行颁奖典礼,邀请20名艺人演出,其中从甲地30名艺人中随机挑选10人,从乙地18名艺人中随机挑选6人,从丙地10名艺人中随机挑选4人.试分别用抽签法和随机数法确定选中的艺人.
17.(24-25高一·全国·随堂练习)为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
18.(23-24高一下·全国·课后作业)高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
19.(23-24高一下·河北邢台·阶段练习)已知某高速服务区餐厅的窗口有四类:①自选快餐,平均每份取餐时长为1分钟;②商务套餐,平均每份取餐时长为0.5分钟;③现炒现做,平均每份取餐时长为5分钟;④自动售货机,平均每份取餐时长为1分钟.已知该高速服务区餐厅的取餐窗口(每台自动售货机按1个取餐窗口计算)一共有18个,就餐高峰期时有400名消费者在等待就餐.为了提高消费者的用餐满意度,该高速服务区工作人员选取了100名用餐的消费者进行问卷调查,其中有50人选择了自选快餐,30人选择了商务套餐,15人选择了现炒现做,5人选择了自动售货机.(注:为了方便计算,若某消费者选择两类或多类就餐类别,则按该消费者的主要就餐类别归类,每名消费者只统计为其中一类).
(1)根据以上的调查统计,用样本估计总体,如果设置10个自选快餐窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类取餐的窗口前队伍长度各自相等),试问选择自选快餐的消费者最长等待时长是多少分钟?
(2)根据以上的调查数据统计,用样本估计总体,从等待时长和公平的角度上考虑,要求每个队伍的最长等待时长大致相等,应如何设置各类取餐窗口数(结果采用四舍五入法保留整数)?并说明理由.
第 1 页 共 28 页
学科网(北京)股份有限公司
$$