内容正文:
第14讲 随机抽样
目录
题型归纳 1
题型01 随机数表法 3
题型02 简单随机抽样的概率 4
题型03 简单随机抽样估计总体 5
题型04 分层抽样的特征及适用条件 6
题型05 抽样比、样本总量、各层总数、总体容量的计算 6
题型06 分层抽样的概率 7
题型07 普查与抽样的合理选择 8
题型08 总体与样本 9
分层练习 10
夯实基础 10
能力提升 13
知识点01简单随机抽样
1、放回与不放回简单随机抽样
(1)放回简单随机抽样:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
(2)不放回简单随机抽样:如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
2、简单随机抽样的特点:
(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;
(2)逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;
(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算。
(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性。
3、抽签法
(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本。
(2)抽签法的操作步骤:
第一步,编号:将个个体编号(号码可以从1到,也可以使用已有的号码)
第二步,写签:将个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取次,并记录其编号.
第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.
(3)抽签法的注意事项:
①对个体编号时,也可以利用已有的编号.
②制作号签时,所使用的工具(如纸条、小球等)的形状、大小要一样,以确保每个号签被抽到的可能性相等.
③抽取样本前总体要“均匀搅拌”,目的是让每个号签被抽到的机会相等.
(4)优点与缺点
优点:简单易形,当总体的个体数不多时,使总体处于“搅拌”均匀的状态比较容易,
此时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性;
缺点:仅适用于个体数较少的总体,当总体的容量较大时,费时费力又不方便,
况且,如果号签搅拌的不均匀,可能导致抽样不公平。
4、随机数法
(1)定义:简单随机抽样中,另一个经常被采用的方法是随机数表法,即利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数表法步骤:
①把总体中的每个个体编号。
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
5、总体均值与样本均值
(1)总体均值
一般地,总体中有个个体,它们的变量值分别为,,…,,则称为总体均值,又称总体平均数
如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数,则总体均值还可以写成加权平均数的形式.
(2)样本均值
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,,则称为样本均值,又称样本平均数。在简单随机抽样中,我们常用样本平均数去估计总体平均数。
知识点02分层随机抽样
1、分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层);
(2)计算抽样比:抽样比;
(3)定数:按抽样比确定每层抽取的个体数;
(4)抽样:每层分贝按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本。
4、分层随机抽样的相关计算关系:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(3)样本的平均数和各层的样本平均数的关系为:=+=+.
题型01随机数表法
【例1】(22-23高一下·江西景德镇·期中)现要用随机数表法从总体容量为240(编号为001到240)的研究对象中挑选出50个样本,则在下列数表中按从左至右的方式抽取到的第四个对象的编号为( )
32451 74491 14562 16510 02456 89640 56816 55464 41630 85621 05214 84513 12541 02145
A.5 B.44 C.165 D.210
【变式1】(22-23高一下·河北沧州·期中)某实验室的笼子中有40只小白鼠,将其进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行试验,选取方法是从下面的随机数表的第1行第15列和第16列数字开始由左向右依次选取2个数字,直到取足样本,则抽取样本的第6个号码为( )
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 96 35 23 79 18 05 98 90
07 35 46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67
A.05 B.40 C.35 D.23
【变式2】(20-21高一下·陕西汉中·期中)某工厂为了对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,选出来的第2个零件编号是 .
0647 4373 8636 9647 3661 4698 6371 6233 2616 8045 6011 1410
9577 7424 6762 4281 1457 2042 5332 3732 2707 3607 5124 5179
【变式3】(24-25高一上·陕西·期末)要考察某公司生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…,499,利用随机数表抽取样本,从第8行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则抽取的第5袋牛奶的标号是 .
(下面摘取了某随机数表的第7行至第9行)
84421 75531 57245 50688 77047 44767 21763
35025 83921 20676 63016 47859 16955 56719
98301 07185 12867 35807 44395 23879 33211
题型02 简单随机抽样的概率
【例2】(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【变式1】(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
【变式2】(22-23高一下·云南保山·期末)一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为30的样本,则指定的某个个体被抽到的概率为 .
【变式3】(22-23高一下·江西景德镇·期中)利用简单随机抽样的方法,从个个体中抽取14个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为 .
题型03 简单随机抽样估计总体
【例3】(22-23高一上·辽宁·期末)我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.133石 B.159石 C.336石 D.168石
【变式1】(21-22高一上·贵州遵义·期末)管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800 B.1800 C.1400 D.1200
【变式2】(23-24高一下·江苏常州·期末)为估计某草场内兔子的数量,使用以下方法:先随机从草场中捕捉兔子100只,在每只兔子的尾巴上作上记号后放回草场.再随机从草场中捕捉60只,若尾巴上有记号的兔子共有10只,估计此草场内约有兔子 只.
【变式3】(21-22高一下·陕西渭南·期末)“二十四节气歌”是以“春、夏、秋、冬”开始的四句诗.某小学三年级共有学生600名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校三年级的600名学生中,对二十四节气歌一句也说不出的有 人.
题型04 分层抽样的特征及适用条件
【例4】(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【变式1】(24-25高一上·北京石景山·期末)某田径队有运动员人,其中男运动员人,女运动员人.为了解该田径队运动员的睡眠情况,采用分层抽样的方法获得一个容量为的样本,那么应抽取男运动员的人数为( )
A. B.
C. D.
【变式2】(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
【变式3】(21-22高一下·陕西宝鸡·期中)某地有15000亩农田,其中山地、平原、洼地分别为9800亩、1200亩、4000亩,在实施乡村振兴战略中,要对这个地方的农作物产量进行调查,应当采用的抽样方法是 .
题型05 抽样比、样本总量、各层总数、总体容量的计算
【例5】(23-24高一下·北京通州·期中)为了解学生们的视力状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行调查. 已知高三年级有200人,高二年级有240人,高一年级有360人,则高三年级抽取的人数为( )
A.20 B.25 C.30 D.45
【变式1】(23-24高一下·江西赣州·期中)随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对2400名老年人、2400名中年人、2100名青年人用分层抽样方法随机发放了调查问卷345份,则在老年人中发放的调查问卷份数是( )
A.110 B.115 C.120 D.125
【变式2】(23-24高一下·湖南长沙·期中)某班兴趣小组做了一次关于“电子产品对视力的影响”的问卷调查.他们从岁,7~12岁,13~15岁,16~18岁四个年龄段回收的问卷依次为120份、180份、240份、份.因调查需要,现从回收的问卷中按年龄段按比例分配分层随机抽取一个容量为300的样本.若在岁年龄段的问卷中抽取了60份,则应在岁年龄段的问卷中抽取的份数为 .
【变式3】(21-22高一下·江西宜春·期中)某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.
(1)应采用哪种抽样方法更合理?
(2)中年、青年、老年职工应分别抽取多少人?
题型06 分层抽样的概率
【例6】(21-22高一下·广西柳州·期末)某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高一学生被抽到的概率最大 B.高三学生被抽到的概率最大
C.高三学生被抽到的概率最小 D.每位学生被抽到的概率相等
【变式1】(22-23高一下·天津滨海新·期末)从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
【变式2】(21-22高一下·广东广州·期末)某田径队有男运动员56人,女运动员42人,若采用比例分配的分层随机抽样方法在这支田径队中抽取28人进行体质测试,则抽取男运动员的人数为( )
A.16 B.14 C.12 D.10
【变式3】(20-21高一下·北京东城·期末)已知某车企从今年开始投产了A,B,C三种型号的新能源汽车,第一个月下线的台数依次为250,450,300,现用分层抽样的方法从中随机抽取20台车进行质量测试,则某一台B型号的新能源汽车被抽取的概率为 .
题型07 普查与抽样的合理选择
【例7】(22-23高一下·新疆巴音郭楞·期末)在以下调查中,适合用普查的是( )
A.调查一批小包装饼干的卫生是否达标
B.调查一批袋装牛奶的质量
C.调查一个班级的学生每天完成家庭作业所需要的时间
D.调查一批绳索的抗拉强度是否达到要求
【变式1】(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
【变式2】(23-24高一下·天津河西·期末)下列情况适合用抽样调查的是( )
A.调查某化工厂周围5个村庄是否受到污染
B.调查某批次汽车的抗撞击能力
C.调查某班学生的身高情况
D.学校招聘,对应聘人员进行面试
【变式3】(21-22高一下·安徽合肥·期末)研究下列问题:①合肥市今年“八一”前后的气温;②某种新型电路元件使用寿命的测定;③“安徽新闻联播”的收视率;④近年来我国大学生入学人数的相关数据.其中,通过试验获取数据的是 .(填写问题对应的序号)
题型08 总体与样本
【例8】(23-24高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
【变式1】(23-24高一下·天津河东·期末)为确保食品安全,某市质检部门检查1000袋方便面的质量,抽查总量的.在这个问题中,下列说法正确的是( )
A.总体是指这1000袋方便面 B.个体是1袋方便面
C.样本是按抽取的20袋方便面 D.样本容量为20
【变式2】(22-23高一下·四川遂宁·期末)某中学高一生物课外兴趣小组要对本班同学的睡眠时间进行研究,得到了以下个数据(单位:小时):,,,,,,,,,,去掉数据 能很好地提高样本数据的代表性.
【变式3】(22-23高一上·江西上饶·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米3285石,验得米内有夹谷,抽样取米一把,数得261粒米内有夹谷29粒,则这批米内夹谷约为 石.
【夯实基础】
一、单选题
1.(24-25高一上·贵州·期末)某校男生与女生人数之比为,为了解该校学生的体重情况,按性别采用分层随机抽样的方法从该校学生中抽样120人进行调查,则该校女生被抽取的人数是( )
A.24 B.48 C.36 D.56
2.(24-25高一上·江西抚州·期末)2024年10月1日是中华人民共和国建国75周年,为弘扬爱国主义精神,共同感受党的伟大历程,抚州市第一中学高一年级决定从每班随机抽取5名学生参加“祖国在我心”知识竞答.若高一某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第1行第5列的数开始,每次从左向右选取两个数字,则选取的第四个编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.14 B.02 C.43 D.07
3.(24-25高一上·湖南邵阳·期末)某校高一年级有1200名学生,其中男生700名.按男女比例用分层随机抽样的方法,从该年级学生中抽取一个容量为72的样本,则应抽取的女生人数是( )
A.20 B.30 C.40 D.50
4.(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
二、多选题
5.(23-24高一上·江西上饶·期末)北京时间2023年10月31日8时11分,神舟十六号载人飞船返回舱在东风着陆场成功着陆,载人飞行任务取得圆满成功.某高中学校在有120名同学的“航天”社团中随机抽取30名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取10人;若按性别比例分层随机抽样,则男生抽取18人.则下列结论正确的有( )
A.样本容量为30
B.120名社团成员中男生有72人
C.高二与高三年级的社团成员共有80人
D.高一年级的社团成员中女生最多有48人
6.(23-24高一下·甘肃兰州·期中)为了了解参加运动会的1500名运动员的年龄情况,从中抽取了150名运动员的年龄进行调查,则下列说法正确的是( )
A.1500名运动员的年龄是总体
B.抽取到的150名运动员是样本
C.这个抽样方法可以采取随机数表法抽样
D.每个运动员被抽到的机会相等
三、填空题
7.(21-22高一下·广东潮州·期中)某单位有名职工,其中女职工有名,男职工有名,现要从中抽取名进行调研座谈,如果用比例分配的分层随机抽样的方法进行抽样,则应抽女职工 名.
8.(23-24高一下·重庆·期末)放风筝是一项有益的运动,现对高一和高二共1500名同学进行按比例分层抽样调查,统计近两年放过风筝的人数,有如下数据:高一学生抽取有效样本40,放过风筝的人数为19,高二学生抽取有效样本60,放过风筝的人数为,由此估计两个年级近两年放过风筝的人数约为540,则 .
9.(23-24高一下·吉林白山·期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
四、解答题
10.(22-23高一上·北京丰台·期末)某校高中部有高一学生600人,高二学生480人,高三学生420人.某研究小组为了调查该校高中部不同年级学生课后作业量的情况,现采用分层随机抽样的方法在三个年级共抽取100名学生,应抽取高一学生的人数为多少?
11.(2024高一·全国·专题练习)某高级中学共有学生3 000名,各年级男、女生的人数如表:
高一年级
高二年级
高三年级
女生
487
x
y
男生
513
560
z
已知高二年级女生比高一年级女生多53人.
(1)高二年级有多少名女生?
(2)现对各年级用比例分配的分层随机抽样的方法从全校抽取300名学生,应从高三年级抽取多少名学生?
【能力提升】
一、单选题
1.(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
2.(24-25高一上·江西·阶段练习)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
3.(21-22高一下·河北邯郸·期末)为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中O型血的人数比AB型血的人数多20,则( )
A.100 B.120 C.200 D.240
4.(22-23高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,高二,高三共有学生6000名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这6000名学生中抽取一个容量60的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
二、多选题
5.(22-23高一下·福建漳州·期末)在以下调查中,适合用抽样调查的有( )
A.调查某品牌的冰箱的使用寿命
B.调查某个班级10名学生每周的体育锻炼时间
C.调查一批炮弹的杀伤半径
D.调查一个水库所有鱼中草鱼所占的比例
6.(23-24高一下·吉林·阶段练习)某公司生产三种型号的轿车,年产量分别为1500辆、6000辆和2000辆.为检验产品质量,公司质检部门要抽取57辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次应抽取9辆、36辆、12辆
D.这三种型号的轿车,每一辆被抽到的可能性相同
7.(22-23高一下·陕西西安·期中)下列抽样实验中,不适宜用抽签法的是( )
A.从某场生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检测
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检测
三、填空题
8.(20-21高一下·河南南阳·期中)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组,在参加活动的职工中,青年人、中年人、老年人所占比例如图1所示,且游泳组的职工人数是登山组的3倍,在登山组中青年人、中年人、老年人所占比例如图2所示.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本,则游泳组中中年人应抽取 人.
9.(24-25高一上·河南焦作·期末)某次九省联考考试结束后,相关部门为了分析考生的数学成绩,采用随机抽样的方式从某地区抽取了3000名高三学生的数学成绩,则此次抽样的样本为 .
10.(22-23高一下·新疆喀什·期末)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200、400、300、100件.为检验产品的质量,现用分层抽样的方法,从以上所有的产品中抽取60件进行检验,则应从甲种型号的产品抽取 件.
四、解答题
11.(2024高一·全国·专题练习)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为175,方差为20,女生样本均值为165,方差为30
(1)如果已知男、女的样本量按比例分配,请计算总样本的均值为多少?
(2)如果已知男、女的样本量都是25,请计算总样本均值为多少?
12.(20-21高一下·山东菏泽·期末)某机械厂三个车间共有工人1000名,各车间男、女工人数如下表:
第一车间
第二车间
第三车间
女工
170
120
男工
180
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是,其中第三车间的男女比例为.
(1)求,,的值.
(2)现用分层抽样的方法在全厂男工人中抽取55名工人进行技术比武,则在第三车间抽取多少名男工人?
13.(21-22高一下·陕西咸阳·期中)一汽车厂生产A、B、C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表所示(单位:辆):
轿车A
轿车B
轿车C
舒适型
100
150
z
标准型
300
450
600
按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.
(1)求z的值;
(2)用分层抽样的方法在C类轿车中抽取一个容量为5的样本,应如何抽取?
14.(21-22高一下·北京大兴·期末)某校有高中学生1000人,其中男生400人,女生600人.A同学按男生、女生进行分层,采用分层随机抽样的方法调查该校全体高中学生的身高(单位:)情况,总样本量为100,计算得到男生身高样本的平均数为170,方差为16;女生身高样本的平均数为160,方差为18.
(1)如果已知男、女样本量按比例分配,求总样本的平均数和方差;
(2)如果已知男、女样本量分别为30和70,在这种情况下,总样本的平均数为,总样本的方差为,分别直接写出与与的大小关系;
(3)如果已知B同学采用了简单随机抽样的方法调查该校全体高中学生的身高情况,样本量为100,其样本平均数为,能否认为比更接近总体平均身高,说明理由.
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司6
学科网(北京)股份有限公司
$$
第14讲 随机抽样
目录
题型归纳 1
题型01 随机数表法 3
题型02 简单随机抽样的概率 6
题型03 简单随机抽样估计总体 8
题型04 分层抽样的特征及适用条件 10
题型05 抽样比、样本总量、各层总数、总体容量的计算 11
题型06 分层抽样的概率 14
题型07 普查与抽样的合理选择 16
题型08 总体与样本 18
分层练习 20
夯实基础 20
能力提升 27
知识点01简单随机抽样
1、放回与不放回简单随机抽样
(1)放回简单随机抽样:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
(2)不放回简单随机抽样:如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
2、简单随机抽样的特点:
(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;
(2)逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;
(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算。
(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性。
3、抽签法
(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本。
(2)抽签法的操作步骤:
第一步,编号:将个个体编号(号码可以从1到,也可以使用已有的号码)
第二步,写签:将个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取次,并记录其编号.
第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.
(3)抽签法的注意事项:
①对个体编号时,也可以利用已有的编号.
②制作号签时,所使用的工具(如纸条、小球等)的形状、大小要一样,以确保每个号签被抽到的可能性相等.
③抽取样本前总体要“均匀搅拌”,目的是让每个号签被抽到的机会相等.
(4)优点与缺点
优点:简单易形,当总体的个体数不多时,使总体处于“搅拌”均匀的状态比较容易,
此时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性;
缺点:仅适用于个体数较少的总体,当总体的容量较大时,费时费力又不方便,
况且,如果号签搅拌的不均匀,可能导致抽样不公平。
4、随机数法
(1)定义:简单随机抽样中,另一个经常被采用的方法是随机数表法,即利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数表法步骤:
①把总体中的每个个体编号。
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
5、总体均值与样本均值
(1)总体均值
一般地,总体中有个个体,它们的变量值分别为,,…,,则称为总体均值,又称总体平均数
如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数,则总体均值还可以写成加权平均数的形式.
(2)样本均值
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,,则称为样本均值,又称样本平均数。在简单随机抽样中,我们常用样本平均数去估计总体平均数。
知识点02分层随机抽样
1、分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层);
(2)计算抽样比:抽样比;
(3)定数:按抽样比确定每层抽取的个体数;
(4)抽样:每层分贝按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本。
4、分层随机抽样的相关计算关系:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(3)样本的平均数和各层的样本平均数的关系为:=+=+.
题型01随机数表法
【例1】(22-23高一下·江西景德镇·期中)现要用随机数表法从总体容量为240(编号为001到240)的研究对象中挑选出50个样本,则在下列数表中按从左至右的方式抽取到的第四个对象的编号为( )
32451 74491 14562 16510 02456 89640 56816 55464 41630 85621 05214 84513 12541 02145
A.5 B.44 C.165 D.210
【答案】D
【知识点】随机数表法
【分析】由随机数表抽样方法可知答案.
【详解】由随机数表抽样方法可知,以3个数字为单位抽取数字,且数字不能大于240,且要去掉重复数字,据此第一个数字为114,第二个为165,第三个为100,第4个为210.
故选:D
【变式1】(22-23高一下·河北沧州·期中)某实验室的笼子中有40只小白鼠,将其进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行试验,选取方法是从下面的随机数表的第1行第15列和第16列数字开始由左向右依次选取2个数字,直到取足样本,则抽取样本的第6个号码为( )
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 96 35 23 79 18 05 98 90
07 35 46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67
A.05 B.40 C.35 D.23
【答案】A
【知识点】随机数表法
【分析】根据随机数表抽样的定义和抽取方法进行求解.
【详解】重复的号码只能算作一个,抽取样本的号码是38,07,35,23,18,05,20,15,08,32,
所以抽取样本的第6个号码为05.
故选:A.
【变式2】(20-21高一下·陕西汉中·期中)某工厂为了对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,选出来的第2个零件编号是 .
0647 4373 8636 9647 3661 4698 6371 6233 2616 8045 6011 1410
9577 7424 6762 4281 1457 2042 5332 3732 2707 3607 5124 5179
【答案】33
【知识点】随机数表法
【分析】利用随机数法的定义进行选取即可.
【详解】从题中给的随机数表从第一行第3列开始,由左至右依次读取,重复的数字只读一次,读到的小于40的编号分别为36,33,
所以选出来的第2个零件编号是33.
故答案为:33.
【变式3】(24-25高一上·陕西·期末)要考察某公司生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…,499,利用随机数表抽取样本,从第8行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则抽取的第5袋牛奶的标号是 .
(下面摘取了某随机数表的第7行至第9行)
84421 75531 57245 50688 77047 44767 21763
35025 83921 20676 63016 47859 16955 56719
98301 07185 12867 35807 44395 23879 33211
【答案】286
【知识点】随机数表法
【分析】根据给定的随机数表,按指定方法依次读取符合要求的标号.
【详解】依题意,抽取的前5袋牛奶的标号依次为:206,301,169,071,286,
所以抽取的第5袋牛奶的标号是286.
故答案为:286.
题型02 简单随机抽样的概率
【例2】(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【答案】D
【知识点】简单随机抽样的概率
【分析】根据条件,利用简单随机抽样的定义,即可求解.
【详解】总体有个个体,每个个体被抽到的概率相同,均为,
故选:D.
【变式1】(23-24高一下·河北张家口·期末)已知一个总体中有个个体,用抽签法从中抽取一个容量为的样本,若每个个体被抽到的可能性是,则( )
A.10 B.20 C.40 D.不确定
【答案】C
【知识点】简单随机抽样的概率
【分析】抽签法可知每个个体被抽到的可能性均为,即可得到方程,解得即可.
【详解】根据抽签法可知每个个体被抽到的可能性均为,
依题意可得,解得.
故选:C
【变式2】(22-23高一下·云南保山·期末)一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为30的样本,则指定的某个个体被抽到的概率为 .
【答案】/
【知识点】简单随机抽样的概率
【分析】由简单随机抽样的定义,每个个体被抽到的概率是一样的,结合容量,即可求得概率.
【详解】由题意得,每个个体被抽到的概率为,以简单随机抽样方式从该总体中抽取一个容量为30的样本,则指定的某个个体被抽到的概率为.
故答案为:
【变式3】(22-23高一下·江西景德镇·期中)利用简单随机抽样的方法,从个个体中抽取14个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为 .
【答案】
【知识点】简单随机抽样的概率
【分析】根据第二次抽取时余下的每个个体被抽取到的概率为求得,可得答案.
【详解】第二次抽取时,余下的每个个体被抽取到的概率为,则,
即,则在整个抽样过程中,
每个个体被抽取到的概率为.
故答案为:.
题型03 简单随机抽样估计总体
【例3】(22-23高一上·辽宁·期末)我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.133石 B.159石 C.336石 D.168石
【答案】D
【知识点】简单随机抽样估计总体
【分析】根据254粒内夹谷28粒可得比例,即可解决.
【详解】由题意得,这批米内夹谷约为石,
故选:D
【变式1】(21-22高一上·贵州遵义·期末)管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800 B.1800 C.1400 D.1200
【答案】C
【知识点】简单随机抽样估计总体、简单随机抽样的概率
【分析】由从池塘内捞出70条鱼,其中有标记的有2条,可得所有池塘中有标记的鱼的概率,结合池塘内具有标记的鱼一共有40条鱼,按照比例即得解.
【详解】设估计该池塘内鱼的总条数为,
由题意,得从池塘内捞出70条鱼,其中有标记的有2条,
所有池塘中有标记的鱼的概率为:,
又因为池塘内具有标记的鱼一共有40条鱼,
所以,解得,
即估计该池塘内共有条鱼.
故选:C.
【变式2】(23-24高一下·江苏常州·期末)为估计某草场内兔子的数量,使用以下方法:先随机从草场中捕捉兔子100只,在每只兔子的尾巴上作上记号后放回草场.再随机从草场中捕捉60只,若尾巴上有记号的兔子共有10只,估计此草场内约有兔子 只.
【答案】
【知识点】简单随机抽样估计总体、简单随机抽样的概率
【分析】利用简单随机抽样,结合样本估计总体可解.
【详解】假设草场约有n只兔子,则,则.
故答案为:600.
【变式3】(21-22高一下·陕西渭南·期末)“二十四节气歌”是以“春、夏、秋、冬”开始的四句诗.某小学三年级共有学生600名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校三年级的600名学生中,对二十四节气歌一句也说不出的有 人.
【答案】102
【知识点】简单随机抽样估计总体
【分析】先求出随机抽查的100名学生中,对二十四节气歌一句也说不出的学生人数,利用样本估计整体即可求解.
【详解】解:根据题意,随机抽查的100名学生中,对二十四节气歌一句也说不出的学生有人,
故该校三年级的600名学生中,对二十四节气歌一句也说不出的有人.
故答案为:102.
题型04 分层抽样的特征及适用条件
【例4】(24-25高一上·江西·期末)为了了解某县中小学生课外阅读时间情况,拟从该县的中小学生中抽取部分学生进行调查,事先已经了解到该县小学、初中、高中三个学段学生的课外阅读时间存在较大差异,而男、女生的阅读时间差异不大,则最合理的抽样方法是( )
A.按性别分层随机抽样 B.按学段分层随机抽样
C.抽签法 D.随机数表法
【答案】B
【知识点】分层抽样的特征及适用条件
【分析】由分层抽样的概念即可判断;
【详解】因为男、女生的阅读时间差异不大,而小学、初中、高中三个学段学生的课外阅读时间存在较大差异,故应按照学段分层随机抽样.
故选:B.
【变式1】(24-25高一上·北京石景山·期末)某田径队有运动员人,其中男运动员人,女运动员人.为了解该田径队运动员的睡眠情况,采用分层抽样的方法获得一个容量为的样本,那么应抽取男运动员的人数为( )
A. B.
C. D.
【答案】B
【知识点】分层抽样的特征及适用条件
【分析】利用分层抽样的意义求解即可.
【详解】由题得应抽取男运动员的人数为.
故选:B.
【变式2】(23-24高一下·江苏常州·期末)某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
【答案】D
【知识点】分层抽样的特征及适用条件
【分析】按照分层抽样计数规则计算可得.
【详解】依题意高一年级应抽取的人数为人.
故选:D.
【变式3】(21-22高一下·陕西宝鸡·期中)某地有15000亩农田,其中山地、平原、洼地分别为9800亩、1200亩、4000亩,在实施乡村振兴战略中,要对这个地方的农作物产量进行调查,应当采用的抽样方法是 .
【答案】分层抽样
【知识点】分层抽样的特征及适用条件
【分析】结合抽样方法来确定正确答案.
【详解】由于田地分为:山地、平原、洼地,不同的田地农作物产量会有较大的不同,所以应该采用分层抽样.
故答案为:分层抽样
题型05 抽样比、样本总量、各层总数、总体容量的计算
【例5】(23-24高一下·北京通州·期中)为了解学生们的视力状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行调查. 已知高三年级有200人,高二年级有240人,高一年级有360人,则高三年级抽取的人数为( )
A.20 B.25 C.30 D.45
【答案】B
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据给定条件,利用分层抽样列式计算即得.
【详解】依题意,高三年级抽取的人数为.
故选:B
【变式1】(23-24高一下·江西赣州·期中)随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对2400名老年人、2400名中年人、2100名青年人用分层抽样方法随机发放了调查问卷345份,则在老年人中发放的调查问卷份数是( )
A.110 B.115 C.120 D.125
【答案】C
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】设在老年人中发放的调查问卷份数为x,根据分层抽样的性质列方程求解.
【详解】设在老年人中发放的调查问卷份数为x,
则,
解得.
所以在老年人中发放的调查问卷份数是.
故选:C.
【变式2】(23-24高一下·湖南长沙·期中)某班兴趣小组做了一次关于“电子产品对视力的影响”的问卷调查.他们从岁,7~12岁,13~15岁,16~18岁四个年龄段回收的问卷依次为120份、180份、240份、份.因调查需要,现从回收的问卷中按年龄段按比例分配分层随机抽取一个容量为300的样本.若在岁年龄段的问卷中抽取了60份,则应在岁年龄段的问卷中抽取的份数为 .
【答案】120
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据分层抽样的概念按比例求解.
【详解】因为岁年龄段回收了180份问卷,而样本在岁年龄段的问卷中抽取了60份,
所以抽样比为.
因为分层抽取的样本的容量为300,
故回收的问卷总数为(份),
可得(份),
所以在16~18岁年龄段中抽取的问卷为(份).
故答案为:120.
【变式3】(21-22高一下·江西宜春·期中)某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.
(1)应采用哪种抽样方法更合理?
(2)中年、青年、老年职工应分别抽取多少人?
【答案】(1)分层抽样,理由见解析;
(2)抽取的中年、青年、老年职工分别为200人,120人,80人.
【知识点】抽样比、样本总量、各层总数、总体容量的计算、分层抽样的特征及适用条件
【分析】(1)根据职工有明显的年龄差异,故选择分层抽样更合理;
(2)按照中年、青年、老年职工的比例计算分别抽取的人数.
【详解】(1)因为中、青、老年职工有明显的差异,故采用分层抽样更合理;
(2)按照比例抽取中、青、老年职工的人数分别为,
,,
因此应抽取的中年、青年、老年职工分别为200人,120人,80人.
题型06 分层抽样的概率
【例6】(21-22高一下·广西柳州·期末)某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高一学生被抽到的概率最大 B.高三学生被抽到的概率最大
C.高三学生被抽到的概率最小 D.每位学生被抽到的概率相等
【答案】D
【知识点】分层抽样的概率
【分析】根据分层抽样的定义和性质判断即可.
【详解】无论采取简单随机抽样,还是分层抽样,每个个体被抽取的概率都相同.
故选:D.
【变式1】(22-23高一下·天津滨海新·期末)从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
【答案】B
【知识点】分层抽样的概率、简单随机抽样的概率
【分析】根据简单随机抽样、分层抽样的定义即可得到结论.
【详解】根据抽样调查的原理可得简单随机抽样,分层抽样都必须满足每个个体被抽到的概率相等,即.
故选:B
【点睛】本题考查简单随机抽样、分层抽样的原理的理解,两种抽样都是等可能抽取,是一道容易题.
【变式2】(21-22高一下·广东广州·期末)某田径队有男运动员56人,女运动员42人,若采用比例分配的分层随机抽样方法在这支田径队中抽取28人进行体质测试,则抽取男运动员的人数为( )
A.16 B.14 C.12 D.10
【答案】A
【知识点】分层抽样的概率、分层抽样的特征及适用条件
【分析】根据分层抽样的相关知识直接计算.
【详解】男运动员56人,女运动员42人,则男生占总体比例为,
抽取28人进行体质测试,则抽取男运动员的人数为.
故选:A
【变式3】(20-21高一下·北京东城·期末)已知某车企从今年开始投产了A,B,C三种型号的新能源汽车,第一个月下线的台数依次为250,450,300,现用分层抽样的方法从中随机抽取20台车进行质量测试,则某一台B型号的新能源汽车被抽取的概率为 .
【答案】
【知识点】分层抽样的概率
【分析】根据分层抽样的概率,即可容易求得.
【详解】由题可知,型车辆与每一台新能源汽车被抽取的概率均相等,
则其概率.
故答案为:.
题型07 普查与抽样的合理选择
【例7】(22-23高一下·新疆巴音郭楞·期末)在以下调查中,适合用普查的是( )
A.调查一批小包装饼干的卫生是否达标
B.调查一批袋装牛奶的质量
C.调查一个班级的学生每天完成家庭作业所需要的时间
D.调查一批绳索的抗拉强度是否达到要求
【答案】C
【知识点】普查与抽样的合理选择
【分析】根据普查的适用前提,结合各项描述确定适用普查的对象.
【详解】普查适用总体数量较少以及破坏性不大的情况,显然A、B、D的调查对象不适用,
对于C,一个班级的学生人数相对较少,适用普查方式.
故选:C
【变式1】(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
【答案】D
【知识点】普查与抽样的合理选择
【分析】根据抽样调查和普查的定义,逐个选项判断调查方式是否合理即可.
【详解】对于A,了解某一品牌空调的使用寿命,选择抽样调查更符合经济效益,故A错误;
对于B,了解神舟飞船的设备零件的质量情况,
安全是最重要的,应该采取普查,故B错误;
对于C,了解一批袋装食品是否含有防腐剂,选择抽样调查更符合经济效益,故C错误;
对于D,了解某公园全年的游客流量,选择抽样调查比较符合经济效益,故D正确.
故选:D.
【变式2】(23-24高一下·天津河西·期末)下列情况适合用抽样调查的是( )
A.调查某化工厂周围5个村庄是否受到污染
B.调查某批次汽车的抗撞击能力
C.调查某班学生的身高情况
D.学校招聘,对应聘人员进行面试
【答案】B
【知识点】普查与抽样的合理选择、普查与抽样的定义辨析
【分析】根据抽样调查的直接判断即可.
【详解】根据抽样调查的定义可以判断B适合抽样调查,根据全面调查的定义可以判断A、C、D适合全面调查.
故选:B
【变式3】(21-22高一下·安徽合肥·期末)研究下列问题:①合肥市今年“八一”前后的气温;②某种新型电路元件使用寿命的测定;③“安徽新闻联播”的收视率;④近年来我国大学生入学人数的相关数据.其中,通过试验获取数据的是 .(填写问题对应的序号)
【答案】②
【知识点】普查与抽样的合理选择
【分析】根据获取数据的途径:调查获取数据、通过观察获取数据、通过试验获取数据和通过查询获得数据,对①②③④作出判断即可.
【详解】①通过观察获取数据,③通过调查获取数据,④通过查询获得数据,只有②通过试验获取数据.
故答案为:②.
题型08 总体与样本
【例8】(23-24高一下·西藏日喀则·期末)高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
【答案】B
【知识点】总体与样本
【分析】根据有关的概念可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,再结合题中选项即可得到答案.
【详解】根据有关的概念并且结合题意可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,
根据选项可得选项A、D表达的对象都是学生,而不是成绩,所以A、D都错误.
C每名学生的成绩是所抽取的一个样本也是错的,应是每名学生的成绩是一个个体.
B:样本的容量是100正确.
故选:B.
【变式1】(23-24高一下·天津河东·期末)为确保食品安全,某市质检部门检查1000袋方便面的质量,抽查总量的.在这个问题中,下列说法正确的是( )
A.总体是指这1000袋方便面 B.个体是1袋方便面
C.样本是按抽取的20袋方便面 D.样本容量为20
【答案】D
【知识点】总体与样本
【分析】根据总体,个体,样本,样本的定义逐一判断即可得解.
【详解】对于A,总体是指这1000袋方便面的质量,故A错误;
对于B,个体是指1袋方便面的质量,故B错误;
对于C,样本是指按照抽取的20袋方便面的质量,故C错误;
对于D,样本容量为,故D正确.
故选:D.
【变式2】(22-23高一下·四川遂宁·期末)某中学高一生物课外兴趣小组要对本班同学的睡眠时间进行研究,得到了以下个数据(单位:小时):,,,,,,,,,,去掉数据 能很好地提高样本数据的代表性.
【答案】
【知识点】总体与样本
【分析】将极端值去掉即可提高样本数据的代表性.
【详解】因为数据明显低于其它几个数据,是极端值,
所以去掉这个数据,能够更好地提高样本数据的代表性.
故答案为:
【变式3】(22-23高一上·江西上饶·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米3285石,验得米内有夹谷,抽样取米一把,数得261粒米内有夹谷29粒,则这批米内夹谷约为 石.
【答案】365
【知识点】总体与样本
【分析】用样本频率估计总体频率,按比例计算.
【详解】设这批米内夹谷约为粒,则,解得,
则这批米内夹谷约为.
故答案为:.
【夯实基础】
一、单选题
1.(24-25高一上·贵州·期末)某校男生与女生人数之比为,为了解该校学生的体重情况,按性别采用分层随机抽样的方法从该校学生中抽样120人进行调查,则该校女生被抽取的人数是( )
A.24 B.48 C.36 D.56
【答案】B
【分析】根据分层抽样公式直接求解.
【详解】由分层抽样定义可知被抽取到的女学生人数是.
故选:B.
2.(24-25高一上·江西抚州·期末)2024年10月1日是中华人民共和国建国75周年,为弘扬爱国主义精神,共同感受党的伟大历程,抚州市第一中学高一年级决定从每班随机抽取5名学生参加“祖国在我心”知识竞答.若高一某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第1行第5列的数开始,每次从左向右选取两个数字,则选取的第四个编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.14 B.02 C.43 D.07
【答案】D
【分析】利用随机数表法列举出前四名学生的编号,可得结果.
【详解】由随机数表法可知,前四名学生的编号依次为:、、、,
因此,选取的第四个编号为.
故选:D.
3.(24-25高一上·湖南邵阳·期末)某校高一年级有1200名学生,其中男生700名.按男女比例用分层随机抽样的方法,从该年级学生中抽取一个容量为72的样本,则应抽取的女生人数是( )
A.20 B.30 C.40 D.50
【答案】B
【分析】应用分层抽样的比例计算求解.
【详解】设应抽取的女生人数是,
所以,计算得.
故选:B.
4.(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
【答案】D
【分析】根据随机数表法的应用,按照已知的要求选出五个三个数字组成编号即可.
【详解】依题意从第2行第7列开始的数为67(舍去),62(舍去),42(舍去),81(舍去),14,
57(舍去),20,42(舍去),53(舍去),32,37,32(舍去),14(舍去),16,
则满足条件的5个样本编号为14,20,32,37,16,则第5个编号为16.
故选:D
二、多选题
5.(23-24高一上·江西上饶·期末)北京时间2023年10月31日8时11分,神舟十六号载人飞船返回舱在东风着陆场成功着陆,载人飞行任务取得圆满成功.某高中学校在有120名同学的“航天”社团中随机抽取30名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取10人;若按性别比例分层随机抽样,则男生抽取18人.则下列结论正确的有( )
A.样本容量为30
B.120名社团成员中男生有72人
C.高二与高三年级的社团成员共有80人
D.高一年级的社团成员中女生最多有48人
【答案】ABC
【分析】利用样本容量的定义判断A,利用分层抽样的定义进行计算可判断BCD.
【详解】对于A,从中随机抽取30名,则样本容量为30,正确;
对于B,设120名社团成员中男生有人,因为按性别比例分层随机抽样时男生抽取18人,
所以,解得,所以120名社团成员中男生有72人,正确;
对于C,设高二与高三年级的社团成员共有人,
因为按社团中高一、高二、高三年级的成员人数比例分层随机抽样时高一年级抽取10人,
所以,解得,所以高二与高三年级的社团成员共有80人,正确;
对于D,根据选项C可知高一年级的社团成员有人,故高一年级的社团成员中女生最多有40人,错误.
故选:ABC
6.(23-24高一下·甘肃兰州·期中)为了了解参加运动会的1500名运动员的年龄情况,从中抽取了150名运动员的年龄进行调查,则下列说法正确的是( )
A.1500名运动员的年龄是总体
B.抽取到的150名运动员是样本
C.这个抽样方法可以采取随机数表法抽样
D.每个运动员被抽到的机会相等
【答案】BD
【分析】根据总体、样本的定义,结合随机抽样的性质逐一判断即可.
【详解】1500名运动员是总体,故A错误;抽取到的150名运动员是样本,故B正确;随机数表法常常用于总体的个体较少时,当总体中的个体数较多时,编号复杂,将总体“傥拌均匀”也比较困难,用随机数表法产生的代表性不合理,故C错误;在简单的随机抽样时,每个运动员被抽到的机会是相等的,故D正确.
故选:BD
三、填空题
7.(21-22高一下·广东潮州·期中)某单位有名职工,其中女职工有名,男职工有名,现要从中抽取名进行调研座谈,如果用比例分配的分层随机抽样的方法进行抽样,则应抽女职工 名.
【答案】9
【分析】利用分层抽样的比例关系列式求解.
【详解】根据分层抽样的定义和方法,设应抽女职工x名,则,解得.
故答案为:9.
8.(23-24高一下·重庆·期末)放风筝是一项有益的运动,现对高一和高二共1500名同学进行按比例分层抽样调查,统计近两年放过风筝的人数,有如下数据:高一学生抽取有效样本40,放过风筝的人数为19,高二学生抽取有效样本60,放过风筝的人数为,由此估计两个年级近两年放过风筝的人数约为540,则 .
【答案】17
【分析】根据分层抽样的定义建立方程,解之即可求解.
【详解】由题意知,,
解得,
即高二学生抽取有效样本60,放过风筝的人数为17.
故答案为:17
9.(23-24高一下·吉林白山·期末)国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的未来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一名学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第四个号码为
随机数表如下:
0154 3287 6595 4287 5346
7953 2586 5741 3369 8324
4597 7386 5244 3578 6241
【答案】44
【分析】根据随机数表的读取方法列出前几个数,即可得解
【详解】根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,
如下:32,58,65,74,13,36,98,32,44;
其中58,65,74,98不在编号范围内,舍去,再去除重复的,剩下的号码为32,13,36,44,
所以选取的第四个号码为44.
故答案为:44
四、解答题
10.(22-23高一上·北京丰台·期末)某校高中部有高一学生600人,高二学生480人,高三学生420人.某研究小组为了调查该校高中部不同年级学生课后作业量的情况,现采用分层随机抽样的方法在三个年级共抽取100名学生,应抽取高一学生的人数为多少?
【答案】40
【分析】利用分层抽样比求解.
【详解】解:应抽取高一学生的人数为
.
11.(2024高一·全国·专题练习)某高级中学共有学生3 000名,各年级男、女生的人数如表:
高一年级
高二年级
高三年级
女生
487
x
y
男生
513
560
z
已知高二年级女生比高一年级女生多53人.
(1)高二年级有多少名女生?
(2)现对各年级用比例分配的分层随机抽样的方法从全校抽取300名学生,应从高三年级抽取多少名学生?
【答案】(1)540名
(2)90名
【分析】(1)根据题意可以求解;(2)根据总人数人,根据分层抽样抽取名,计算出来高三人数.
【详解】(1)由,解得,
所以高二年级有名女生.
(2)高三年级人数为,
所以,
故应从高三年级抽取90名学生.
【能力提升】
一、单选题
1.(23-24高一下·江苏常州·期末)从某班学号为1到10的十名学生(其中含学生甲)中抽取3名学生参加某项调查,现用抽签法抽取样本(不放回抽取),每次抽取一个号码,共抽3次,设甲第一次被抽到的可能性为,第二次被抽到的可能性为,则( )
A., B.,
C., D.,
【答案】D
【分析】由题意结合简单随机抽样的特征即可确定实数,的值.
【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以甲第一次被抽到的可能性为,
第二次被抽到的可能性为.
即甲同学在每次抽样中被抽到的可能性都是,所以,.
故选:D.
2.(24-25高一上·江西·阶段练习)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
【答案】B
【分析】根据全面调查的定义可得出合适的选项.
【详解】全面调查是对调查对象的所有单位一一进行调查的调查方式,
A. 查一个水库所有鱼中草鱼所占的比例.,调查数目较多,不适合全面调查;
B. 调查一个县各村的粮食播种面积适合全面调查;
C.调查一批炮弹的杀伤半径,调查数目较多,可以使用抽样调查;
D. 调查一批玉米种子的发芽率,调查数目较多,且具有破坏性,不适合全面调查.
故选:B.
3.(21-22高一下·河北邯郸·期末)为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中O型血的人数比AB型血的人数多20,则( )
A.100 B.120 C.200 D.240
【答案】B
【分析】由题知,再解方程即可得答案.
【详解】解:因为感染人群中O型血、A型血、B型血、AB型血的人数比为4:3:3:2,
所以,抽取样本量为的样本中,O型血的人数为, AB型血的人数为,
所以,,解得
故选:B
4.(22-23高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,高二,高三共有学生6000名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这6000名学生中抽取一个容量60的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
【答案】C
【分析】根据分层抽样的性质,结合样本容量进行求解即可.
【详解】因为从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,
所以设高三抽取的人数为,则高二抽取的人数为,高一抽取的人数为,
因为样本容量为60,所以,
设我校高二年级的人数为,
根据分层抽样得:,
故选:C
二、多选题
5.(22-23高一下·福建漳州·期末)在以下调查中,适合用抽样调查的有( )
A.调查某品牌的冰箱的使用寿命
B.调查某个班级10名学生每周的体育锻炼时间
C.调查一批炮弹的杀伤半径
D.调查一个水库所有鱼中草鱼所占的比例
【答案】ACD
【分析】根据抽样调查的含义,即可判断答案.
【详解】对于选项A,C,D中的对象,由于调查的范围较广,经济成本会较高,
不适宜全面调查,适宜抽样调查,
对于B,由于一个班里10名学生样本数量较小,适宜全面调查,
故选:ACD
6.(23-24高一下·吉林·阶段练习)某公司生产三种型号的轿车,年产量分别为1500辆、6000辆和2000辆.为检验产品质量,公司质检部门要抽取57辆进行检验,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次应抽取9辆、36辆、12辆
D.这三种型号的轿车,每一辆被抽到的可能性相同
【答案】ACD
【分析】根据分层抽样的概念及计算方法,逐项判定即可求解.
【详解】对于A,因为是三种型号的轿车,个体差异明显,所以选择分层随机抽样,所以A正确;
对于B,个体数目多,用抽签法制签难,搅拌不均匀,抽出的样本不具有代表性,所以B错误;
对于C,因为,所以(辆),(辆),(辆),所以三种型号的轿车依次应抽取9辆、36辆、12辆,所以C正确;
对于D,分层随机抽样中,每一个个体被抽到的可能性相同,故选项D正确.
故选:ACD.
7.(22-23高一下·陕西西安·期中)下列抽样实验中,不适宜用抽签法的是( )
A.从某场生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检测
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检测
【答案】ACD
【分析】根据已知条件,结合抽签法的定义,即可求解.
【详解】A、D中个体的总数较大,不适合用抽签法;
C中甲、乙两厂生产的两箱产品质量可能差别较大,不适合用抽签法;
B中个体的总数和样本容量均较小,且是同厂生产的两箱产品,质量差别不大,适宜用抽签法.
故选:ACD.
三、填空题
8.(20-21高一下·河南南阳·期中)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组,在参加活动的职工中,青年人、中年人、老年人所占比例如图1所示,且游泳组的职工人数是登山组的3倍,在登山组中青年人、中年人、老年人所占比例如图2所示.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本,则游泳组中中年人应抽取 人.
【答案】75
【分析】题目考查分层抽样的方法,已知样本的总人数,所以,要求游泳组中中年人的人数,需要知道两个比例关系,一是游泳组占总人数的比例,题目已知为,二是游泳组中中年人的比例,这个需要结合以上两个图中总人数和登山人数的比例确定,确定之后,即可求出游泳组中中年人的数量
【详解】设登山组的职工人数为,则游泳组的职工人数为,总人数为,所以容量为200的样本中,游泳组人数为150
根据图1可得:总人数中,老年人的人数为,同理,青年人的人数为 中年人的人数为;根据图2可得:登山组中,老年人的人数为,青年人的人数为,中年人的人数为,所以游泳组中,老年人的人数为,青年人的人数为,中年人的人数为,所以游泳组中,中年人占比为,所以游泳组中中年人的人数为人
故答案为:75
9.(24-25高一上·河南焦作·期末)某次九省联考考试结束后,相关部门为了分析考生的数学成绩,采用随机抽样的方式从某地区抽取了3000名高三学生的数学成绩,则此次抽样的样本为 .
【答案】某地区3000名高三学生的数学成绩
【分析】根据随机抽样样本的定义判断.
【详解】总体为所有参加此次考试考生的数学成绩;样本为某地区3000名高三学生的数学成绩.
故答案为:某地区3000名高三学生的数学成绩.
10.(22-23高一下·新疆喀什·期末)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200、400、300、100件.为检验产品的质量,现用分层抽样的方法,从以上所有的产品中抽取60件进行检验,则应从甲种型号的产品抽取 件.
【答案】12
【分析】利用分层抽样的定义直接求解即可.
【详解】由题意知分层比为,且总抽量为件
故甲产品应抽件
故答案为:12
四、解答题
11.(2024高一·全国·专题练习)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为175,方差为20,女生样本均值为165,方差为30
(1)如果已知男、女的样本量按比例分配,请计算总样本的均值为多少?
(2)如果已知男、女的样本量都是25,请计算总样本均值为多少?
【答案】(1)cm
(2)cm
【分析】(1)分析题意,得到分层比,再进行计算均值即可
(2)首先找出男、女的样本量都是25,进行总样本均值计算即可.
【详解】(1)男、女的样本量按比例分配,
总样本的均值为cm.
(2)男、女的样本量都是25,
总样本的均值为cm,
12.(20-21高一下·山东菏泽·期末)某机械厂三个车间共有工人1000名,各车间男、女工人数如下表:
第一车间
第二车间
第三车间
女工
170
120
男工
180
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是,其中第三车间的男女比例为.
(1)求,,的值.
(2)现用分层抽样的方法在全厂男工人中抽取55名工人进行技术比武,则在第三车间抽取多少名男工人?
【答案】(1),,;(2)24名.
【分析】(1)根据题意可得,可求出,再由第三车间的工人数是,以及男女比例即可求解.
(2)根据分层抽样比即可求解.
【详解】解:(1)由,得.
因为第一车间的工人数是,
第二车间的工人数是,
所以第三车间的工人数是.
所以,.
(2)设应从第三车间抽取名工人,
共有男工人,
则由,得,
所以应在第三车间抽取24名男工人.
13.(21-22高一下·陕西咸阳·期中)一汽车厂生产A、B、C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表所示(单位:辆):
轿车A
轿车B
轿车C
舒适型
100
150
z
标准型
300
450
600
按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.
(1)求z的值;
(2)用分层抽样的方法在C类轿车中抽取一个容量为5的样本,应如何抽取?
【答案】(1)400;
(2)抽取2辆舒适型轿车,3辆标准型轿车.
【分析】(1)根据给定数据,结合分层抽样的比例求出本月生产的轿车数即可求解作答.
(2)由(1)的结论,再按分层抽样的比例计算作答.
【详解】(1)设该厂本月生产轿车n辆,依题意,得,解得n=2000,
则z=2000-100-300-150-450-600=400,
所以z的值是400.
(2)设所抽样本中有m辆舒适型轿车,
因用分层抽样的方法在C类轿车中抽取一个容量为5的样本,则,解得m=2,
所以在C类轿车中抽取2辆舒适型轿车,3辆标准型轿车.
14.(21-22高一下·北京大兴·期末)某校有高中学生1000人,其中男生400人,女生600人.A同学按男生、女生进行分层,采用分层随机抽样的方法调查该校全体高中学生的身高(单位:)情况,总样本量为100,计算得到男生身高样本的平均数为170,方差为16;女生身高样本的平均数为160,方差为18.
(1)如果已知男、女样本量按比例分配,求总样本的平均数和方差;
(2)如果已知男、女样本量分别为30和70,在这种情况下,总样本的平均数为,总样本的方差为,分别直接写出与与的大小关系;
(3)如果已知B同学采用了简单随机抽样的方法调查该校全体高中学生的身高情况,样本量为100,其样本平均数为,能否认为比更接近总体平均身高,说明理由.
【答案】(1),
(2)
(3)答案见解析
【分析】(1)根据按比例的分层抽样总样本的平均数和总样本的方差公式计算可得答案;
(2)根据按比例的分层抽样总样本的平均数和总样本的方差公式计算再比较大小可得答案;
(3)示例1:可以认为比更接近总体平均身高。理由:男、女生身高存在明显差异,采用按男、女比例分配的分层随机抽样的效果一般会好于简单随机抽样;示例2:不能认为比更接近总体平均身高,理由:由于样本的随机性,对于一次抽样而言,可能简单随机抽样的估计效果好于分层随机抽的估计效果;示例3:无法确定是否比更接近总体平均身高,理由:由于样本的随机性,对于一次抽样而言,并不能保证分层随机抽的估计效果一定好于简单随机抽样.
【详解】(1)由题意知,总样本的平均数为
总样本的方差为
(2)男、女样本量分别为30和70时,总样本的平均数为
,
总样本的方差为
所以.
(3)答案示例1:可以认为比更接近总体平均身高.
理由如下:
男、女生身高存在明显差异,采用按男、女比例分配的分层随机抽样的效
果一般会好于简单随机抽样,所以可以认为比更接近总体平均身高.
答案示例2:不能认为比更接近总体平均身高.
理由如下:
由于样本的随机性,对于一次抽样而言,可能简单随机抽样的估计效果好于
分层随机抽的估计效果,所以不能认为比更接近总体平均身高.
答案示例3:无法确定是否比更接近总体平均身高.
理由如下:
由于样本的随机性,对于一次抽样而言,并不能保证分层随机抽的估计效果
一定好于简单随机抽样,所以无法确定是否比更接近总体平均身高.
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司6
学科网(北京)股份有限公司
$$