内容正文:
9.1 随机抽样
目录
知识点一:全面调查与抽样调查 2
题型1:普查与抽样调查 2
知识点二:简单随机抽样 3
题型2: 简单随机抽样的辨析 5
题型3: 简单随机抽样的应用 5
题型4: 简单随机抽样估计总体 8
知识点三:分层随机抽样 9
题型5:分层随机抽样的辨析 10
题型6:分层随机抽样的有关计算 11
题型7:分层随机抽样的方案设计 12
知识点四:获取数据的途径 13
题型8:获取数据的途经 13
知识点一:全面调查与抽样调查
1. 全面调查(普查)
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体.
2. 抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
3. 普查与抽样调查的选择
(1) 普查是对要调查的所有对象进行考查,当考查对象很少时,普查是很好的调查方式;当考查的对象很多,又必须掌握全体对象的详细信息时,也需要采用普查的方式,如人口普查.
(2) 当样本容量很大时,通常是通过科学的抽样方法抽取具有代表性的样本进行调查;当样本容量很小,且进行的调查具有破坏性,那么也可以选择抽样调查.
题型1:普查与抽样调查
【例1.1.】 为了调查某校学生的视力情况,在全校1700名学生中随机抽取了150名学生,下列说法正确的是( )
A.此次调查属于全面调查 B.样本容量是150
C.1700名学生是总体 D.被抽取的每一名学生称为个体
【例1.2.】 要调查下列问题,适合采用全面调查(普查)的是( )
A.某城市居民3月份人均网上购物的次数
B.某品牌新能源汽车最大续航里程
C.检测一批灯泡的使用寿命
D.调查一个班级学生每周的体育锻炼时间
【例1.3.】 某县教育局为了解本县今年参加大联考的学生的成绩,从5000名参加今年大联考的学生中抽取了250名学生的成绩进行统计,则下列表述正确的是( )
A.5000名学生是总体
B.抽取的250名学生的成绩是总体的一个样本
C.样本量是250名学生的成绩
D.每一名学生是个体
【例1.4.】 (多选)下列调查方式合适的是( )
A.为了了解炮弹的杀伤力,采用抽样调查的方式
B.为了了解全国中学生的睡眠状况,采用普查的方式
C.为了了解人们保护水资源的意识,采用抽样调查的方式
D.检查一批待售袋装牛奶中的细菌是否超标,采用普查的方式
知识点二:简单随机抽样
1. 简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本成为简单随机样本.
除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
2. 简单随机抽样的特点
(1) 总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;
(2) 逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;
(3) 不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算.
(4) 等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性.
3. 简单随机抽样的方法
(1) 抽签法
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数.
优点:简单易形,当总体的个体数不多时,使总体处于“搅拌”均匀的状态比较容易,此时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性;
缺点:仅适用于个体数较少的总体,当总体的容量较大时,费时费力又不方便,况且,如果号签搅拌的不均匀,可能导致抽样不公平.
(2) 随机数法
把总体中的N个个体依次编号,然后用随机数工具(随机试验、计算器、电子表格软件、R统计软件等)产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
优点:操作简单易行,它很好地解决了用抽签法当总总体中的个数较多时制签难的问题,
在总体容量不大的情况下是行之有效的.
缺点:总体中的个数很多,对个体编号的工作量太大,即使用随机数表法操作也不方便快捷.
(3) 抽签法与随机数法的比较
相同点:(1)抽签法与随机数法都是简单随机抽样,并且要求被抽取样本的总体的个数有限;(2)抽签法与随机数法都是从总体中逐个进行抽取,都是不放回抽样;
不同点:抽签法适用于总体个数较少的情况;随机数法适用于总体个数较多的情形.
4. 简单随机抽样中的两类特征数
(1) 总体均值(总体平均值)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.如果总体的N个变量值中,不同的值共有k()个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
(2) 样本均值(样本平均值)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
题型2: 简单随机抽样的辨析
【例2.1.】 下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
【例2.2.】 下列抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方法确定号码的后四位是2 709的为三等奖
B.某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.从8台电脑中逐个不放回地随机抽取2台,进行质量检验,假设8台电脑已编好号,对编号随机抽取
D.从20个零件中一次性抽出3个进行质量检查
【例2.3.】 (多选)下列是从总体中抽得的样本,简单随机样本为( )
A.总体编号为1~75,任意选出编号范围内的10个数字作为抽中的编号
B.总体编号为1~75,在0~99中产生随机整数r,若或,则舍弃,重新抽取
C.总体编号为1~75,在0~99中产生随机整数r,r除以75的余数作为抽中的编号.若余数为0,则抽中75
D.总体编号为6001~6876,在1~876范围内产生一个随机整数r,把作为抽中的编号
题型3: 简单随机抽样的应用
方法提炼
1. 抽签法的应用
一个抽样试验能否采用抽签法,关键看两个方面:一是制作号签是否方便;二是号签是否容易被搅匀。当总样本量和样本量都较少时,可采用抽签法。采用抽签法设计抽样方案时,要严格按照步骤进行,即编号、制签、搅匀、抽签、确定样本.
2. 随机数法步骤:
①把总体中的每个个体编号.
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,知道抽足样本所需要的数量.
【注意】如果产生的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同标号个数等于样本所需要的数量.
【例3.1.】 在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【例3.2.】 下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【例3.3.】 某学校数学组要从11名数学老师中推选3名老师参加市里举办的教学能手比赛,制作了11个形状、大小相同的签,抽签中确保公平性的关键是( )
A.制签 B.搅拌均匀 C.逐一抽取 D.抽取后不放回
【例3.4.】 判断正误.
(1)抽签法和随机数法都适用于总体容量和样本容量较小时的抽样.( )
(2)利用随机数法抽取样本时,选定的初始数是任意的,但读数的方向只能是从左向右读.( )
(3)利用随机数法抽取样本时,若一共有总体容量为100,则给每个个体分别编号为1,2,3,…,100.( )
【例3.5.】 已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是( )
A.07 B.12 C.39 D.44
【例3.6.】 现要用随机数表法从总体容量为240(编号为001到240)的研究对象中挑选出50个样本,则在下列数表中按从左至右的方式抽取到的第四个对象的编号为( )
32451 74491 14562 16510 02456 89640 56816 55464 41630 85621 05214 84513 12541 02145
A.5 B.44 C.165 D.210
【例3.7.】 某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;
选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能性是否相等?
【例3.8.】 当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测.
(1)在这个问题中,总体、样本各是什么?
(2)在①抽签法,②随机数法这两个条件中任选一个填入下面的横线上,并解答.
为深入了解这50名学生的视力情况,从中随机抽取6人,请写出利用 1 抽取该样本的过程.
【例3.9.】 某市通过电话进行民意调查.该市的电话号码有7位,其中前两位为区域代码,只能为2,3,5,7的任意两位数组成(数字可重复),后5位取自0~9十个数字,现在任意选择3个区域,每个区域随机选取5个号码进行调查,请你设计一种抽取方案选出这15个电话号码.
题型4: 简单随机抽样估计总体
【例4.1.】 我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.133石 B.159石 C.336石 D.168石
【例4.2.】 管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800 B.1800 C.1400 D.1200
【例4.3.】 某中学开学后从高一年级的学生中随机抽取90名学生进行家庭情况调查.经过一段时间后再次从这个年级随机抽取100名学生进行学情调查,发现有20名同学上次被抽到过,估计这个学校高一年级的学生人数为( )
A.180 B.400 C.450 D.2000
【例4.4.】
在“绿水青山就是金山银山”发展理念的指导下,治沙防沙的科技实力不断提升,并为沙漠治理提供了有力的资金和技术支持.现在要调查某地区沙漠经过治理后的植物覆盖面积和某野生动物的数量,将该地区分成面积相近的150个地块,用简单随机抽样的方法抽出15个作为样区,调查得到样本数据,其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,经统计得,则该地区的植物覆盖面积和这种野生动物数量的估计值分别为( )
A.600,1200 B.600,12000 C.60,1200 D.60,12000
【例4.5.】 中国农历的二十四节气是中华民族的智慧与传统文化的结晶,二十四节气歌是以春、夏、秋、冬开始的四句诗.某小学三年级共有学生600名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校三年级的600名学生中,对二十四节气歌一句也说不出的有( )
A.17人 B.83人 C.102人 D.115人
知识点三:分层随机抽样
1. 分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
2. 分层随机抽样的步骤
(1) 分层:按某种特征将总体分成若干部分(层);
(2)
定抽样比:抽样比;
(3)
定数:确定第层应该抽取的个体数(为第i层所包含的个体总数);
(4) 抽样:每层分别按简单随机抽样的方法抽取样本;
(5) 成样:综合各层抽样,组成样本.
3. 分层随机抽样中的两类特征数
(1) 总体平均数和样本平均数
在分层随机抽样中,如果层数为2层,第1层和第2层包含的个体数分别为和,抽样的样本容量分别为和,第1层、第2层的总体平均数分别为和,第1层、第2层的样本平均数分别为和,总体平均数为,样本平均数为,则
(2) 用样本平均数估计总体平均数
由于第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
在比例分配的分层随机抽样中,,可得.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数为.
题型5:分层随机抽样的辨析
【例5.1.】 ①植物根据植株的高度及分枝部位等可以分为乔木、灌木和草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1000箱牛奶抽取10箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【例5.2.】 (多选)在分层随机抽样中,每个个体等可能地被抽取,下列说法错误的是( )
A.每层的个体数必须一样多
B.每层抽取的个体数相等
C.每层抽取的个体数可以不一样多,但必须满足ni=n·(i=1,2,…,k),其中i是层数,n是样本量,Ni是第i层所包含的个体数,N是总体容量
D.只要抽取的样本量一定,每层抽取的个体数没有限制
【例5.3.】 为了解某地区居民使用手机扫码支付的情况,拟从该地区的居民中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段的人员使用手机扫码支付的情况有较大差异,而男、女使用手机扫码支付的情况差异不大.在下面的抽样方法中,最合理的是( )
A.抽签法 B.按性别分层随机抽样
C.按年龄段分层随机抽样 D.随机数法
【例5.4.】 分层抽样使用的范围是( )
A.总体中个数较少 B.总体中个数较多
C.总体由个体差异明显的几部分组成 D.以上都可以
题型6:分层随机抽样的有关计算
【例6.1.】 某校要从高一、高二、高三共2 023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 023名学生中剔除23名,再从剩下的2 000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
【例6.2.】 我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡四百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有400人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200 B.100 C.120 D.140
【例6.3.】 某工厂生产A,B,C三种不同型号的产品,它们的产量之比为2∶3∶5,用分层抽样的方法抽取一个容量为n的样本.若样本中A型号的产品有30件,则样本容量n为( )
A.150 B.180 C.200 D.250
【例6.4.】 某学校高二年级选择“史政地”,“史政生”和“史地生”组合的同学人数分别为210,90和60.现采用分层抽样的方法选出12位同学进行项调查研究,则“史政生”组合中选出的同学人数为( )
A.7 B.6 C.3 D.2
【例6.5.】
在某学校的期中考试中,高一、高二、高三年级的参考人数分别为.现用分层抽样的方法从三个年级中抽取样本,经计算得高一、高二、高三年级数学成绩的样本平均数分别为,则全校学生数学成绩的总样本平均数为( )
A.92 B.91 C.90 D.89
【例6.6.】
某企业两个分厂生产同一种电子产品,产量之比为,现采用分层随机抽样方法,从两个分厂生产的该产品中共抽取100件做使用寿命的测试,由所得样品的测试结果计算出该产品的平均使用寿命分别为1000小时,1020小时,估计这个企业所生产的该产品的平均使用寿命为( )
A.1012小时 B.1010小时 C.1008小时 D.1006小时
【例6.7.】
某课题进行研究,分别从A,B,C三所高校中用分层随机抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中)
(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
题型7:分层随机抽样的方案设计
【例7.1.】 某家电视台在互联网上征集某电视节目现场参与的观众,报名的总人数为12000人,分别来自4个城区,其中东城区2400人,西城区4600人,南城区3800人,北城区1200人,从中抽取60人参加现场节目,采用分层随机抽样的方式抽取参加现场节目的观众.
①确定抽样比,样本容量,总体容量,抽样比为.
②分层,按城区分为四层:东城区、西城区、南城区、北城区.
③按比例确定每层抽取的个体数,在东城区抽取(人),在西城区抽取(人),在南城区抽取(人),在北城区抽取(人).
④在各层分别用简单随机抽样法抽取样本,将各城区抽取的观众合在一起组成样本.
正确的抽取步骤是 .
【例7.2.】 某家电视台在因特网上征集某电视节目现场参与的观众,报名的总人数为12000人,分别来自4个城区,其中A区2400人,B区4600人,C区3800人,D区1200人,从中抽取60人参加现场的节目,应当如何抽取?写出抽取过程.
【例7.3.】 为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
知识点四:获取数据的途径
统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,是统计学研究的重要内容.
(1) 通过调查获取数据
适用范围:对于有限总体问题,一般通过抽样调查或普查的方法获取数据.
注意事项:充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误.
(2) 通过试验获取数据
适用范围:没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据.
注意事项:严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.
(3) 通过观察获取数据
适用范围:自然现象.
注意事项:需要专业测量设备获取观测数据.
(4) 通过查询获得数据
适用范围:二手数据.
注意事项:数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真.
题型8:获取数据的途经
【例8.1.】 下列说法不正确的是( )
A.通过调查获取数据时,无论采用什么抽样方法,关键是要有效避免抽样过程中的人为错误.
B.通过试验获取数据时需要严格控制好试验环境.
C. 通过观察获取数据时,由于自然现象会随着时间的变化而变化,一般不能用抽样的方法获取数据.
D. 通过查询获取数据时,可以直接采用“拿来主义”即可.
【例8.2.】 下列说法不正确的是( )
A.数据有直接获取和间接获取两种来源.
B.获取数据应注意数据来源的广泛性、代表性、均衡性.
C. 引用间接数据时要注明数据来源,尊重他人劳动成果,保护他人知识产权.
D. 引用间接数据时,不需要了解或正确理解其含义,直接引用即可.
【例8.3.】 “中国天眼”为500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
【例8.4.】 下列数据一般需要通过实验获取的是( )
A.某子弹的射程 B.某学校的男女生比例
C.华为手机的市场占有率 D.期中考试的班级数学成绩
【例8.5.】 为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
【例8.6.】 若要研究某城市家庭的收入情况,获取数据的途径应该是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
(
1
)
学科网(北京)股份有限公司
$$
9.1 随机抽样
目录
知识点一:全面调查与抽样调查 2
题型1:普查与抽样调查 2
知识点二:简单随机抽样 4
题型2: 简单随机抽样的辨析 5
题型3: 简单随机抽样的应用 7
题型4: 简单随机抽样估计总体 11
知识点三:分层随机抽样 13
题型5:分层随机抽样的辨析 14
题型6:分层随机抽样的有关计算 16
题型7:分层随机抽样的方案设计 18
知识点四:获取数据的途径 20
题型8:获取数据的途经 21
知识点一:全面调查与抽样调查
1. 全面调查(普查)
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体.
2. 抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
3. 普查与抽样调查的选择
(1) 普查是对要调查的所有对象进行考查,当考查对象很少时,普查是很好的调查方式;当考查的对象很多,又必须掌握全体对象的详细信息时,也需要采用普查的方式,如人口普查.
(2) 当样本容量很大时,通常是通过科学的抽样方法抽取具有代表性的样本进行调查;当样本容量很小,且进行的调查具有破坏性,那么也可以选择抽样调查.
题型1:普查与抽样调查
【例1.1.】 为了调查某校学生的视力情况,在全校1700名学生中随机抽取了150名学生,下列说法正确的是( )
A.此次调查属于全面调查 B.样本容量是150
C.1700名学生是总体 D.被抽取的每一名学生称为个体
【答案】B
【详解】对于A,此次调查是调查某校学生的视力情况,不属全面调查,A错误;
对于B,样本容量是150,B正确;
对于C,全校1700名学生的视力情况是总体,C错误;
对于D,被抽取的每一名学生的视力情况为个体,D错误.
故选:B
【例1.2.】 要调查下列问题,适合采用全面调查(普查)的是( )
A.某城市居民3月份人均网上购物的次数
B.某品牌新能源汽车最大续航里程
C.检测一批灯泡的使用寿命
D.调查一个班级学生每周的体育锻炼时间
【答案】D
【详解】A ,B选项中要调查的总体数量和工作量都较大,适合采用抽查;
C选项的检测具有毁损性,适合抽查;
D选项要调查的总体数量较小,工作量较小,适合采用普查,
故选:D.
【例1.3.】 某县教育局为了解本县今年参加大联考的学生的成绩,从5000名参加今年大联考的学生中抽取了250名学生的成绩进行统计,则下列表述正确的是( )
A.5000名学生是总体
B.抽取的250名学生的成绩是总体的一个样本
C.样本量是250名学生的成绩
D.每一名学生是个体
【答案】B
【详解】对A,总体指的是5000名参加今年大联考的学生的成绩,所以A错误;
对B,样本指的是抽取的250名学生的成绩,所以B正确;
对C,样本量是250,所以C错误;
对D,个体指的是5000名学生中的每一名学生的成绩,所以D错误.
故选:B.
【例1.4.】 (多选)下列调查方式合适的是( )
A.为了了解炮弹的杀伤力,采用抽样调查的方式
B.为了了解全国中学生的睡眠状况,采用普查的方式
C.为了了解人们保护水资源的意识,采用抽样调查的方式
D.检查一批待售袋装牛奶中的细菌是否超标,采用普查的方式
【答案】AC
【详解】了解炮弹杀伤力的过程中具有破坏性,所以采用抽样调查的方式;
了解全国中学生的睡眠状况,工作量大,所以采用抽样调查的方式;
了解人们保护水资源的意识,工作量大,所以采用抽样调查的方式;
检查一批待售袋装牛奶中的细菌是否超标,具有毁损性,所以采用抽样调查的方式.
故选:AC.
知识点二:简单随机抽样
1. 简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本成为简单随机样本.
除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
2. 简单随机抽样的特点
(1) 总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;
(2) 逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;
(3) 不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算.
(4) 等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性.
3. 简单随机抽样的方法
(1) 抽签法
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数.
优点:简单易形,当总体的个体数不多时,使总体处于“搅拌”均匀的状态比较容易,此时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性;
缺点:仅适用于个体数较少的总体,当总体的容量较大时,费时费力又不方便,况且,如果号签搅拌的不均匀,可能导致抽样不公平.
(2) 随机数法
把总体中的N个个体依次编号,然后用随机数工具(随机试验、计算器、电子表格软件、R统计软件等)产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
优点:操作简单易行,它很好地解决了用抽签法当总总体中的个数较多时制签难的问题,
在总体容量不大的情况下是行之有效的.
缺点:总体中的个数很多,对个体编号的工作量太大,即使用随机数表法操作也不方便快捷.
(3) 抽签法与随机数法的比较
相同点:(1)抽签法与随机数法都是简单随机抽样,并且要求被抽取样本的总体的个数有限;(2)抽签法与随机数法都是从总体中逐个进行抽取,都是不放回抽样;
不同点:抽签法适用于总体个数较少的情况;随机数法适用于总体个数较多的情形.
4. 简单随机抽样中的两类特征数
(1) 总体均值(总体平均值)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.如果总体的N个变量值中,不同的值共有k()个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
(2) 样本均值(样本平均值)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
题型2: 简单随机抽样的辨析
【例2.1.】 下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
【答案】B
【详解】解:①从无限多个个体中抽取100个个体作为样本,不满足总体个数为有限个;
②从20件玩具中一次性抽取3件进行质量检验,不满足逐个抽取;
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛,不满足随机抽取;
④盒子中共有80个零件,从中选出5个零件进行质量检验,
在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里,满足有放回简单随机抽样.
综上可得以上满足简单随机抽样的定义的仅有④.
故选:B.
【例2.2.】 下列抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方法确定号码的后四位是2 709的为三等奖
B.某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.从8台电脑中逐个不放回地随机抽取2台,进行质量检验,假设8台电脑已编好号,对编号随机抽取
D.从20个零件中一次性抽出3个进行质量检查
【答案】C
【详解】根据简单随机抽样的特点,可知:
A不符合等可能性,故不是简单随机抽样;
B传送带上产品的数量不确定,故不是简单随机抽样;
D中的“一次性随机抽出3个”不是“逐个不放回地随机抽取3个”,故不是简单随机抽样.
答案:C.
【例2.3.】 (多选)下列是从总体中抽得的样本,简单随机样本为( )
A.总体编号为1~75,任意选出编号范围内的10个数字作为抽中的编号
B.总体编号为1~75,在0~99中产生随机整数r,若或,则舍弃,重新抽取
C.总体编号为1~75,在0~99中产生随机整数r,r除以75的余数作为抽中的编号.若余数为0,则抽中75
D.总体编号为6001~6876,在1~876范围内产生一个随机整数r,把作为抽中的编号
【答案】AD
【详解】对于选项A:因为总体编号为1~75,且任意选出编号范围内的10个数字,
则每个数字被抽中是等可能性的,所以是简单随机样本,故A正确;
对于选项B:总体编号为1~75,在0~99中产生随机整数r,若r=0或r>75.则舍弃,重新抽取.
只有编号为1~75可能被抽中,但不是等可能性的,所以不是简单随机样本,故B错误;
对于选项C:总体编号为1~75,在0~99中产生随机整数r,r除以75的余数作为抽中的编号,若余数为0,则抽中75.
因为1~24,75号与25~74号抽中的可能性不同,所以不是简单随机样本,故C错误;
对于选项D:总体编号为6001~6876,在1~876范围内产生一个随机整数r,把r+6000作为抽中的编号.
每个编号抽中的可能性相同,所以是简单随机样本,故D正确;
故选:AD.
题型3: 简单随机抽样的应用
方法提炼
1. 抽签法的应用
一个抽样试验能否采用抽签法,关键看两个方面:一是制作号签是否方便;二是号签是否容易被搅匀。当总样本量和样本量都较少时,可采用抽签法。采用抽签法设计抽样方案时,要严格按照步骤进行,即编号、制签、搅匀、抽签、确定样本.
2. 随机数法步骤:
①把总体中的每个个体编号.
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,知道抽足样本所需要的数量.
【注意】如果产生的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同标号个数等于样本所需要的数量.
【例3.1.】 在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【答案】B
【详解】由于第一次剔除时采用抽签法,对每个人来说可能性相等,
然后随机抽取10人对每个人的机会也是均等的,
所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.
故选:B.
【例3.2.】 下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【答案】B
【详解】选项A,总体中的个体数较大,样本容量也较大,不适合用抽签法,故A不符合题意;
选项B,总体中的个体数较小,样本容量也较小,
且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法,故B符合题意;
选项C,甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法,故C不符合题意;
选项D,总体中的个体数较大,不适合用抽签法,故D不符合题意.
故选:B
【例3.3.】 某学校数学组要从11名数学老师中推选3名老师参加市里举办的教学能手比赛,制作了11个形状、大小相同的签,抽签中确保公平性的关键是( )
A.制签 B.搅拌均匀 C.逐一抽取 D.抽取后不放回
【答案】B
【详解】确保公平性要保证每个签抽到是等概率的,因此抽签法要做到搅拌均匀,才具有公平性.
故选:B
【例3.4.】 判断正误.
(1)抽签法和随机数法都适用于总体容量和样本容量较小时的抽样.( )
(2)利用随机数法抽取样本时,选定的初始数是任意的,但读数的方向只能是从左向右读.( )
(3)利用随机数法抽取样本时,若一共有总体容量为100,则给每个个体分别编号为1,2,3,…,100.( )
【答案】 正确 错误 错误
【详解】(1)最常用的简单随机抽样方法有抽签法和随机数法,都适用于总体容量和样本容量较小时的抽样,故正确;
(2)读数的方向也是任意的,故错误;
(3)编号应为00,01,02,…,99,故错误.
【例3.5.】 已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是( )
A.07 B.12 C.39 D.44
【答案】D
【详解】由题意可知得到的样本编号依次为12,06,01,16,19,10,07,44,39,38,则得到的第8个样本编号是44.
故选:D.
【例3.6.】 现要用随机数表法从总体容量为240(编号为001到240)的研究对象中挑选出50个样本,则在下列数表中按从左至右的方式抽取到的第四个对象的编号为( )
32451 74491 14562 16510 02456 89640 56816 55464 41630 85621 05214 84513 12541 02145
A.5 B.44 C.165 D.210
【答案】D
【详解】由随机数表抽样方法可知,以3个数字为单位抽取数字,且数字不能大于240,且要去掉重复数字,据此第一个数字为114,第二个为165,第三个为100,第4个为210.
故选:D
【例3.7.】 某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;
选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能性是否相等?
【答案】(1)选法一是抽签法,选法二不是抽签法;理由见解析
(2)相等
【详解】(1)选法一满足抽签法的特征,是抽签法.选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分;
(2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的,
因此选法一中抽取1个号签的概率和选法二中摸到红球的概率相等,均为
故这两种选法中每名员工被选中的可能性相等,均为.
【例3.8.】 当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测.
(1)在这个问题中,总体、样本各是什么?
(2)在①抽签法,②随机数法这两个条件中任选一个填入下面的横线上,并解答.
为深入了解这50名学生的视力情况,从中随机抽取6人,请写出利用 1 抽取该样本的过程.
【详解】解:(1)总体是该中学高三年级400名学生的视力;
样本是所抽取的50名学生的视力.
(2)选择①.
利用抽签法步骤如下,
第一步:将这50名学生编号,编号为1,2,3,…,50.
第二步:将50个号码分别写在纸条上,并揉成团,制成号签.
第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.
第四步:从容器中逐一抽取6个号签,并记录上面的号码.
对应上面6个号码的学生就是抽取的学生.
选择②.
利用随机数法步骤如下,
第一步:将这50名学生编号,编号为01,02,03,…,50.
第二步:用计算机产生1~50范围内的整数随机数,把产生的随机数作为抽中的编号.
第三步:重复第二步的过程,直到抽足6个号码.对应上面6个号码的学生就是抽取的学生.
【例3.9.】 某市通过电话进行民意调查.该市的电话号码有7位,其中前两位为区域代码,只能为2,3,5,7的任意两位数组成(数字可重复),后5位取自0~9十个数字,现在任意选择3个区域,每个区域随机选取5个号码进行调查,请你设计一种抽取方案选出这15个电话号码.
【详解】解 第一步:列出只能由含2,3,5,7的任意两位数组成的区域代码,共16个,用抽签法随机抽取3个.
第二步:制作一张00000~99999的随机数,方法是用抽签法或计算机生成法产生若干个0~9之间的随机整数,5个一组,构成00000~99999之间的随机数.
第三步:用随机数表产生随机数的方法选出15个5位数即为所选号码,分成3组.
第四步:一组前加上用抽签法选出的第一个区域代码,第2,3组前分别加上选出的第2,3个区域代码.
题型4: 简单随机抽样估计总体
【例4.1.】 我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.133石 B.159石 C.336石 D.168石
【答案】D
【详解】由题意得,这批米内夹谷约为石,
故选:D
【例4.2.】 管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800 B.1800 C.1400 D.1200
【答案】C
【详解】设估计该池塘内鱼的总条数为,
由题意,得从池塘内捞出70条鱼,其中有标记的有2条,
所有池塘中有标记的鱼的概率为:,
又因为池塘内具有标记的鱼一共有40条鱼,
所以,解得,
即估计该池塘内共有条鱼.
故选:C.
【例4.3.】 某中学开学后从高一年级的学生中随机抽取90名学生进行家庭情况调查.经过一段时间后再次从这个年级随机抽取100名学生进行学情调查,发现有20名同学上次被抽到过,估计这个学校高一年级的学生人数为( )
A.180 B.400 C.450 D.2000
【答案】C
【详解】设这个学校高一年级的学生人数为n,
从高一年级的学生中随机抽取90名学生进行家庭情况调查
∵每个学生被抽到的概率是,
∴从中抽取100个,要抽到,
∴n=450,
故选:C.
【例4.4.】
在“绿水青山就是金山银山”发展理念的指导下,治沙防沙的科技实力不断提升,并为沙漠治理提供了有力的资金和技术支持.现在要调查某地区沙漠经过治理后的植物覆盖面积和某野生动物的数量,将该地区分成面积相近的150个地块,用简单随机抽样的方法抽出15个作为样区,调查得到样本数据,其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,经统计得,则该地区的植物覆盖面积和这种野生动物数量的估计值分别为( )
A.600,1200 B.600,12000 C.60,1200 D.60,12000
【答案】B
【详解】该地区的植物覆盖面积的平均数估计值为公顷
所以该地区的植物覆盖面积估计值为,
这种野生动物数量的估计值为,
故选:B
【例4.5.】 中国农历的二十四节气是中华民族的智慧与传统文化的结晶,二十四节气歌是以春、夏、秋、冬开始的四句诗.某小学三年级共有学生600名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校三年级的600名学生中,对二十四节气歌一句也说不出的有( )
A.17人 B.83人 C.102人 D.115人
【答案】C
【详解】由题意得:一句也说不出的学生频率为,
所以估计该校三年级的600名学生中,对二十四节气歌一句也说不出的有(人).
故选:C.
知识点三:分层随机抽样
1. 分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
2. 分层随机抽样的步骤
(1) 分层:按某种特征将总体分成若干部分(层);
(2)
定抽样比:抽样比;
(3)
定数:确定第层应该抽取的个体数(为第i层所包含的个体总数);
(4) 抽样:每层分别按简单随机抽样的方法抽取样本;
(5) 成样:综合各层抽样,组成样本.
3. 分层随机抽样中的两类特征数
(1) 总体平均数和样本平均数
在分层随机抽样中,如果层数为2层,第1层和第2层包含的个体数分别为和,抽样的样本容量分别为和,第1层、第2层的总体平均数分别为和,第1层、第2层的样本平均数分别为和,总体平均数为,样本平均数为,则
(2) 用样本平均数估计总体平均数
由于第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
在比例分配的分层随机抽样中,,可得.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数为.
题型5:分层随机抽样的辨析
【例5.1.】 ①植物根据植株的高度及分枝部位等可以分为乔木、灌木和草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1000箱牛奶抽取10箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【答案】C
【详解】①乔木、灌木、草木,分类明显,可以采用分层随机抽样;
②并未有明显分层特点,且样本容量较小,可以采用简单随机抽样;
故选:C.
【例5.2.】 (多选)在分层随机抽样中,每个个体等可能地被抽取,下列说法错误的是( )
A.每层的个体数必须一样多
B.每层抽取的个体数相等
C.每层抽取的个体数可以不一样多,但必须满足ni=n·(i=1,2,…,k),其中i是层数,n是样本量,Ni是第i层所包含的个体数,N是总体容量
D.只要抽取的样本量一定,每层抽取的个体数没有限制
【答案】ABD
【详解】题干中强调每个个体等可能地被抽取即说明按比例分配分层随机抽样,每层的个体数不一定都相等,故A说法错误;
由于每层的容量不一定相等,若每层抽同样多的个体,从总体来看,各层之间的个体被抽取的可能性不一定相同,故B说法错误;
对于第i层的每个个体,它被抽到的可能性与层数i无关,即对于每个个体来说,被抽入样本的可能性是相同的,故C说法正确;
每层抽取的个体数是有限制的,故D说法错误.
故选:ABD
【例5.3.】 为了解某地区居民使用手机扫码支付的情况,拟从该地区的居民中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段的人员使用手机扫码支付的情况有较大差异,而男、女使用手机扫码支付的情况差异不大.在下面的抽样方法中,最合理的是( )
A.抽签法 B.按性别分层随机抽样
C.按年龄段分层随机抽样 D.随机数法
【答案】C
【详解】依题意,“居民人数多”, “男、女使用手机扫码支付的情况差异不大”,
“老、中、青三个年龄段的人员使用手机扫码支付的情况有较大差异”,
所以最合理的是按年龄段分层随机抽样.
故选:C
【例5.4.】 分层抽样使用的范围是( )
A.总体中个数较少 B.总体中个数较多
C.总体由个体差异明显的几部分组成 D.以上都可以
【答案】C
【详解】根据分层抽样的概念知,总体由个体差异明显的几部分构成,可考虑分层抽样,
故选:C
题型6:分层随机抽样的有关计算
【例6.1.】 某校要从高一、高二、高三共2 023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 023名学生中剔除23名,再从剩下的2 000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
【答案】A
【详解】根据简单随机抽样及分层随机抽样的定义可得,每个个体被抽到的概率都相等,所以每个个体被抽到的概率都等于
故选:A.
【例6.2.】 我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡四百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有400人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200 B.100 C.120 D.140
【答案】C
【详解】设北面共有人,则由题意可得
,解得
所以北面共有120人,
故选:C
【例6.3.】 某工厂生产A,B,C三种不同型号的产品,它们的产量之比为2∶3∶5,用分层抽样的方法抽取一个容量为n的样本.若样本中A型号的产品有30件,则样本容量n为( )
A.150 B.180 C.200 D.250
【答案】A
【详解】由题意样本容量为.
故选:A.
【例6.4.】 某学校高二年级选择“史政地”,“史政生”和“史地生”组合的同学人数分别为210,90和60.现采用分层抽样的方法选出12位同学进行项调查研究,则“史政生”组合中选出的同学人数为( )
A.7 B.6 C.3 D.2
【答案】C
【详解】由条件可知,选出“史政生”组合中选出的同学人数为人.
故选:C.
【例6.5.】
在某学校的期中考试中,高一、高二、高三年级的参考人数分别为.现用分层抽样的方法从三个年级中抽取样本,经计算得高一、高二、高三年级数学成绩的样本平均数分别为,则全校学生数学成绩的总样本平均数为( )
A.92 B.91 C.90 D.89
【答案】C
【详解】由题意,总样本平均数为.
故选:C.
【例6.6.】
某企业两个分厂生产同一种电子产品,产量之比为,现采用分层随机抽样方法,从两个分厂生产的该产品中共抽取100件做使用寿命的测试,由所得样品的测试结果计算出该产品的平均使用寿命分别为1000小时,1020小时,估计这个企业所生产的该产品的平均使用寿命为( )
A.1012小时 B.1010小时 C.1008小时 D.1006小时
【答案】C
【详解】由题意可知该产品的平均寿命为.
故选:C
【例6.7.】
某课题进行研究,分别从A,B,C三所高校中用分层随机抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中)
(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
【答案】(1),(2)180.
【详解】(1),A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,
∴高校B中抽取2名教授,高校A中抽取1名教授,高校C中抽取3名教授,
∴,解得,.
(2)∵高校B中抽取的教授数是高校A和C中抽取的教授总数的,
,解得,
∴三所高校的教授的总人数为.
题型7:分层随机抽样的方案设计
【例7.1.】 某家电视台在互联网上征集某电视节目现场参与的观众,报名的总人数为12000人,分别来自4个城区,其中东城区2400人,西城区4600人,南城区3800人,北城区1200人,从中抽取60人参加现场节目,采用分层随机抽样的方式抽取参加现场节目的观众.
①确定抽样比,样本容量,总体容量,抽样比为.
②分层,按城区分为四层:东城区、西城区、南城区、北城区.
③按比例确定每层抽取的个体数,在东城区抽取(人),在西城区抽取(人),在南城区抽取(人),在北城区抽取(人).
④在各层分别用简单随机抽样法抽取样本,将各城区抽取的观众合在一起组成样本.
正确的抽取步骤是 .
【答案】②①③④
【详解】按照分层随机抽样的步骤分层、求比、定数、抽样可得正确的步骤为②①③④.
故答案为:②①③④
【例7.2.】 某家电视台在因特网上征集某电视节目现场参与的观众,报名的总人数为12000人,分别来自4个城区,其中A区2400人,B区4600人,C区3800人,D区1200人,从中抽取60人参加现场的节目,应当如何抽取?写出抽取过程.
【详解】解:采用分层抽样的方式抽取参加现场节目的观众,步骤如下:
第一步:分层.按城区分为四层:A区、B区、C区、D区.
第二步:确定每个个体被抽到的概率.样本容量,总体容量,故每个个体被抽到的概率为.
第三步:按比例确定每层抽取的个体数.
在A区抽取(人),在B区抽取(人),
在C区抽取(人),在D区抽取(人).
第四步:在各层分别用简单随机抽样法抽取样本,将各区抽取的观众合在一起组成样本.
【例7.3.】 为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
【详解】(1)根据题意可知,方式1采用的是简单随机抽样法,方式2采用的是分层抽样法;
(2)方式1抽样的步骤如下:
在全年级10个班中用抽签法任意抽取一个班级,考察他们的成绩;
方式2抽样的步骤如下:
第一步:分层
把该校高三年级的学生按成绩分成优秀、良好、普通三个级别;
第二步:确定各个层抽取的人数
由于样本容量与总体个数比值为,
所以每层抽取的个体数依次为人,人,人;
第三步:按层分别抽取样本人数
在优秀学生中用简单随机抽样法抽取6人,
在良好学生中用简单随机抽样法抽取18人,
在普通学生中用简单随机抽样法抽取16人.
知识点四:获取数据的途径
统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,是统计学研究的重要内容.
(1) 通过调查获取数据
适用范围:对于有限总体问题,一般通过抽样调查或普查的方法获取数据.
注意事项:充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误.
(2) 通过试验获取数据
适用范围:没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据.
注意事项:严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.
(3) 通过观察获取数据
适用范围:自然现象.
注意事项:需要专业测量设备获取观测数据.
(4) 通过查询获得数据
适用范围:二手数据.
注意事项:数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真.
题型8:获取数据的途经
【例8.1.】 下列说法不正确的是( )
A.通过调查获取数据时,无论采用什么抽样方法,关键是要有效避免抽样过程中的人为错误.
B.通过试验获取数据时需要严格控制好试验环境.
C. 通过观察获取数据时,由于自然现象会随着时间的变化而变化,一般不能用抽样的方法获取数据.
D. 通过查询获取数据时,可以直接采用“拿来主义”即可.
【答案】D
【详解】由四种获取数据的方式及其特点知A,B,C正确,D不正确.
故选:D.
【例8.2.】 下列说法不正确的是( )
A.数据有直接获取和间接获取两种来源.
B.获取数据应注意数据来源的广泛性、代表性、均衡性.
C. 引用间接数据时要注明数据来源,尊重他人劳动成果,保护他人知识产权.
D. 引用间接数据时,不需要了解或正确理解其含义,直接引用即可.
【答案】D
【详解】由直接获取与间接获取数据的概念可知D不正确,引用间接数据时必须了解并正确理解其含义,防止误用、错用他人数据.
故选:D.
【例8.3.】 “中国天眼”为500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
【答案】C
【详解】“中国天眼”主要是通过观察获取数据.
故选:C.
【例8.4.】 下列数据一般需要通过实验获取的是( )
A.某子弹的射程 B.某学校的男女生比例
C.华为手机的市场占有率 D.期中考试的班级数学成绩
【答案】A
【详解】选项A:某子弹的射程没有现存数据可以查询,因而需要通过实验获取;
选项B:某学校的男女生比例可以通过查询获取,不需要通过实验获取;
选项C:华为手机的市场占有率可以通过调查获取,不需要通过实验获取;
选项D:期中考试的班级数学成绩可以通过查询获取,不需要通过实验获取;
故选:A
【例8.5.】 为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
【答案】D
【详解】因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.
故选:D
【例8.6.】 若要研究某城市家庭的收入情况,获取数据的途径应该是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
【答案】A
【详解】因为要研究的是某城市家庭的收入情况,所以通过调查获取数据.
故选:A
(
1
)
学科网(北京)股份有限公司
$$