内容正文:
5.1 统计
5.1.1 数据的收集
知识层面
1.了解数据收集的主要方式. 2.理解并掌握简单随机抽样的定义、特点和适用范围,并能用简单随机抽样方法抽取样本. 3.理解并掌握分层抽样,会用分层抽样从总体中抽取样本和解决简单的实际问题.
素养层面
通过简单随机抽样、分层抽样概念的学习,提升数学抽象素养;借助两种简单随机抽样、分层抽样步骤的设计,提升数学建模、数学运算素养.
问题1.(1)国家为了了解青少年身体发育和身体素质状况,对在校学生进行体质健康测试,其中一个项目是测量学生的身高.
(2)从已经生产出来的10万个灯泡中抽取一部分,以此了解这10万个灯泡的寿命(使用时间).
在(1)(2)中,总体分别是什么?
提示:(1)中,总体是:全国学生的身高;(2)中,总体是:10万个灯泡的寿命.
问题2.一天,爸爸让儿子去买糖.出门前,爸爸嘱咐儿子要买甜的,儿子买回来后兴奋地告诉爸爸,“糖都很甜,我每颗都尝过啦”;儿子采用的是什么调查方式呢?这种调查方式好不好?适宜采用什么方法调查?
提示:普查;不好;适宜采用抽样调查.
知识点一 总体与样本
1.相关概念
我们在初中已经接触过总体与样本,知道
(1)总体:所考察问题涉及的对象全体;
(2)个体:总体中每个对象;
(3)样本:抽取的部分对象组成总体的一个样本;
(4)样本容量:一个样本中包含的个体数目.
2.普查和抽样调查
(1)普查:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查).普查能够了解总体中每个个体的情况,从而能准确地掌握总体的特征.因此,在总体包含的个体总数不大,或有特殊需要的情况下,可以采用普查的方法.
(2)抽样调查:只抽取样本进行考察的方法称为抽样调查.
知识点二 简单随机抽样
1.概念
一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.
学生用书第46页
2.抽签法
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个不透明的容器中,搅拌均匀后,每次从中抽取一个号签,连续不放回地抽取n次,就得到一个容量为n(n≤N)的样本.
[微提醒] (1)对个体编号时,也可以利用已有的编号.例如,从全班学生中抽取样本时,可以利用学生的学号、座位号等.
(2)制作号签时,所使用的工具(如纸条、小球等)的形状、大小、材质等要完全一样,以确保每个号签被抽到的可能性相等.
(3)在抽签法中,“搅拌均匀”的目的是让每个号签被抽到的机会相等.
3.随机数表法
随机抽样中,另一个经常被采用的方法是随机数表法.
知识点三 分层抽样
1.分层抽样的概念
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
[微提醒] 分层抽样的必要性
通过分层抽样所得到的样本,一般更具有代表性,可以更准确地反映总体的特征,尤其是在层内个体相对同质而层间差异较大时更是如此.分层抽样在各层中抽样时,还可根据各层的特点灵活地选用不同的随机抽样方法.
2.分层抽样的特点
(1)适用于由差异明显的几部分(即层)组成的总体;
(2)分成的各层互不重叠;
(3)各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
(4)分层抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
1.下列说法不正确的是( )
A.普查是要对所有的对象进行调查
B.样本不一定是从总体中抽取的,没抽取的个体也是样本
C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很多时,则要耗费大量的人力、物力和财力
D.普查不是在任何情况下都能实现的
答案:B
解析:样本必须是从总体中抽取的,没抽取的个体不是样本,故B中说法不正确,其他选项中的说法都正确.故选B.
2.(多选)为了了解参加运动会的2 000名运动员的年龄情况,利用简单随机抽样的方法从中抽取了20名运动员的年龄进行统计分析,就这个问题,下列说法中正确的有( )
A.2 000名运动员是总体
B.所抽取的20名运动员是一个样本
C.样本容量为20
D.每个运动员被抽到的机会相等
答案:CD
解析:对于A,2 000名运动员的年龄是总体,故A错误;对于B,所抽取的20名运动员的年龄是一个样本,故B错误;对于C,从2 000名运动员的年龄中,抽取了20名运动员的年龄进行统计分析,样本容量为20,故C正确;对于D,每个运动员被抽到的机会相等,故D正确.故选CD.
3.抽签法中确保样本具有代表性的关键是( )
A.抽签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
答案:B
解析:只有搅拌均匀,才能保证每个个体被抽到的可能性相等.
4.(多选)已知总体的个数为111,若用随机数表法抽取一个容量为12的样本,则下列对总体的编号正确的是( )
A.1,2,…,111 B.0,1,…,111
C.000,001,…,110 D.001,002,…,111
答案:CD
解析:在使用随机数表法抽取样本时,必须保证编号的位数一致,同时要规范编号,不能多也不能少,结合所给选项,C、D符合要求.
5.一个田径队有男运动员20人,女运动员10人,比赛后立刻用分层抽样的方法,从全体队员中抽出一个容量为6的样本进行兴奋剂检查,其中男运动员应抽________人.
答案:4
解析:每个个体被抽到的概率都等于,20×=4.故男运动员应抽4人.
学生用书第47页
题型一 抽签法的应用
例1 某班从50名学生中选1人作为校运动会的志愿者为师生服务,采用下面两种选法:
选法一 将这50名学生按1~50进行编号,相应地制作50个号签,把这50个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生入选;
选法二 将除颜色外完全相同的49个白球与1个红球放在一个暗箱中搅匀,让50名学生逐一从中摸取1球,摸到红球的学生成为志愿者.
试问:(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法每名学生被选中的可能性是否相等?
解:(1)选法一满足抽签法的特征,是抽签法.
选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的49个白球无法相互区分.
(2)这两种选法中每名学生被选中的可能性相等,均为.
对点练1.某校高一共有10个班,编号为1~10,现用抽签法从中抽取3个班进行调查,每次不放回地抽取一个号码,共抽取3次.设高一(5)班第一次被抽到的可能性为a,第二次被抽到的可能性为b,则( )
A.a=,b= B.a=,b=
C.a=,b= D.a=,b=
答案:D
解析:由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,故高一(5)班在每次抽取中被抽到的可能性都是.
题型二 随机数表法的应用
例2 有一批机器,编号为1,2,3,…,112.请用随机数表法抽取5台作为样本,写出抽样过程.(随机数表见教材第60页)
[思路点拨] 由于总体容量较大,故应选用随机数表法,先把编号调整成三位数,然后按步骤进行即可.
解:第一步,将原来的编号调整为001,002,003,…,112.
第二步,在随机数表中任选一个数字作为开始,任选一个方向作为读数方向.比如,选第2行第24个数“0”作为开始,向右读.
第三步,从“0”开始,向右读,每次读取三位数字,凡不在001~112中的数跳过去不取,前面已经取过的数也跳过去不取,依次可得到056,057,006,063,111.
第四步,对应原来编号6,56,57,63,111的机器便是要抽取的对象.
应用随机数表法的三个关键点
利用随机数表法抽取个体时,关键有三点:
(1)编号位数一致;
(2)确定以表中的哪个数(哪行哪列)作为起点,以哪个方向作为读数的方向,读数的方法;
(3)读数时注意结合编号特点进行读取,如编号为两位,则每次读取两位数字;编号为三位,则每次读取三位数字.
对点练2.某单位欲从45名职工中随机抽取10名职工参加一项社区服务活动,试用随机数表法确定这10名职工.请写出抽样过程.现将随机数表部分摘录如下:
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20
96 43 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21
76 33 50 25 63 01 63 78 59 16 95 55 67 19 98 10 50 71
75 12 86 73 58 07
解:先将这45名职工依次编号为01,02,03,…,44,45.
选择一个位置进行读数,比如从所给数表第一行第一列的数字开始向右读,
首先取16,然后是22;77,94大于45,继续读数得到39;49,54大于45;继续可以得到43,然后同样跳过大于45及与前面重复的数字可以得到17,37,23,35,20,42
最后确定编号为16,17,20,22,23,35,37,39,42,43的职工是参加社区服务活动的人选.
学生用书第48页
题型三 分层抽样中的相关运算
例3 (1)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取__________件.
(2)某工厂有A,B,C三个车间,A车间有600人,B车间有500人.若通过比例分配的分层随机抽样方法得到一个样本量为30的样本,其中B车间10人,则样本中C车间的人数为____.
答案:(1)18 (2)8
解析:(1)产品总数为200+400+300+100=1 000件,而抽取60件进行检验,抽样比例为=,则应从丙种型号的产品中抽取300×=18件.
(2)因为B车间有500人,样本中B车间10人,所以抽样比为=,因此A车间抽取的人数为600×=12,所以样本中C车间的人数为30-10-12=8.
对点练3.某校学生高一年级有400人,高二年级有300人,高三年级有200人,现用分层抽样的方法从所有学生中抽取一个容量为n的样本.已知从高三学生中抽取的人数为10,那么n=________.
答案:45
解析:根据分层抽样定义可以得到10=n×,解得n=45.
题型四 分层抽样的方案设计
例4 一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病率情况差异明显,因而采用分层随机抽样的方法,具体过程如下:
(1)将3万人分成5层,其中一个乡镇为一层.
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本,分别为60人,40人,100人,40人,60人.
(3)将300人组到一起,即得到一个样本.
对点练4.一个单位有职工160人,其中业务员120人,管理人员16人,后勤服务人员24人.为了了解职工的某种情况,要从中抽取一个容量为20的样本,用分层抽样的方法写出抽取样本的过程.
解:因为样本容量与职工总人数的比为20∶160=1∶8,
所以业务员、管理人员、后勤服务人员抽取的人数分别为=15,=2,=3,即分别抽取15人,2人和3人.
每一层抽取时,可以采用简单随机抽样,再将各层抽取的个体合在一起,就是要抽取的样本.
1.为了了解某校全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( )
A.总体是240 B.个体是每一名学生
C.样本是40名学生 D.样本容量是40
答案:D
解析:总体是240名学生的身高,所以A不正确;个体是每一名学生的身高,所以B不正确;样本是40名学生的身高,所以C不正确;很明显样本容量是40.故选D.
2.(多选)下面的四个问题中,不宜用抽样调查方法的是( )
A.检验10件产品的质量
B.银行对公司10万元存款现钞的真假检验
C.跳伞运动员检查20个伞包及伞的质量
D.检验一批汽车的防碰撞性能
答案:ABC
解析:根据抽样调查与普查的概念知A、B、C一般采用普查的方法,只有D宜用抽样调查的方法.
3.某学院A、B、C三个专业共有1 200名学生,其中A专业有380名学生,B专业有420名学生,C专业有400名学生,为调查这些学生勤工俭学的情况,要从中抽取一个容量为120的样本,记为①;某中学高二
学生用书第49页
年级有12名足球运动员,要从中选出3人调查学习负担情况,记作②;则完成上述2项应分别采用的抽样方法是( )
A.①用简单随机抽样,②用分层抽样
B.①用分层抽样,②用简单随机抽样
C.①用简单随机抽样,②用简单随机抽样
D.①用分层抽样,②用分层抽样
答案:B
解析:对于①,总体由差异明显的三部分组成,应采用分层抽样.对于②,总体中的个体数较少,而且所调查内容对12名调查对象是平等的,应采用简单随机抽样.故选B.
4.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为________.
答案:360
解析:因为高一年级抽取学生的比例为=,所以=,解得k=2,故高三年级抽取的人数为1 200×=360.
学科网(北京)股份有限公司
$$